双机热备配置指导

实际生产环境中服务器故障是不可避免的。服务器故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。通常服务器产生故障正常的恢复的时间可能需要几分钟,甚至几小时。而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。

双机热备使用两台服务器部署管理平台,同时两台服务器互相备份,共同提供服务。当一台服务器出现故障时,可由另一台服务器承担服务,从而在不需要人工干预的情况下,自动保证管理平台能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时管理平台中断的问题。

管理平台可以通过双机热备技术来实现管理平台的高可靠性,与管理平台配置备份相比,双机热备是一种实时的高可靠性方案。

  • 通过分析系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即业务能否容忍中断,可容忍多长的时间恢复,或者业务不能恢复会造成多大的影响。

  • 双机热备会有一个短暂的切换过程。在切换过程中,管理平台服务有可能出现短暂的时间中断。当切换完成后,服务将正常恢复。

 

原理介绍

双机热备功能是基于数据同步复制的方式来实现的。主备服务器之间数据的同步采用DRBDDistributed Replicated Block Device,分布式镜像块设备内容的存储复制)存储复制解决方案来实现,当主服务器数据发生变化时,该数据变化会实时同步到备用服务器,这样就保证了主备服务器之间数据的一致性。

双机热备优化后,新双机热备的主备切换是通过CMSDCVM Master Slave Daemon热备服务管理程序)来实现的。

CMSD主程序完成以下功能:

·          E0523及之后版本的双机热备为新双机热备。

·          E0523之前版本的双机热备为老双机热备。

 

组网

新双机热备系统由三个实体组成:主节点、备节点和仲裁节点。

双机热备的组网拓扑图如下所示。

图-1 组网拓扑图

 

node1node2是构成双机热备的两台CVM主机。

注意事项

缩略语

缩略语Abbreviations

中文解释Chinese explanation

英文全名Full spelling

CVM

虚拟化管理系统

Cloud Virtualization Manager

CVK

虚拟化内核平台

Cloud Virtualization Kernel

DRBD

分布式镜像块设备内容的存储复制解决方案

Distributed Replicated Block Device

CMSD

热备服务管理程序

CVM Master Slave Daemon