设置集群的高可靠性

集群的高可靠性(High Availability,简称HA)依赖于共享存储和动态迁移技术,为集群中所有虚拟机上运行的应用程序提供简单易用、经济高效的高可用性,最大程度减少因硬件故障造成的服务器宕机和服务中断时间。集群的高可靠性适用于业务运行连续性要求较高的场合。

高可靠性原理概述

CVM将一组服务器主机合并为一个具有共享资源池的集群。开启集群HA功能之后,CVM会持续监测集群内所有的服务器主机与虚拟机运行状况。

高可靠性的技术特点

注意事项

操作步骤

  1. 在顶部导航栏单击[资源]菜单项,在左侧导航栏单击[虚拟化]菜单项,进入虚拟化管理页面。

  1. 单击内置CVM管理平台“cloudos”左侧的“展开”图标,展开集群列表。

  1. 单击待设置高可靠性的集群名称,进入集群管理页面。

  1. 单击<高可靠性>按钮,弹出修改集群高可靠性对话框。

  1. 根据需要启用集群的HA。如果启用集群的HA,则需要为集群中的虚拟机选择缺省的启动优先级。

  1. 根据需要开启业务网HAHA接入控制。如果开启HA接入控制,则需要输入生效最小节点数、选择故障切换主机或设置HA资源预留百分比。

  1. 单击<确定>按钮。

参数说明

参数

说明

启用优先级

用于设置集群中虚拟机的缺省启动优先级,包括低级、中级和高级,默认为中级。虚拟机的启动优先级在增加虚拟机或修改虚拟机的过程中设置。主机故障后,虚拟机启动的相对优先顺序。这些虚拟机在新主机上按顺序重新启动,首先启动优先级最高的虚拟机,然后是中级优先级的虚拟机,最后是低级优先级的虚拟机,直到重新启动所有虚拟机或者没有更多的可用集群资源为止。

业务HA

当虚拟机对应的业务网出现故障或者连接不通时,虚拟机可以迁移到其他主机上,恢复虚拟机业务。对于未绑定物理网卡、使用管理网或使用VXLAN转发模式的虚拟交换机将不支持HA故障检测。

开启HA接入控制

是否启用HA接入控制。若开启HA接入控制,则需要配置生效最小节点数、故障切换主机或HA资源预留。

HA接入控制设置

生效最小节点数

用于设置集群中高可靠性正常运行所需的最小主机数。如果集群内正常运行的主机数量小于该参数时,HA将会失效。生效最小节点数默认为1。配置此参数时,请确保集群内所有主机的CPU个数和内存大小保持一致,否则有可能会因为资源容量计算不准确而导致虚拟机无法进行故障迁移。

故障切换主机

当集群HA内出现故障虚拟机需要自动迁移时,优先从指定的主机组内选择迁移目的主机,指定的主机仅用于故障迁移,不能作为增加、迁移虚拟机的目的主机。故障切换主机必须挂载与业务主机相同的共享存储。

HA资源预留

为集群的HA保留一定的CPU和内存资源。当集群剩余资源所占比例小于预留值时,则不能继续启动集群内虚拟机,将虚拟机还原到运行/暂停状态,或将运行状态虚拟机迁入集群。

触发动作

集群开启HA后,共享存储故障时,系统对受影响的虚拟机进行故障迁移或冻结,默认为故障迁移。当系统参数设置页面中的“共享存储故障隔离”参数设置为“不重启主机”且HA状态由关闭到开启时,此参数才允许修改。

  • 故障迁移:当共享存储故障时,全部数据存放在共享存储的虚拟机将被迁移到集群中的其他主机上。

  • 虚拟机冻结:当共享存储故障时,部分或全部数据存放在共享存储的虚拟机将被冻结,并显示为暂停。待共享存储恢复正常后,被冻结的虚拟机将自动恢复为运行状态。