基于磁盘备份的容灾,是基于CDP操作系统数据复制技术实现容灾。通过安装在保护站点主机中的Agent服务来获取源端主机的信息,捕获数据块的变化,并将增量数据传输给存储节点,备份到H3C UIS超融合管理平台容灾端的存储中。
基于多级快照链机制和实时同步机制,支持秒级数据同步,满足高性能RPO数据恢复需求。支持对异构平台(异构虚拟化、云平台、裸金属服务器等)的容灾,可以同时对多个异构平台的业务在一个灾备站点进行容灾。
适用场景:基于磁盘备份的容灾适合混合架构、异构云、同构云、裸金属、虚拟机容灾。还可用于生产机的关键业务的容灾。
同构场景:指保护站点与恢复站点是相同版本的UIS超融合管理平台,要保护的生产机为UIS上的虚拟机。
异构场景:指保护对象为其他异构云平台的虚拟机、UIS超融合管理平台低版本平台的虚拟机,或裸金属服务器,恢复站点为本UIS超融合管理平台。
混合架构:指保护保护对象既有虚拟机又有裸金属服务器,恢复站点为UIS超融合管理平台。
灾备等级:
RPO = 分钟级
RTO = 分钟级
存储:无限制;
保护站点:支持X86架构云平台,或物理机;
恢复站点:UIS Manager 0719及以上版本,需要UIS标准版增强包License以及磁盘备份容灾License(即:UIS数腾CDP应急容灾V6.0融合版本的相关授权);
操作系统: Windows Server版,Linux系统,具体参见附录:UIS超融合管理平台磁盘备份容灾客户端兼容性列表。
将安装了容灾客户端的虚拟机(VM)或裸金属服务器(BM)作为保护对象,以操作系统为单位,将本地UIS站点作为恢复站点,基于容灾客户端软件的磁盘实时复制功能,将生产机的数据复制到恢复站点UIS超融合管理平台,并在恢复站点的存储节点上创建虚拟机,来运行业务,实现业务的灾备。
图-1 磁盘备份容灾实现机制
基于磁盘备份的容灾配置,分为配置准备、配置容灾任务、容灾切换功能三大步骤。在配置容灾任务时,选择磁盘备份容灾保护组。
磁盘备份容灾配置流程如下图-2所示。
为管理平台中的主机安装CDP功能组件。
在保护站点,为受保护的虚拟机或裸金属服务器安装客户端,以便获取保护站点数据变化并备份到恢复站点。
站点包括本地站点和远端站点。站点的配置可以在保护端或恢复站点,任意一端配置。对于磁盘备份容灾的异构场景,无需增加远端站点。
保护组是一组需要受保护的虚拟机或裸金属服务器的集合。磁盘备份类型的保护组创建好后,系统自动进行一次虚拟机配置同步。对于同构场景,还可以在容灾切换前进行手动同步。
将安装了容灾客户端的虚拟机或生产机加入到一个保护组,通过制定合适的容灾策略,对虚拟机/生产机的数据自动进行持续同步,达到对虚拟机/生产机的保护目的。根据所保护的虚拟机/生产机的业务运行方式,分为普通业务、双机业务和集群业务。普通业务里的虚拟机/生产机单独运行,互不制约;双机和集群业务里的虚拟机/生产机需要有共享存储存放需要共同访问的数据。磁盘备份保护组支持同构及异构平台的容灾任务。
同构场景:指保护站点与恢复站点是相同版本的UIS超融合管理平台,要保护的生产机为UIS上的虚拟机。同构场景下,创建保护组时,需指定保护站点与恢复站点,以保护站点内安装了容灾客户端的虚拟机作为备选的保护对象,选择合适的容灾策略后,配置站点间网络资源映射关系。
异构场景:指保护对象为其他异构云平台的虚拟机、UIS超融合管理平台低版本平台的虚拟机,或裸金属服务器,恢复站点为本UIS超融合管理平台。异构场景下,创建保护组时,不配置保护站点,以安装了容灾客户端的虚拟机或生产机作为备选的保护对象,以本地站点为恢复站点,选择合适的容灾策略后,再配置恢复站点的生产机网络资源。
恢复计划就是针对不同保护组而设置的不同恢复策略,恢复计划执行后,在恢复站点,根据恢复策略,自动创建容灾机,接替保护站点业务。
容灾演练由开始演练和结束演练两个阶段组成。演练过程主要检查恢复计划实施的有效性,为提高灾难恢复能力进行预演,因此演练需要模拟保护站点故障发生后,在恢复站点能够恢复业务的全流程。演练测试过程不会影响生产业务。当演练过程完毕后,通过结束演练来完成测试后的环境清理工作,结束演练成功后,恢复计划的状态会成为就绪状态。
磁盘备份容灾演练测试通过挂载恢复站点存储卷的快照,并将其作为恢复站点的数据存储来实现。
图-3 磁盘备份容灾演练
计划恢复一般是在对保护站点进行维护的情况下,人为地将保护站点的虚拟机业务停止后,根据恢复计划将这些虚拟机业务在恢复站点恢复起来。
启动计划恢复后,保护站点的虚拟机将被关闭(异构场景下不会自动关闭,如需关闭,需人为操作)。计划恢复会触发一次数据的复制,当受保护的数据完全复制到恢复站点后,再依次恢复虚拟机业务。
图-4 计划恢复
故障恢复用于真实场景中保护站点发生故障,虚拟机业务不能工作的情况下,根据恢复计划在恢复站点恢复虚拟机业务。在这种情况下,受保护虚拟机是由于发生故障而异常中断的。
对于磁盘备份容灾,恢复站点存储的数据为前一个复制周期完成后的数据,因此在恢复站点恢复业务时,RPO不为0。
图-5 故障恢复
反向恢复是在保护站点发生故障时将虚拟机业务切换到恢复站点后,待故障的保护站点恢复正常工作的情况下,将运行在恢复站点的受保护虚拟机又恢复到保护站点。对于磁盘备份容灾,需在生产环境运行PE反向恢复工具将容灾数据恢复到生产环境,具体操作参见反向恢复。
图-6 反向恢复
针对磁盘备份容灾,当执行过计划恢复或故障恢复后,可通过在生产环境运行PE反向恢复工具将容灾数据恢复到生产环境,恢复后执行清理备份数据,在恢复站点删除容灾机及临时数据。