国家 / 地区

H3C UIS 6.5超融合产品容灾操作指导-5W100

手册下载

H3C UIS超融合管理平台

站点容灾操作指导

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:5W100-20200309

Copyright © 2020新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。



1 容灾简介

随着信息时代的发展,无论是企业,还是学校、医院等单位,越来越多的关键业务系统上线,对信息系统的依赖程度越来越高。这种情况下,对业务的可靠性保障,就变得非常重要。为了在自然灾害或其他意外,如大规模断电、出口故障等机房级故障发生时,保证业务数据的完整性,及业务的连续性,就需要搭建容灾系统,来对整个站点进行容灾保障。

容灾,又称灾难恢复(Disaster Recovery),指将信息系统从灾难(火灾、洪水、地震、或人为破坏等)造成的故障或瘫痪状态,恢复到可正常运行的状态,并将其支撑的业务功能,从不正常状态,恢复到可接受状态。

容灾系统(Disaster Recovery System)的建设,一般在相隔较远的异地,建立两套或多套功能相同的业务系统,这些系统间,可进行状态监控及业务切换,当一处系统因人为或自然原因,造成严重故障或瘫痪,支持的业务功能不能正常运行时,整个业务系统可以切换到另一处,使得业务功能可以继续正常工作。

1.1  容灾系统关键性能指标

容灾系统的建设目标,是保证灾难发生时,业务不中断,数据不丢失。针对这两个目标,衡量容灾系统的关键指标有RPORTO两种。

·            RPO

RPORecovery Point Objective 恢复点目标),又称为业务系统所能容忍的最大数据丢失量目标,是指当灾难发生后,用户要求把数据恢复到灾难发生前的某个时间点。RPO是衡量企业在灾难发生后会丢失多少数据的指标,衡量容灾系统的数据冗余备份能力。RPO一般由采用的数据复制方式决定。同步复制方式可以做到RPO0,异步复制方式的RPO取决于复制的周期。

图1-1 RPO

 

·            RTO

RTORecovery Time Objective 恢复时间目标),又称为用户能容忍的恢复时间目标,是指信息系统从灾难状态,恢复到可运行状态所需的时间,用来衡量容灾系统的业务恢复能力。RTO水平一般由容灾业务恢复流程决定,自动化程度越高,RTO越小。

图1-2 RTO

 

1.2  容灾系统的分类

根据对系统的保护程度,可以将容灾系统分为三级:数据级、应用级、业务级。

·            数据级容灾:通过建立异地容灾中心,做数据的远程备份。在灾难发生之后,确保原有的数据不会丢失或遭到破坏。在数据级容灾方式下,所建立的异地容灾中心可以简单地理解为一个远程的数据备份中心。

·            应用级容灾:在数据级容灾基础上,在备份站点同样构建一套相同的应用系统,这样可以保证关键应用在允许的时间范围内恢复运行,尽可能减少灾难带来的损失,让用户基本感受不到灾难的发生,这样就使系统所提供的服务是完整的、可靠的和安全的。

·            业务级容灾:是全业务的灾备,除了必要的IT相关技术,还要求具备全部的基础设施。其大部分内容是非IT系统(如电话、办公地点等),当大灾难发生后,原有的办公场所都会受到破坏,除了数据和应用的恢复,更需要一个备份的工作场所能够正常的开展业务。

图1-3 容灾系统分类

 

1.3  存储远程复制技术

对数据的保护是容灾的基础,一般通过备份来保护数据。备份指为防止系统操作失误或故障导致的数据丢失,而将全部或部分数据集合,从应用主机的硬盘或阵列,复制到其他存储介质的过程。存储阵列的复制技术一般分为同步复制和异步复制两种。

1. 同步复制

同步复制能够保证具有复制关系的数据卷之间数据的一致性。同步复制的原理是,每个I/O写操作,都会等具有复制关系的主卷和远程卷都返回写完成才释放。因此同步复制方式有最高级别的数据完整性,但是性能会因为在阵列之间传送数据延迟而降低,而且同步复制方式复制阵列之间的距离要满足RTTRound-Trip Time往返时延)的要求。

同步复制一般应用于较短距离间(10KM~100KM同城),且对数据一致性要求极高,对数据丢失几乎不可容忍的场景,如银行系统等。

图1-4 同步远程复制

 

2. 异步复制

异步复制方式一般都是周期性进行的,不能保证具有复制关系的数据卷之间的数据一致。异步复制的原理是本地主卷完成写操作后,给此数据卷创建一个快照,然后将快照复制到远程卷。异步复制方法提供了比较高的应用性能,但如果灾难发生,在远程卷上还未更新的数据就会有丢失风险,即时间窗口。

异步复制对带宽和距离要求相对较低,适用于业务系统性能要求较高,写压力小,对阵列IOPS和时延要求不是太高,如数据库、文件系统等场景。

图1-5 异步远程复制

 

2 UIS站点容灾介绍

UIS超融合站点容灾功能,基于存储阵列的远程复制技术,提供应用级的容灾服务。下面将从适用的场景、实现机制等方面、配置流程等方面,介绍UIS超融合容灾特性。

2.1  适用场景

·            适用于同构云(H3C UIS(版本一致),数据中心级的容灾。

·            RPO:分钟级

·            RTO:分钟级

·            根据存储阵列类型可以支持如下两种场景:

¡  容灾站点的存储阵列支持SRAStorage Replication Adapter,存储复制适配器)接口的场景。

¡  容灾站点的存储阵列不支持SRAStorage Replication Adapter,存储复制适配器)接口的场景。

说明

SRA是存储系统中与SRM通信的桥梁。它为SRM提供的功能包括存储系统发现、复制LUN卷、故障切换演练、灾难恢复等。当SRM进行计划演练、计划恢复、故障恢复时,SRA可以为SRM提供相应资源,配合SRM自动完成虚拟化环境自动化容灾流程。

 

2.2  软硬件要求

·            UIS版本:企业增强版,需包含SRM组件License

·            HP存储阵列:需支持远端复制功能。

·            存储自动化支持:ONEStor分布式存储,宏杉存储。

2.3  实现机制

UIS的站点容灾系统,大体上可以分为两大块:存储层针对数据一致性容灾目标的配置,以及业务层针对业务连续性容灾目标的配置。

·            在存储阵列层,通过配置存储的异步远程复制,完成对业务数据的备份。

·            在业务层,通过配置保护组,将生产站点受保护的虚拟机配置同步到灾备站点。

·            制定恢复策略,当灾难发生时,利用存储层备份的存储数据及业务层同步的配置数据,在灾备站点创建并拉起容灾虚拟机,将业务切换到灾备站点。

存储阵列分为支持SRA功能和非支持SRA功能两种,对于支持SRA功能的存储阵列,SRM容灾流程可以做到虚拟机恢复过程的全部自动化,对于不支持SRA功能的存储阵列,SRM流程需要事先通过手工方式准备好存储环境,然后再进行虚拟机恢复过程。 具体差异详见配置过程说明。

说明

存储复制容灾,依赖于存储阵列的复制功能,因此要求保护站点和恢复站点的存储复制技术要一致,且存储阵列上必须有存储复制功能和快照功能的授权。

 

图2-1 存储复制容灾实现机制

 

2.4  功能特色

1. 经济的容灾方案

·            利用分布式存储复制技术,在存储层完成受保护虚拟机数据的复制,达到RPO分钟级、RTO分钟级容灾。支持互为主备的双运营模式,保护投资。

·            不仅支持ONEStor分布式存储,也支持其他存储阵列,只需要保护站点和恢复站点的两台存储之间可以实现数据的复制功能和快照功能即可。对于不支持SRA的存储阵列,在进行故障切换的过程中需要通过手工的辅助工作来完成存储环境的准备。

2. 自动化的容灾

·            生产站点虚拟机配置变化及时同步到灾备站点,无惧业务变更,实现业务同步。配合定期演练,保证容灾系统长期可用。

·            在存储阵列层完成受保护虚拟机数据的复制,减少容灾业务对生产服务器的性能影响。

3. 一站式容灾配置

·            存储配置、容灾任务配置一站式配置。生产站点和灾备站点计算、存储、网络资源直接映射。

·            一站式管理生产站点和灾备站点,在生产站点UIS超融合管理平台进行的容灾配置,会同步到灾备站点管理平台,不需要在多个管理台之间来回切换即可完成配置。

4. 丰富的容灾场景

·            无中断的故障演练测试,不影响生产业务,确保实现可预测的恢复目标,降低故障恢复的RTO

·            站点恢复后,一键反向恢复,将业务恢复到保护站点。

·            一键式计划恢复、故障恢复。

2.5  UIS容灾配置流程

H3C UIS超融合容灾系统的搭建,分为配置存储、配置容灾任务、容灾切换三大部分。

图2-2 存储复制容灾配置流程

 

2.5.1  配置存储容灾

配置存储容灾,指配置生产站点与灾备站点存储块设备(LUN)之间的异步远程复制。其中,两地地址池间的远端设备,用做块设备间数据同步的链路。异步远程复制,用于指定两个站点数据同步的块设备,以及配置数据同步策略。

图2-3 配置存储容灾

 

2.5.2  配置站点容灾

配置容灾任务,即配置站点容灾。

·            站点:首先添加生产站点和灾备站点,并同步块设备间的异步远程复制关系与策略(存储容灾配置)。

·            保护组:将属于同一个存储池(对应存储阵列中的一个或多个LUN)的虚拟机划分到一个保护组中。配置虚拟交换机映射、网络策略模板映射和存储的资源映射关系,虚拟机在恢复站点恢复时,自动进行资源替换。

·            恢复计划:针对保护组指定一个统一的恢复策略。

图2-4 配置站点容灾

 

2.5.3  容灾使用场景

1. 容灾演练

容灾演练由开始演练和结束演练两个阶段组成。演练过程主要检查恢复计划实施的有效性,为提高灾难恢复能力进行预演,因此演练需要模拟保护站点故障发生后,在恢复站点能够恢复业务的全流程。演练测试过程不会影响生产业务。当演练过程完毕后,通过结束演练来完成测试后的环境清理工作,结束演练成功后,恢复计划的状态会成为就绪状态。

演练测试通过挂载恢复站点的LUN,并将其作为恢复站点的数据存储来实现。

图2-5 容灾演练

 

2. 计划恢复

计划恢复一般是在对保护站点进行维护的情况下,人为地将保护站点的虚拟机业务停止后,根据恢复计划将这些虚拟机业务在恢复站点恢复起来。

启动计划恢复后,保护站点的虚拟机将被关闭(异构场景下不会自动关闭,如需关闭,需人为操作)。计划恢复会触发一次数据的复制,当受保护的数据完全复制到恢复站点后,再依次恢复虚拟机业务。

图2-6 计划恢复

 

3. 故障恢复

故障恢复用于真实场景中保护站点发生故障,虚拟机业务不能工作的情况下,根据恢复计划在恢复站点恢复虚拟机业务。在这种情况下,受保护虚拟机是由于发生故障而异常中断的。

图2-7 故障恢复

 

4. 反向恢复

反向恢复是在保护站点发生故障时将虚拟机业务切换到恢复站点后,待故障的保护站点恢复正常工作的情况下,将运行在恢复站点的受保护虚拟机又恢复到保护站点。执行反向恢复功能,数据的反向恢复及虚拟机业务的切换自动完成。

图2-8 反向恢复

 


3 容灾配置举例

3.1  注意事项

·            第一次执行恢复计划前,需保证存储数据执行完一次完整的同步。

·            网络要求:复制节点(主机)的复制网络没有限制,但建议单独规划。

·            块设备要求:

¡  生产站点块设备与灾备站点块设备大小一样。

¡  若使用厚配置类型的硬盘池上的块设备,不支持演练,所以尽量使用精简配置方式的数据池(ONEStor不支持厚配置的快照,演练时基于快照的,所以不支持厚配置的演练)。

¡  对于非SRA存储,需要在从端先将块设备挂载为共享文件系统。如将块挂载给指定的主机,则在恢复计划执行时,可跳过存储同步,直接执行容灾机恢复。

 

3.2  组网与规划

(1)       H3C UIS SRM是一种异地容灾的流程管理,组网中至少存在两个UIS超融合管理平台。

(2)       生产端和灾备端均采用超融合部署,部署虚拟化内核平台和ONEStor分布式存储。

(3)       管理节点融合部署,服务器#1既作为管理节点,又作为业务节点。

(4)       生产端4CVK主机,灾备端2CVK主机,管理网与复制网络单独规划,两端互通。

图3-1 组网

 

3.3  配置存储容灾

将生产站点四台CVK主机加入到本地地址池,灾备站点两台CVK主机加入到远端地址池。在两个地址池间建立远端设备。创建异步远程复制策略,指定两端块设备,及数据同步策略。

图3-2 存储容灾配置图

 

3.3.1  增加地址池

地址池指集群内具有相同复制网络的主机节点的集合,地址池中的主机称为复制节点。

1. 增加本地地址池

(1)       选择顶部“存储”页签,单击左侧导航树[存储容灾]/[链路管理]菜单项,进入链路管理页面。在地址池区域,单击<增加>按钮。

图3-3 增加本地地址池

 

(2)       在增加地址池对话框中输入地址池相关信息,单击<确定>。其中,“复制网络”用于建立链路关系,以便本地生产站点和远端灾备站点的块设备进行数据同步。复制网络为一个网段。

图3-4 本地地址池信息

 

(3)       选择复制节点,容灾时数据复制走复制节点的复制网络,并占用复制节点部分性能,建议尽量不要只选一台,可选多台做冗余用。复制节点的复制网络建议单独规划,不限制虚拟交换机的网络类型。单击<确定>

图3-5 选择复制节点

 

(4)       本地地址池添加增加完成。

图3-6 本地地址池添加完成

 

2. 增加远端地址池

(1)       登录到灾备站点。选择顶部“存储”页签,单击左侧导航树[存储容灾]/[链路管理]菜单项,进入链路管理页面。

(2)       在地址池区域,单击<增加>按钮,输入地址池相关信息,单击<确定>。其中,“复制网络”用于建立链路关系,以便本地生产站点和远端灾备站点的块设备进行数据同步。复制网络为一个网段。

图3-7 远端地址池信息

 

(3)       选择复制节点,容灾时数据复制走复制节点的复制网络,并占用复制节点部分性能,建议尽量不要只选一台,可选多台做冗余用。复制节点的复制网络建议单独规划,不限制虚拟交换机的网络类型。单击<确定>

图3-8 选择复制节点

 

(4)       远端地址池增加完成。

图3-9 远端地址池添加完成

 

3.3.2  增加远端设备

增加远端设备,指建立本地地址池与远端地址池建立链路之间的链路。一组链路集抽象为一个远端设备。

说明

远端设备在本地和远端添加都可以,本例在本地添加。

 

(1)       选择顶部“存储”页签,单击左侧导航树[存储容灾]/[链路管理]菜单项,进入链路管理页面。在远端设备区域,单击<增加>按钮。

图3-10 增加远端设备

 

(2)       填写各项参数,配置远端设备。其中本地地址池选中名称即可,远端地址池则输入地址池ID、端口、共享标签、共享秘钥等信息,单击<确定>

¡  地址池名称:选择本地地址池名称。

¡  远端地址池ID:远端地址池创建时自动分配的ID,可到灾备站点地址池查看。

¡  远端监听端口:远端地址池创建时自动分配的监听端口,可到灾备站点地址池查看。

¡  远端共享标签:远端地址池创建时,配置的共享标签,可到灾备站点地址池查看。

¡  远端共享秘钥:远端地址池创建时,配置的共享秘钥。

¡  本端IP:本地地址池中任意一个复制节点(主机)的复制网络(不限制虚拟交换机的网络类型)。请注意,本端IP仅用于建立远端设备时用。实际的数据同步,还是走的地址池中选择的复制节点。

¡  远端IP:远端地址池中任意一个复制节点(主机)的复制网络(不限制虚拟交换机的网络类型)。请注意,远端IP仅用于建立远端设备时用。实际的数据同步,还是走的地址池中选择的复制节点。

图3-11 配置远端设备参数

 

(3)       远端设备创建完成,即本地址池与远端地址池之间的链路关系建立。

图3-12 远端设备创建完成

 

3.3.3  创建异步远程复制Pair

异步远程复制,指利用创建的远端设备(复制链路集),建立本地块设备和远端块设备的异步远程复制关系(Pair对),同时配置块设备间数据同步策略的过程。异步远程复制创建完成后,即按照同步策略开始同步数据。

(1)       选择顶部“存储”页签,单击左侧导航树[存储容灾]/[异步远程复制]菜单项。单击<增加>按钮,开始创建异步远程复制Pair对。

图3-13 创建异步远程复制Pair

 

(2)       在弹出的对话框中选中一个远端设备,单击<下一步>按钮。

图3-14 选择远端设备

 

(3)       在选择主端块设备页签,依次选择硬盘池和数据池,然后选择一个主端块设备,单击<下一步>

图3-15 选择主端块

 

(4)       在选择从端块设备页签,依次选择硬盘池和数据池,然后选择一个从端块设备,单击<下一步>按钮。

图3-16 选择从端块

 

(5)       设置复制属性,包括数据同步间隔、初始同步方式、速率及同步策略。单击<完成>按钮。

注意

初始同步建议选择自动同步,如果选择初始手动同步或不同步,在做容灾演练前,需要至少手动同步一次,否则演练失败。

 

·            初始同步:异步远程复制Pair对创建后采取的初始同步方式。

¡  自动同步:当主从端数据不一致时,选择此项,表示Pair对创建完成即自动执行初始同步,将主端数据同步到从端。

¡  手动同步:当主从端数据不一致时,选择此项,表示Pair对创建完成后,不立即执行初始同步,通过手动同步方式进行初始同步。

¡  不同步:当主从端数据一致时,选择此项,不执行初始同步。

·            速率:异步远程复制的数据复制速率。

¡  低:复制的速率<= 5M/s

¡  中:复制的速率<=20M

¡  高:复制的速率70<=M/s

¡  最快:不限速,拷贝速度取决于当前集群的网络情况。

·            恢复策略:当异步远程复制Pair对的健康状态为故障时的恢复策略。

¡  自动:故障后系统会周期性地自动同步以尝试恢复故障。

¡  手动:故障后系统不进行自动同步,由用户在异步远程复制管理页面通过单击<更多/同步>按钮进行同步来尝试恢复故障。

·            自动同步策略:主、从块设备初始同步完成后,进行数据自动同步的策略。

¡  同步开始计时:本次同步开始时即开始计时,按照“同步间隔”设置的时间间隔计算,间隔时间到达后自动开始执行下一次同步。

¡  同步完成计时:本次同步完成的同时开始计时,按照“同步间隔”设置的时间间隔计算,间隔时间到达后自动开始执行下一次同步。

¡  指定时间:按照“同步时间”设置的时间进行自动同步,每到达设置的指定时刻即自动进行同步。

¡  手动:不进行自动定时同步,由用户在异步远程复制管理页面通过单击<更多/同步>按钮进行手动同步。

·            同步间隔:当同步类型设置为同步开始计时同步完成计时时可用,表示每到达设置的间隔时间自动进行主、从端块设备的数据同步。

同步时间:当同步类型设置为指定时间时可用,表示每到达设置的指定时刻即自动进行主、从端块设备的数据同步。

图3-17 配置复制属性

 

(6)       单击<完成>按钮,异步远程复制Pair对建立完成,即本集群块设备与远端集群块设备之间的异步远程复制关系创建完成,且数据同步策略配置完成。

图3-18 异步远程复制创建完成

 

3.4  配置站点容灾

3.4.1  添加容灾站点

异地容灾方式中,可以将数据中心称为站点。站点又分为本地站点和远端站点。通常情况下,本地站点是需要被保护的站点,管理生产资源的业务;远端站点是用来恢复业务的目标站点,管理灾备资源。如果发生灾难,本地的业务会恢复到远端站点的资源上。

在配置站点容灾时,需要增加本地站点和远端站点的信息。当本地站点和远端站点的存储阵列都支持SRA时,需要为站点增加对应的存储阵列管理器。当站点和存储阵列管理器增加完成后,需要同步存储设备的复制关系。

说明

站点的配置,可以在保护端或灾备端任意一端配置,两端的配置数据是同步的。

 

1. 添加本地站点

(1)       在保护站点,单击导航树[云业务/站点容灾/站点管理]/<增加站点>按钮,弹出增加站点对话框,添加站点信息。第一个增加的站点缺省为本地站点(即生产端)。IP地址为当前UIS超融合管理平台的IP地址。单击<下一步>

图3-19 增加本地生产站点

 

(2)       单击<增加存储阵列管理器>,选择ONEStor存储,填写ONEStor存储集群的Handy IP地址等信息(存储集群IP地址可以从存储的概要界面查看,双机热备场景下,该地址即管理高可用IP),单击<确定>按钮。

图3-20 增加存储阵列管理器

 

(3)       单击<连通测试>按钮,进行连通性测试,来检查存储的连通性。

(4)       连通测试通过后,单击<确定>按钮,再单击<完成>按钮,本地站点创建完成。

图3-21 本地站点添加完成

 

2. 添加远端站点

(1)       单击导航树[云业务/站点容灾/站点管理]/<增加站点>按钮,弹出增加站点对话框,添加站点信息。第一个本地站点添加后,后续增加的站点类型都缺省为远端站点。单击<下一步>

图3-22 增加远端灾备站点

 

(2)       单击<增加存储阵列管理器>,填写ONEStor存储集群的Handy IP地址等信息(存储集群IP地址可以从存储的概要界面查看,双机热备场景下,该地址即管理高可用IP),单击<确定>按钮。

图3-23 增加存储阵列管理器

 

(3)       单击<连通测试>按钮,进行连通性测试,来检查存储的连通性。

(4)       连通测试通过后,单击<确定>按钮,再单击<完成>按钮,远端站点创建完成。本地和远端站点都添加完成后,容灾站点配置完成。

图3-24 灾备站点增加完成

 

3. 同步复制关系

同步复制关系,指将配置存储容灾时创建的异步远程复制Pair对的信息同步过来,包括块设备之间的异步远程复制关系,以及数据同步策略。

(1)       站点增加完成后,单击存储阵列管理器配置列表右侧的<同步设备复制关系>按钮。

注意

站点和存储阵列管理器增加完成后,必须执行此步骤。

图3-25 同步设备复制关系

 

(2)       同步完成后单击存储阵列对应的图标,可以查看存储复制关系。

图3-26 查看设备复制关系

 

3.4.2  配置容灾保护组

保护组指一组需要受保护虚拟机的集合。配置容灾保护组,指将属于同一个存储池(对应存储阵列中的一个LUN)的虚拟机划分到一个保护组中,以便统一制定保护策略对虚拟机进行保护。

资源映射关系,是用于将保护站点受保护的虚拟机使用的资源,和恢复站点的资源建立对应关系,虚拟机在恢复站点恢复时,自动进行资源替换。

(1)       单击导航树[云业务/站点容灾/保护组管理]/<增加保护组>按钮,弹出增加保护组对话框。

(2)       配置保护组基本信息,单击<下一步>

¡  名称:保护组名称在UIS超融合管理平台中必须唯一。

¡  保护站点:选本地站点。

¡  恢复站点:选择远端站点。

¡  源主机池:选择保护站点中,受保护的虚拟机所在的的主机池。

¡  目的主机池:选择恢复站点中,用于容灾切换时,创建容灾虚拟机的主机池。

¡  自动保护虚拟机:若开启此项,则在源主机池中,所有符合条件的虚拟机,都将自动加入到保护组内。后续添加的虚拟机如果满足条件也会自动加入。

说明

自动保护虚拟机条件:

·         虚拟机使用的存储、虚拟交换机、网络策略模板都为映射关系配置中的资源。

·         虚拟机名称与恢复站点中的虚拟机没有重复。

·         虚拟机未使用主机的软驱等本地设备。

 

图3-27 创建保护组基本信息

 

(3)       配置资源映射关系。分别单击并拖动,来配置保护组的存储、虚拟交换机、网络策略模板映射关系。需要根据虚拟机使用的资源来配置映射。左侧为本地站点虚拟机使用的资源,右侧指在远端站点恢复的虚拟机所使用的资源,请谨慎配置。单击<完成>

说明

·         对于存储资源的映射,需要选择存储池的类型(包括共享文件系统和块设备)及存储类型(支持SRA和不支持SRA)。

·         对于不支持SRA的存储阵列,只支持共享文件系统存储池。

 

图3-28 配置存储映射-选择存储

 

图3-29 配置存储映射-选择设备

 

(4)       保护组资源映射配置完成,单击<完成>按钮。

图3-30 保护组资源映射配置完成

 

(5)       为保护组添加虚拟机。单击受保护的虚拟机列表上方的 <添加虚拟机>按钮,弹出选择虚拟机对话框。把需要保护的20台虚拟机(名称编号从WIN7_001 WIN7_020)都增加到保护组中。

说明

如果勾选了自动保护符合条件的虚拟机,那么符合条件的虚拟机会显示在保护组的虚拟机列表中。

 

图3-31 添加虚拟机

 

3.4.3  创建恢复计划

恢复计划可以理解为为保护组制定的故障恢复策略,保护组中的虚拟机会按照指定的策略进行恢复。

(1)       单击导航树中[云业务/站点容灾/恢复计划管理]菜单项,单击<增加>按钮,弹出增加恢复计划对话框。配置恢复计划的相关信息,并选择保护组和恢复集群信息。

¡  保护组:选择一个加入恢复计划的保护组,新建的恢复计划将用来恢复该保护组的虚拟机。一个保护组只能用于一个恢复计划中。

¡  恢复集群:选择一个恢复站点的集群,恢复时,保护组内的虚拟机将恢复到该集群的主机上。

图3-32 创建恢复计划

 

(2)       恢复创建完成。恢复计划初次创建完的状态显示为“初始化”。

图3-33 保护组创建完成

 

3.5  容灾切换

容灾任务配置完成后,可根据场景,执行恢复计划,进行容灾切换。如定期进行容灾演练,以确保容灾任务配置正常;进行计划恢复,以维护保护站点;保护站点发生故障时,进行故障切换;保护站点恢复后,进行反向恢复。

说明

·         请确保第一次执行恢复计划前,存储Pair对至少完成一次数据同步。

·         对于非SRA存储,执行恢复计划前,需要先取消从资源保护,再执行恢复计划,否则会导致存储无法正常启动,恢复计划执行失败。

·         请确保恢复计划执行过程中具有存储映射关系的存储挂载状态正常,并且恢复集群的资源能够满足需要恢复虚拟机的资源需求,以免出现资源不够导致虚拟机无法部署启动的情况。

·         请确保恢复计划执行过程中保护站点和恢复站点之间网络连接正常,具有映射关系的存储挂载的主机状态正常。

 

3.5.1  容灾演练

恢复计划演练是一种检验配置的非破坏性测试,测试过程不会影响生产业务。恢复计划演练分为开始演练和结束演练两步,开始演练后,恢复计划将把虚拟机恢复到恢复站点。

演练测试通过挂载恢复站点存储卷的LUN,并将其作为恢复站点的数据存储来实现,因此。当演练过程完毕后,通过结束演练来完成测试后的环境清理工作。

1. 开始演练

(1)       单击导航树中[云业务/站点容灾/恢复计划管理/<恢复计划管理名称>]菜单项,进入该恢复计划的概要信息页面。单击<开始演练>按钮,针对所选的恢复计划执行开始演练功能。

图3-34 开始演练按钮

 

(2)       执行方式有两种,如果存储已经同步,可以选择跳过存储同步,直接执行计划演练,从而节省演练的时间;也可直接执行计划演练,其中包含了对存储进行同步的过程。

图3-35 开始演练选项

 

(3)       选择“恢复任务”页签,可以查看当前执行的任务状态。

图3-36 恢复任务执行状态

 

(4)       单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-37 查看恢复详情

 

(5)       验证演练结果。切换到恢复站点,查看保护组中的20台虚拟机(名称编号从WIN7_001 WIN7_020),已经根据保护组配置的资源映射,被恢复到灾备站点中。容灾虚拟机创建在挂载了映射存储的主机上,并在符合条件的主机中均衡创建。

图3-38 查看恢复结果

 

2. 结束演练

演练成功后,通过结束演练来结束该恢复计划的演练,清理容灾数据,并使恢复计划处于就绪状态。

(1)       选择“恢复任务”页签,可以查看当前执行的任务状态。单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-39 查任务状态

 

(2)       单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-40 查看演练结束详情

 

(3)       验证结束演练结果。切换到灾备站点,容灾演练创建的虚拟机,已经被删掉,共享存储被停止。

图3-41 查看灾备站点

 

(4)       结束演练后,查看恢复计划,已经恢复到“就绪”状态。

图3-42 查看恢复计划状态

 

3.5.2  计划恢复

计划恢复将会关闭保护组内的虚拟机,并暂停存储池。计划恢复的执行方式分为执行计划和直接恢复虚拟机两种。执行计划将按照恢复步骤执行;直接恢复虚拟机将跳过前面所有步骤,直接进行恢复虚拟机操作,这种情况主要用于恢复虚拟机之前的过程已经准备就绪,可以直接恢复虚拟机,节省恢复的时间。

(1)       单击导航树中[云业务/站点容灾/恢复计划管理/<恢复计划管理名称>]菜单项,进入该恢复计划的概要信息页面。单击<计划恢复>按钮,执行计划恢复操作。提示计划恢复会关闭主站点对应存储池下的所有虚拟机,并暂停该存储池,单击<确认>,执行计划恢复。

图3-43 计划恢复

 

(2)       选择“恢复任务”页签,可以查看当前执行的任务状态。

图3-44 查看计划恢复任务状态

 

(3)       也可以单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-45 查看计划恢复详情

 

(4)       验证计划恢复结果。切换到灾备站点,查看虚拟机列表,已经根据保护组配置资源映射,创建了容灾虚拟机,且容灾虚拟机都在运行状态。业务在灾备站点持续运行。

图3-46 查看灾备站点

 

(5)       切换到保护站点,保护组中的虚拟机,都处于关闭状态。

图3-47 查看保护站点

 

3.5.3  反向恢复

当执行了计划恢复或者故障恢复后,受保护的虚拟机会在恢复站点启动运行。当原来的受保护站点具备了业务运行的状态后,可以通过反向恢复的方式将受保护的虚拟机恢复到最初的保护站点。

说明

反向恢复执行时,请确保保护站点和恢复站点都正常,且之间网络连接正常,映射关系中存储挂载的主机状态正常。

 

(1)       单击导航树中[云业务/站点容灾/恢复计划管理/<恢复计划管理名称>]菜单项,进入该恢复计划的概要信息页面。单击<反向恢复>按钮,执行反向恢复操作。

(2)       选择“恢复任务”页签,可以查看当前执行的任务状态。单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-48 查看反向恢复状态

 

图3-49 查看反向恢复详细信息

 

(3)       验证反向恢复结果。切换到灾备站点,查看虚拟机列表,容灾恢复的虚拟机,已经被删掉,共享存储也被暂停了。

图3-50 查看灾备站点

 

(4)       切换到保护站点,业务虚拟机都已经都恢复运行。

图3-51 查看保护站点

 

3.5.4  故障恢复

故障恢复的执行方式分为执行计划和直接恢复虚拟机两种。执行计划将按照恢复步骤执行;直接恢复虚拟机将跳过前面所有步骤,直接进行恢复虚拟机操作,这种情况主要用于恢复虚拟机之前的过程已经准备就绪,以直接恢复虚拟机,节省恢复的时间。

(1)       单击导航树中[云业务/站点容灾/恢复计划管理/<恢复计划管理名称>]菜单项,进入该恢复计划的概要信息页面。单击<故障恢复>按钮,执行故障恢复操作。

图3-52 故障恢复

 

(2)       选择“恢复任务”页签,可以查看当前执行的任务状态。

图3-53 查看恢复任务

 

(3)       单击恢复任务列表中执行日期对应的链接,查看详细执行过程。

图3-54 查看故障恢复详情

 

(4)       验证故障恢复结果。切换到灾备站点,查看虚拟机列表,已经根据保护组配置资源映射,创建了容灾虚拟机,且在运行状态。

图3-55 查看灾备站点

 

(5)       保护站点的虚拟机都处于关闭状态。

图3-56 查看保护站点

 

联系我们 联系我们
联系我们
回到顶部 回到顶部