站点容灾

容灾简介

随着信息时代的发展,无论是企业,还是学校、医院等单位,越来越多的关键业务系统上线,对信息系统的依赖程度越来越高。这种情况下,对业务的可靠性保障,就变得非常重要。为了在自然灾害或其他意外,如大规模断电、出口故障等机房级故障发生时,保证业务数据的完整性,及业务的连续性,就需要搭建容灾系统,来对整个站点进行容灾保障。

容灾,又称灾难恢复(Disaster Recovery),指将信息系统从灾难(火灾、洪水、地震、或人为破坏等)造成的故障或瘫痪状态,恢复到可正常运行的状态,并将其支撑的业务功能,从不正常状态,恢复到可接受状态。

容灾系统(Disaster Recovery System)的建设,一般在相隔较远的异地,建立两套或多套功能相同的业务系统,这些系统间,可进行状态监控及业务切换,当一处系统因人为或自然原因,造成严重故障或瘫痪,支持的业务功能不能正常运行时,整个业务系统可以切换到另一处,使得业务功能可以继续正常工作。

容灾系统关键性能指标

容灾系统的建设目标,是保证灾难发生时,业务不中断,数据不丢失。针对这两个目标,衡量容灾系统的关键指标有RPORTO两种。

RPORecovery Point Objective,恢复点目标),又称为业务系统所能容忍的最大数据丢失量目标,是指当灾难发生后,用户要求把数据恢复到灾难发生前的某个时间点。RPO是衡量企业在灾难发生后会丢失多少数据的指标,衡量容灾系统的数据冗余备份能力。RPO一般由采用的数据复制方式决定。同步复制方式可以做到RPO0,异步复制方式的RPO取决于复制的周期。

图-1 RPO

 

RTORecovery Time Objective,恢复时间目标),又称为用户能容忍的恢复时间目标,是指信息系统从灾难状态,恢复到可运行状态所需的时间,用来衡量容灾系统的业务恢复能力。RTO水平一般由容灾业务恢复流程决定,自动化程度越高,RTO越小。

图-2 RTO

 

容灾系统的分类

根据对系统的保护程度,可以将容灾系统分为三级:数据级、应用级、业务级。

图-3 容灾系统分类

 

存储远程复制技术

对数据的保护是容灾的基础,一般通过备份来保护数据。备份指为防止系统操作失误或故障导致的数据丢失,而将全部或部分数据集合,从应用主机的硬盘或阵列,复制到其他存储介质的过程。存储阵列的复制技术一般分为同步复制和异步复制两种。

1.      同步复制

同步复制能够保证具有复制关系的数据卷之间数据的一致性。同步复制的原理是,每个I/O写操作,都会等具有复制关系的主卷和远程卷都返回写完成才释放。因此同步复制方式有最高级别的数据完整性,但是性能会因为在阵列之间传送数据延迟而降低,而且同步复制方式复制阵列之间的距离要满足RTTRound-Trip Time,往返时延)的要求。

同步复制一般应用于较短距离间(10KM~100KM同城),且对数据一致性要求极高,对数据丢失几乎不可容忍的场景,如银行系统等。

图-4 同步远程复制

 

2.      异步复制

异步复制方式一般都是周期性进行的,不能保证具有复制关系的数据卷之间的数据一致。异步复制的原理是本地主卷完成写操作后,给此数据卷创建一个快照,然后将快照复制到远程卷。异步复制方法提供了比较高的应用性能,但如果灾难发生,在远程卷上还未更新的数据就会有丢失风险,即时间窗口。

异步复制对带宽和距离要求相对较低,适用于业务系统性能要求较高,写压力小,对阵列IOPS和时延要求不是太高,如数据库、文件系统等场景。

图-5 异步远程复制

 

UIS站点容灾介绍

UIS超融合站点容灾功能,基于存储阵列的远程复制技术,提供应用级的容灾服务。下面将从适用的场景、实现机制等方面、配置流程等方面,介绍UIS超融合容灾特性。

适用场景

实现机制

UIS的站点容灾系统,大体上可以分为两大块:存储层针对数据一致性容灾目标的配置,以及业务层针对业务连续性容灾目标的配置。

存储复制容灾,依赖于存储阵列的复制功能,因此要求保护站点和恢复站点的存储复制技术要一致,且存储阵列上必须有存储复制功能和快照功能的授权。

 

图-6 存储复制容灾实现机制

 

功能特色

1.      经济的容灾方案

2.      自动化的容灾

3.      一站式容灾配置

4.      丰富的容灾场景