手册下载
vBRAS-UP备份技术白皮书-6W102-整本手册.pdf (1.29 MB)
vBRAS-UP备份技术白皮书
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文中的内容为通用性技术信息,某些信息可能不适用于您所购买的产品。
在转发与控制分离场景下,用户通过UP设备接入,由UP设备完成业务流量转发、业务流量统计的收集上报等工作。一旦该UP设备故障或者用户与该UP设备连接的链路出现故障,该UP所有上线用户的业务都会中断。
UP备份功能将多个UP加入到同一个UP备份组,在多个UP之间形成备份或者负载分担关系。通过UP备份功能,可以为UP提供设备级别的冗余保护,提高UP设备的可靠性,以保证用户业务数据的不间断传输。
· 高可靠性
UP备份为UP提供设备级别的冗余保护,UP故障时,可以使用户业务不间断。
· 业务快速平滑
CP设备在主备UP设备间同步会话信息,实现当网络发生故障时,备用UP设备无需重新获取会话信息即可快速接管用户业务,使得用户感知不到网络的故障,从而提高网络可靠性。
· 灵活部署
UP备份支持1:1热备、N:1温备、1:N温备和负载分担等多种备份模式,可以根据不同网络环境合理选择最佳备份方式。
UP备份组网主要包括以下几个部分:
· UP备份组:多台UP设备加入同一UP备份组,基于接口实现业务的备份。
· UP备份策略模板:管理员可以根据不同业务需求创建对应备份模式的UP备份策略模板,并在UP备份策略模板中指定主用接口和备用接口。备份模式的详细介绍,请参见“2.2 备份模式”。
· 主用接口:承载用户业务的接口。主用接口所在UP为对应UP备份策略模板中的主用UP。
· 备用接口:用来对主用接口进行备份的接口。备用接口所在UP为对应UP备份策略模板中的备用设备。当主用接口故障后,备用接口接替主用接口转发用户流量;当主用接口故障恢复,流量从备用接口回切至主用接口,保证用户流量不会长时间中断。
· 虚拟MAC地址:对于1:1热备模式、N:1温备模式、1:N温备负载分担模式,为了保证主备用接口切换后,接口的MAC地址不发生改变,UP设备使用虚拟MAC地址应答用户的上线请求。虚拟MAC由系统自动计算生成,其中:
¡ 对于1:1热备模式:每一对主备接口对应一个唯一的虚拟MAC地址。
¡ 对于N:1温备模式:每个主接口对应一个唯一的虚拟MAC地址,当主接口故障后,该主接口的虚拟MAC地址由接替该故障主接口的新主接口(即原备接口)使用。
¡ 对于1:N温备负载分担模式:有N+1个主用接口(1≤N≤15),无备用接口。每个主用接口与另外N个主用接口两两之间形成N对主备备份关系,每对主备备份关系都对应系统自动生成的一个唯一的虚拟MAC。
如图2-1所示,UP A、UP B和UP C加入同一UP备份组。管理员在CP上配置UP备份策略模板1和UP备份策略模板2。在UP备份策略模板1中主用接口为Interface A1,备用接口为Interface B1。在UP备份策略模板2中主用接口为Interface B2,备用接口为Interface C1。在UP备份策略模板1中,如果主用接口Interface A1故障,则由备用接口为Interface B1接替其工作,处理用户业务;在UP备份策略模板2中,如果主用接口Interface B2故障,则由备用接口为Interface C1接替其工作,处理用户业务。
图2-1 UP备份示意图
本节将介绍备份模式的基本概念,每种备份模式的详细工作机制请参见后面相应备份模式的工作机制章节。
该模式下,一个主用接口和一个备用接口互为备份。CP设备上的会话信息会同时下发给主备接口。当主UP设备故障时,备UP设备可以立即接管用户业务。
N:1温备模式分为用户接入管理的N:1温备模式和CGN业务的N:1温备模式。
该模式下,N个主用接口和一个备用接口互为备份。用户通过主用接口上线,主用接口间进行业务负载分担。N:1温备模式又分为普通模式和增强模式:
· 在普通模式下,同一时刻,备用接口只能为一个主用接口提供备份服务,备份采用抢占机制,哪个主用接口先故障就先为哪个接口提供备份。当备用接口在为某故障主用接口提供业务备份期间,如果有新的主用接口故障,则新的故障主接口无可用备份接口,该故障主接口下的用户无法上线。
· 在增强模式下,同一时刻,备用接口可以为多个主用接口提供备份服务。相对于普通模式,增强模式可以为业务提供更高的可靠性。
该模式下,N个主用UP设备和一个备用UP设备互为备份。用户认证授权后需要主用UP的CGN单板实现运营商级别的NAT地址转换,主用设备间进行CGN业务负载分担。同一时刻,备用设备只能为一个主用设备提供备份服务,备份采用抢占机制,哪个主用设备先故障就先为哪个设备提供备份。当备用设备在为某故障主用设备提供CGN业务备份期间,如果有新的主用设备故障,则新的故障设备无可用备份设备,该故障主设备下的用户无法实现CGN业务。
该模式下,有N+1个主用接口(1≤N≤15),无备用接口。每个主用接口与另外N个主用接口两两之间形成N对主备备份关系,且每对主备备份关系都对应系统自动生成的唯一一个虚拟MAC,因此N+1个主用接口之间总共形成N*(N+1)对主备关系和N*(N+1)个虚拟MAC。用户上线时,CP从UP备份策略模板的所有主用接口中选择上线用户数最少的接口作为用户接入的主用接口,若存在多个上线用户数最少的接口,则按一定原则选取其中一个接口作为用户接入的主用接口。任一主用接口故障时,该接口上的用户将根据虚拟MAC自动分担到其他N个接口上。
该模式下,有N个主用接口,无备用接口。主用接口间进行业务负载分担。负载分担方式分为如下几种类型:
· 基于UP设备上的用户数进行负载分担:CP先选择UP备份策略模板中上线用户数最少的UP设备,再从用户数最少的UP设备上选择用户数最少的slot,最后从用户数最少的slot选择用户数最少的接口接入。
· 基于UP上主用接口的用户数进行负载分担:CP从UP备份策略模板的所有主用接口中选择上线用户数最少的接口接入。
· 基于UP设备上接口板或成员设备的用户数进行负载分担:CP先选择UP备份策略模板中上线用户数最少的slot,最后从用户数最少的slot选择用户数最少的接口接入。
备份模式对比情况如表2-1所示,实际组网中请根据需要选择备份模式。
备份模式 |
可靠性 |
设备利用率 |
适用场景 |
说明 |
1:1热备模式 |
高 |
低 |
网络简单,但对设备可靠性要求较高的组网环境 |
· 主备UP上均有用户的会话信息,主备切换或故障回切时,可以保证用户业务不中断 · 仅一台主用设备处理用户业务 |
N:1温备模式 |
一般 |
高 |
对可靠性和设备利用率要求均较高的组网环境 |
· 仅主用UP上有用户的会话信息,主备切换或故障回切时,需要重新从CP获取会话信息,用户业务存在短暂中断 · 用户业务在多台主用设备间负载分担 |
1:N温备负载分担模式 |
一般 |
高 |
对设备利用率要求高和对可靠性要求较高的组网环境 |
· 用户的会话信息仅保存在各自主用接口所在的UP上,当某一个主用接口或接口所在UP故障时,接替故障主接口的备接口所在UP需要重新从CP获取会话信息,用户业务存在短暂中断 · 用户业务在多台主用设备间负载分担,每个主用设备均为其他主用设备提供备份服务 |
负载分担模式 |
低 |
高 |
网络比较稳定的组网环境 |
· 无备份UP设备。UP设备故障后,通过该UP上线的用户需要下线后,重新通过其他UP上线。用户业务中断时间较长 · 用户业务在多台主用设备间负载分担 |
1:1热备模式、N:1温备模式和1:N温备负载分担模式支持以下故障检测机制,以便主备进行快速切换,保证用户流量不中断。
CUSP控制器(CP设备)每隔一定时间向其连接的所有CUSP代理(UP设备)发送一次Echo Request报文(心跳检测报文),如果连续多次未收到某CUSP代理的回复报文,则断开与该CUSP代理的连接,触发主备切换。
如图2-2,正常情况下,由主用UP A为用户业务提供服务。
图2-2 基于CUSP状态的故障检测示意图(故障前)
如图2-3所示,当UP A与CR之间链路故障时,会导致CP设备与UP A之间的CUSP连接断开,UP A和CP都会感知到该故障,其中:
· 对于UP A,会自动进行降备。
· 对于CP,会通知UP B进行升主。
为了加快检测速度,CUSP控制器还可以为CUSP连接建立BFD会话,通过BFD机制实现对CUSP连接故障的快速检测。缺省情况下,CP设备根据CUSP状态的检测结果控制UP进行主备切换。
图2-3 基于CUSP状态的故障检测示意图(故障后)
当UP设备上用户侧接口故障时,UP设备会通过CUSP通道将故障信息上报给CP设备;CP设备收到UP上报的故障信息后,通知UP进行主备切换。
如图2-4所示,正常情况下,由主用UP A为用户业务提供服务。
如图2-5所示,当主用UP A上用户侧接口Interface A发生故障后,主用接口状态变为Down,UP A设备将故障信息上报给CP设备;CP设备收到UP A上报的故障信息后,通知UP A和UP B进行主备切换。切换后,由新主UP B为用户业务提供服务。
本功能用于解决在主UP用户侧链路故障的情况下,因CUSP正常导致未能触发主备切换的问题。
当接入用户与UP之间过多级设备时,如果中间设备之间网络故障,但UP和中间设备之间网络正常,此时虽然UP工作正常,但因UP用户侧接口下联某段链路故障,仍会导致该UP上用户业务不可用。
如图2-6所示,接入用户经过Device A、Devce B和主用UP A互联,Device A和Device B之间链路故障,Device B和UP A之间链路正常。该情况下,虽然UP A处于正常工作状态,但因Device A和Device B之间链路故障,UP A已无法为用户业务提供服务,应该进行主备切换。但是,因UP A处于正常工作状态,不会触发主备切换,从而导致用户业务不可用。
为了解决上述问题,可通过在主用UP设备上配置Track项与用户侧接口下联链路联动,使用Track功能监控用户侧接口下联链路故障,并上报CP,由CP根据上报的故障触发主备切换。
如图2-7所示,在主用UP A上配置Track监测Device A和UP A之间所有链路的状态,当其中某段链路故障时,UP A设备将故障信息上报给CP设备;CP设备收到UP A上报的故障信息后,通知UP A和UP B进行主备切换。
图2-7 基于Track监测本端UP设备的用户侧链路状态的故障检测示意图
本功能用于解决在主UP网络侧所有业务流量转发路径都故障的情况下,因CUSP正常导致未能触发主备切换的问题。
如图2-8所示,当UP与CP之间CUSP连接经过多级设备时,如果主用UP A与CR之间网络故障,但UP A和CP之间网络正常,此时UP A已无法为用户业务提供服务,应该进行主备切换。但是,因UP A和CP之间CUSP通道正常,不会触发主备切换,从而导致用户业务不可用。
为了解决上述问题,可配置UP设备使用Track功能监控网络侧链路状态。当网络侧链路发生故障后,Track会将Track项状态通知给UP设备,UP将故障信息上报给CP;CP设备收到故障信息后,触发主备切换。
如图2-9所示,当主用UP A使用Track功能监控到UP A与CR之间链路故障时,UP A向CP设备上报故障信息;CP设备收到UP A上报的故障信息后,通知UP A和UP B进行主备切换。
图2-9 基于Track监测本端UP设备的网络侧链路状态的故障检测示意图
本功能用于解决在主UP网络侧存在可用业务流量转发路径的情况下,因CUSP故障导致误切换的问题。
如图2-10所示,UP与CP之间CUSP连接经过多级设备,UP到CP存在CR 1和CR 2两条路径,正常情况下,由主用UP A为用户业务提供服务。
图2-10 基于CUSP状态的故障检测误切换示意图(故障前)
如图2-11所示,当主用UP A与CR 2之间链路,以及CR 1与CP之间链路都故障时,因UP A与CP之间所有可用链路全部故障,UP A和CP设备都会感知二者之间的CUSP状态异常:
· 对于UP A,会自动进行降备。
· 对于CP,会通知UP B进行升主。
该情况下,虽然UP A与CP之间的CUSP状态异常,但是UP A仍可以通过CR 1链路正常为用户提供服务,基于网络稳定性考虑,直接对相关UP进行切换,会造成资源浪费,因此不能仅凭CUSP通道的状态作为UP设备故障的依据。
图2-11 基于CUSP状态的故障检测误切换示意图(故障后)
为解决上述问题,可在同一UP备份组中的一台UP设备上配置Track功能监控另一台对端UP设备的网络侧链路状态。当本端UP设备监测到对端UP设备故障(例如设备异常、链路异常)时,本端UP设备会将对端UP故障信息上报给CP设备。CP设备收到故障信息后,触发主备切换。
· 备用UP来监测主用UP时,需要在主备UP之间建立BFD会话,并将Track项与主备UP之间的BFD会话关联,以实现快速检测。当主用UP的网络侧接口故障时,主备UP间的BFD会话会变为down,BFD会话的监测结果会通知给备用UP上的Track模块,备份UP因Track项状态变为Negative,会将故障信息上报给CP,CP根据上报结果通知UP进行主备切换。
· 实际组网中,推荐在主备UP上都配置基于对端UP Track项状态的故障检测功能,以便主备UP之间相互监测。
当主用UP A与CR 2之间链路,以及CR 1与CP之间链路都故障时,UP A和CP设备都会感知二者之间的CUSP状态异常:
· 如图2-12所示,若UP B检测到UP A与CR 1之间链路正常,则:
¡ 对于UP A,不会降备,继续以主UP角色为用户提供服务。
为了确保该情况下UP A不会自己降备,需要在UP A设备上配置Track功能用来检测UP A和CR 1、CR 2之间链路的状态,具体工作过程详见“2.3.4 2. 基于Track监测本端UP设备的网络侧链路状态的故障检测(双备现象)”。
¡ 对于CP,因未收到UP B上报UP A的故障信息,认为UP A可继续为用户提供服务,不会通知UP B进行升主。
图2-12 基于Track监测对端UP设备的网络侧链路状态的故障检测示意图(不切换)
· 如图2-13所示,若UP B检测到UP A与CR 1、CR 2之间链路全部故障,则:
¡ 对于UP A,会自动进行降备。
¡ 对于CP,因收到UP B上报UP A的故障信息,认为UP A故障无法继续为用户提供服务,会通知UP B进行升主。
图2-13 基于Track监测对端UP设备的网络侧链路状态的故障检测示意图(切换)
本功能用于解决在主UP网络侧存在可用业务流量转发路径时,主UP未降备的情况下,因CUSP故障触发备UP升主后出现双主的问题。
如图2-14所示,UP与CP之间CUSP连接经过多级设备,当主用UP A与Router之间链路故障时,UP A和CP设备都会感知二者之间的CUSP状态异常:
· 对于UP A,因配置了Track功能用来检测UP A设备和CR之间的链路状态,且根据Track项状态,发现UP A与CR之间链路正常,说明UP A上的主用接口可以继续为用户业务提供服务,无需切换为备用接口,故UP A不会自动降备。有关Track功能用来检测UP A设备和CR之间链路状态的详细介绍,请参见“2. 基于Track监测本端UP设备的网络侧链路状态的故障检测(双备现象)”。
· 对于CP,会通知UP B进行升主。
该情况下,备用UP B升主后,会出现双主现象,导致功能异常。
图2-14 基于VSRP协商主备关系的故障检测示意图(双主现象)
为解决上述问题,同一UP备份组中的UP之间支持采用VSRP来协商主备关系,即备用UP升主时,会向同一UP备份组中原主UP通告升主消息;原主UP收到备用UP的升主消息后,按如下原则处理:
· 如果原主UP和CP之间的CUSP通道故障,则原主UP会自动降备。
· 如果原主UP和CP之间的CUSP通道正常,则原主UP不会自动降备,是否降备要依赖CP的通知。
如图2-15所示,备用UP B根据CP的通知进行升主时,会向主用UP A通告升主消息。主用UP A收到UP B的升主消息后,因检测到UP A和CP之间的CUSP通道故障,故UP A会自动降备,从而避免出现双主的情况。
图2-15 基于VSRP协商主备关系的故障检测示意图(UP之间完成主备关系协商后)
本功能用于解决在主UP网络侧存在可用业务流量转发路径的情况下,因CP和所有UP之间的CUSP都故障导致主UP降备后,备UP未能升主,出现双备的问题。
如图2-16,UP与CP之间CUSP连接经过多级设备,正常情况下,由主用UP A为用户业务提供服务。
图2-16 CUSP通道连接正常示意图(故障前)
如图2-17所示,如果CP设备与CR之间链路断开,会导致CP设备与所有的UP设备之间的连接都会断开,CUSP控制通道断开后,主用UP A上的主用接口会自动切换为备用接口,因CP无法通知备用UP B升主,会出现多备,无主的情况,导致用户业务不可用。
图2-17 CUSP通道故障导致误切换示意图(故障后)
为解决上述问题,可在UP设备上配置Track功能用来检测UP设备和CR之间的链路状态。当CUSP控制通道断开时:
· 如图2-18所示,如果根据Track项状态,发现UP A与CR之间链路正常,说明故障发生在CP与CR之间,则UP A上的主用接口可以继续为用户业务提供服务,无需切换为备用接口。
图2-18 基于Track监测本端UP设备的网络侧链路状态的故障检测示意图(UP接口不进行主备切换)
· 如果根据Track项状态,发现UP A与CR的链路故障,说明故障发生在UP A与CR之间,则UP A设备上的主用接口会自动切换为备用接口。此时:
¡ 如图2-19所示,若CP与CR之间链路正常,则CP会通知UP B升主,进行主备切换,主备切换后由新主UP B为用户业务提供服务。
图2-19 基于Track监测本端UP设备的网络侧链路状态的故障检测示意图(UP接口进行主备切换)
¡ 如图2-20所示,若CP与CR之间链路也故障,则因CP无法通知UP B升主,会出现多备,无主的情况,导致用户业务不可用。
图2-20 基于Track监测本端UP设备的网络侧链路状态的故障检测示意图(UP接口进行主备切换)
1:1热备模式是指一个主用接口和一个备用接口互为备份。CP设备上的会话信息会同时下发到主UP设备和备UP设备,当主UP设备故障时,备UP设备可以立即接管用户业务,保证用户业务不中断。
如图2-21所示,UP A和UP B属于同一UP备份组。UP备份策略模板中备份模式为1:1热备模式,UP A上的Interface A为主用接口,UP B上的Interface B为备用接口。
当用户的报文通过主用接口Interface A上送到CP设备后,CP对用户进行认证、授权等操作,生成会话信息。CP设备将会话信息通过CUSP同时下发到主UP设备和备UP设备。主用接口Interface A实时为业务提供支持,按照会话信息转发流量;备用接口Interface B不转发业务流量,只接收会话更新信息。
当主用接口Interface A发生故障后,备用接口Interface B将切换为主用接口,并根据本地保存的会话信息转发业务流量;当Interface A故障恢复时,流量从Interface B回切至Interface A,使用户业务不中断。
图2-21 1:1热备模式工作机制示意图
如图2-22所示,主用接口正常工作时,用户流量处理流程如下:
(1) Users发送上线请求报文,该报文的目的MAC地址为广播MAC地址。
(2) Device A接收到Users的广播上线请求报文后,将报文分别发送给主用设备UP A和备用设备UP B。
(3) UP A和UP B接收到Users的上线请求报文后,通过VXLAN协议通道转发给CP。
(4) CP只处理主用设备UP A转发的上线请求报文,将备用设备UP B转发的上线请求报文丢弃。CP将上线应答报文通过VXLAN协议通道发送给UP A,应答报文的源MAC为自动生成的虚拟MAC地址MAC V。UP A将CP发送的上线应答报文转发给Device A。
(5) Device A将上线应答发报文送给Users,同时生成MAC地址表项,目的MAC地址为MAC V,出接口为连接Interface A的接口。
(6) Users收到应答报文后,发送上线交互报文,该报文为单播报文,目的MAC地址为MAC V。上线交互报文通过Device A发送给UP A。UP A将接收到的上线交互报文通过VXLAN协议通道转发给CP。
(7) 在CP上完成用户上线后,通知Users上线成功。同时,CP通过CUSP通道将会话信息下发到UP A和UP B。
(8) Users上线成功后,发送数据报文,该报文为单播报文,目的MAC地址为MAC V。数报文通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(9) IP network中的设备收到Users的数据报文后,处理用户业务。之后,IP network发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
如图2-23所示,当UP A感知到主用接口发生故障时,用户流量处理流程如下:
(1) CP感知到UP A的主用接口故障信息后,CP会通知UP设备触发1:1热备模式的主备UP切换,即CP通知UP B的接口Interface B升为主用状态,通知UP A的接口Interface A降为备用状态。
(2) UP B接收到升主通知后,Interface B升为主用状态,并向Device A发送免费ARP报文。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface B的接口。
(3) UP A向Device B发布低优先级路由,或者撤销路由,UP B向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP B转发。
(4) 主备切换后,Users的数据报文将通过Device A发送给UP B。UP B接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(5) IP network发送到Users的下行数据报文将经Device B转发给UP B。UP B将下行数据报文转发给Users。
如图2-24所示,当设备故障或网络侧链路故障时,用户流量处理流程如下:
(1) 发生以下故障时,CP会通知UP设备触发1:1热备模式的主备UP切换,即CP通知UP B的接口Interface B升为主用接口,通知UP A的接口Interface A降为备用状态。
¡ CP检测到与UP A的CUSP通道故障。
¡ UP B监测到UP A网络侧接口故障时,UP B向CP上报故障信息。
(2) UP B接收到升主通知后,Interface B升为主用接口,并向Device A发送免费ARP报文。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface B的接口。
(3) 与UP A发布的原路由相比,UP B向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP B转发。
(4) 主备切换后,Users的数据报文将通过Device A发送给UP B。UP B接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(5) IP network发送到Users的下行数据报文将经Device B转发给UP B。UP B将下行数据报文转发给Users。
如图2-25所示,当主用接口、设备、网络侧链路等故障恢复时,用户流量处理流程如下:
(1) CP感知到UP A的故障恢复信息。等待回切定时器超时后,CP通知UP设备触发1:1热备模式的主备回切。CP通知UP A的接口Interface A升为主用状态,通知UP B的接口Interface B降为备用状态。
(2) UP A接收到升主通知后,接口Interface A升级为主用状态,并向Device A发送免费ARP报文。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface A的接口。
(3) 与UP B发布的路由相比,UP A向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP A转发。
(4) 主备切换后,Users的数据报文将通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(5) IP network发送到Users的下行数据报文将Device B转发给UP A。UP A将下行数据报文转发给Users。
N:1温备模式是指N个主用接口通过一个备份接口进行备份,主用接口间进行业务负载分担。CP设备上会话信息只下发到主UP设备。当主UP设备故障时,CP设备再把会话信息下发到备UP设备,由备UP设备接管用户业务,用户业务中断时间相对于热备份来说较长。
如图2-26所示,UP A、UP B和UP C属于同一UP备份组。UP备份策略模板中备份模式为N:1温备模式,UP A上的Interface A为主用接口,UP B上的Interface B为主用接口,UP C上的Interface C为备用接口。
CP根据UP A和UP B的负载情况,合理地为用户分配上线的接口,以实现负载均衡。当主用接口Interface A或Interface B发生故障后,备用接口Interface C将切换为主用接口,CP将会话信息通过CUSP下发给UP C,以便通过Interface C处理接入用户业务。
· 在普通的N:1温备模式下,当主用接口Interface B也发生故障,备用接口Interface C不会再接管该故障接口下的接入用户业务。
· 在增强的N:1温备模式下,主用接口Interface B也发生故障时,备用接口Interface C也会再接管该故障接口下的接入用户业务。
图2-26 N:1温备模式工作机制示意图
如图2-27所示,对于CGN业务的N:1温备功能,先完成用户接入流程,通过认证授权的用户再进行NAT地址切换,实现CGN业务。在CP上部署N:1温备模式的CGN-UP备份策略模板。CGN-UP备份策略模板中,UP A和UP B为主UP,UP C为备UP。当用户在CP设备上通过认证、授权等操作后,CP设备生成会话信息,并将会话信息通过CUSP下发给UP备份组中主用UP设备。通过主UP上的CGN功能将会话信息中的用户私网地址转换为公网地址,再根据会话信息转发业务流量到公网中。UP A和UP B为CGN业务流量进行负载分担;备用UP C不处理CGN业务。
当主用UP A发生故障后,备用UP C将切换为主用UP,CP设备将会话信息通过CUSP下发给UP C。此时通过UP C上的CGN功能为用户重新申请公网IP,并根据会话信息转发业务流量;当主用UP B也发生故障,备用UP C不会再接管该故障UP下的接入用户的CGN业务。
图2-27 CGN业务的N:1温备工作机制示意图
如图2-28所示,以用户接入管理的N:1温备模式为例,当主用接口正常工作时,用户流量处理流程如下:
(1) Users发送上线请求报文,该报文的目的MAC地址为广播MAC地址。
(2) Device A接收到Users的广播上线请求报文后,将报文分别发送给主用设备UP A、主用设备UP B和备用设备UP C。
(3) UP A、UP B和UP C接收到Users的上线请求报文后,通过VXLAN协议通道转发给CP。
(4) CP只处理主用设备UP A、主用设备UP B转发的上线请求报文,将备用设备UP C转发的上线请求报文丢弃。CP根据UP A和UP B的负载情况,为Users选择上线接口,例如选择上线接口为UP A的Interface A。CP将上线应答报文通过VXLAN协议通道发送给UP A,应答报文的源MAC为自动生成的虚拟MAC地址MAC V。UP A将CP发送的上线应答报文转发给Device A。
(5) Device A将上线应答发报文送给Users,同时生成MAC地址表项,目的MAC地址为MAC V,出接口为连接Interface A的接口。
(6) Users收到应答报文后,发送上线交互报文,该报文为单播报文,目的MAC地址为MAC V。上线交互报文通过Device A发送给UP A。UP A将接收到的上线交互报文通过VXLAN协议通道转发给CP。
(7) 在CP上完成用户上线后,通知Users上线成功。同时,CP通过CUSP通道将会话信息下发到UP A。
(8) Users上线成功后,发送的数据报文,该报文为单播报文,目的MAC地址为MAC V。数报文通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(9) IP network中的设备收到Users的数据报文后,处理用户业务。之后,IP network发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
如图2-29所示,以用户接入管理的N:1温备模式为例,当UP A感知到主用接口发生故障时,用户流量处理流程如下:
(1) CP感知到UP A的主用接口故障信息后,CP会通知UP设备触发N:1温备模式的主备UP切换,即CP通知UP C的接口Interface C升为主用状态,并向UP C下发会话信息,通知UP A的接口Interface A降为备用状态。
(2) UP C接收到升主通知后,接口Interface C升级为主用状态,并向Device A发送免费ARP报文,同时UP C添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface C的接口。
(3) UP A向Device B发布低优先级路由,或者撤销路由,UP C向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP C转发。
(4) 主备切换后,Users的数据报文将通过Device A发送给UP C。UP C接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network。
(5) IP network发送到Users的下行数据报文将经Device B转发给UP C。UP C将下行数据报文转发给Users。
如图2-30所示,以用户接入管理的N:1温备模式为例,当CUSP通道发生故障时,用户流量处理流程如下:
(1) 发生以下故障时,CP会通知UP设备触发N:1温备模式的主备UP切换,即CP通知UP C的接口Interface C升为主用状态,并向UP C下发会话信息,通知UP A的接口Interface A降为备用状态。
¡ CP检测到与UP A的CUSP通道故障。
¡ UP C监测到UP A网络侧接口故障时,UP C向CP上报故障信息。
(2) UP C接收到升主通知后,接口Interface C升级为主用设备,并向Device A发送免费ARP报文,同时UP C添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface C的接口。
(3) 与UP A发布的路由相比,UP C向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP C转发。
(4) 主备切换后,Users的数据报文将通过Device A发送给UP C。UP C接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(5) IP network发送到Users的下行数据报文将经Device B转发给UP C。UP C将下行数据报文转发给Users。
如图2-31所示,以用户接入管理的N:1温备模式为例,当主用接口、设备、网络侧链路等故障恢复时,用户流量处理流程如下:
(1) CP感知到UP A的故障恢复信息。等待回切定时器超时后,CP通知UP设备触发N:1温备模式的主备回切,即CP通知UP A的接口Interface A升为主用状态,并向UP A下发会话信息,通知UP C的接口Interface C降为备用设备。
(2) UP A接收到升主通知后,接口Interface A升级为主用状态,待CP向UP A下发完会话信息后,向Device A发送免费ARP报文,同时UP A添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC V的MAC地址表项的出接口修改为连接Interface A的接口。
(3) 与UP C发布的路由相比,UP A向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP A转发。
(4) UP C删除会话信息,通知Device B撤销用户路由。
(5) 主备切换后,Users的数据报文将通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(6) IP network中设备发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
1:N温备负载分担模式是指N+1个主用接口(1≤N≤15)间进行业务负载分担,当其中一个接口故障时,这个接口上的用户业务由其它N个接口分担。N+1个主用接口间两两相互备份,即每个主用接口均与另外N个主用接口两两之间形成N对主备备份关系。N个主用接口之间共形成N*(N+1)对主备关系,每对主备备份关系对应一个系统自动生成的虚拟MAC地址。所有用户的业务在所有主用接口之间进行负载分担。需要注意的是N+1个主用接口必须位于N+1个不同UP设备。
CP设备上的会话信息只下发到主UP设备。当主UP设备故障时,CP设备再把会话信息下发到其他N个备UP设备,由备UP设备接管用户业务。用户业务中断时间相对于热备份来说较长。
如图2-32所示,UP A、UP B和UP C属于同一UP备份组。UP备份策略模板中备份模式为1:N温备负载分担模式,Interface A、Interface B、Interface C均为主用接口,这三个主用接口两两之间形成6对主备备份关系,每对主备关系都对应系统自动分配的唯一虚拟MAC。例如,Interface A作为主用接口,Interface B作为Interface A的备份,该主备关系对应虚拟MAC地址MAC A-B;Interface A作为主用接口,Interface C作为Interface A的备份,该主备关系对应虚拟MAC地址MAC A-C。
当用户的报文通过主用接口Interface A、Interface B和Interface C上送到CP设备后,CP对用户进行认证、授权等操作,生成会话信息。同时,CP设备根据三个主用接口的当前在线用户数量,选取负载最小(当前在线用户数量最小)的接口作为该用户的主用接口,再根据其余两个接口的当前在线用户数量,选取负载最小(当前在线用户数量最小)的接口作为该用户的备份接口。CP设备将会话信息通过CUSP下发给为该用户选取的主用接口所在的UP设备。主用接口实时为业务提供支持。
当主用接口Interface A发生故障时,接口上的部分用户通过备份接口Interface B上线,部分用户通过备份接口Interface C上线,CP将对应的会话信息通过CUSP下发给UP B和UP C,以便通过Interface B和Interface C处理接入用户业务。此时,如果备份接口(如Interface B)也发生故障,则由该故障接口接管的用户需要下线,并通过其他没有故障的UP设备重新上线。
图2-32 1:N温备负载分担模式工作机制示意图
如图2-33所示,主用接口正常工作时,用户流量处理流程如下:
(1) Users发送上线请求报文,该报文的目的MAC地址为广播MAC地址。
(2) Device A接收到Users的广播上线请求报文后,将报文分别发送给主用设备UP A、UP B和UP C。
(3) UP A、UP B和UP C接收到Users的上线请求报文后,通过VXLAN协议通道转发给CP。
(4) CP处理主用设备UP A、UP B和UP C转发的上线请求报文。CP选择当前在线用户数量最少的接口作为Users的主用接口,例如选择的主用上线接口为UP A的Interface A。再从接口Interface B、Interface C中选取在线用户数量最少的接口作为Users的备份上线接口,例如选择的备份上线接口为UP B的Interface B。CP将上线应答报文通过VXLAN协议通道发送给UP A,应答报文的源MAC为主用接口Interface A、备份接口Interface B对应的虚拟MAC地址MAC A-B。UP A将CP发送的上线应答报文转发给Device A。
(5) Device A将上线应答发报文送给Users,同时生成MAC地址表项,目的MAC地址为MAC A-B,出接口为连接Interface A的接口。
(6) Users收到应答报文后,发送上线交互报文,该报文为单播报文,目的MAC地址为MAC A-B。上线交互报文通过Device A发送给UP A。UP A将接收到的上线交互报文通过VXLAN协议通道转发给CP。
(7) 在CP上完成用户上线后,通知Users上线成功。同时,CP通过CUSP通道将会话信息下发到UP A。
(8) Users上线成功后,发送数据报文,该报文为单播报文,目的MAC地址为MAC A-B。数报文通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(9) IP network中的设备收到Users的数据报文后,处理用户业务。之后,IP network发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
图2-34所示,当UP A感知到主用接口发生故障时,用户流量处理流程如下:
(1) CP感知到UP A的主用接口故障后,CP会通知UP设备触发1:N温备负载分担模式的主备UP切换,即CP通知UP A将其主用接口Interface A降为备用状态,通知UP B和UP C的接口升为主用状态,UP B接管报文目的MAC地址为MAC A-B的用户,UP C接管报文目的MAC地址为MAC A-C的用户。
(2) UP B接收到升主通知后,Interface B升级为主用状态,并向Device A发送免费ARP报文,同时UP B添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC A-B的MAC地址表项的出接口修改为连接Interface B的接口。
(3) UP C接收到升主通知后,Interface C升级为主用状态,并向Device A发送免费ARP报文,同时UP C添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC A-C的MAC地址表项的出接口修改为连接Interface C的接口。
(4) 与UP A发布的原路由相比,UP B和UP C向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP B和UP C转发。
(5) 主备切换后,Users的数据报文将通过Device A发送给UP B或UP C。UP B或UP C接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network。
(6) IP network发送到Users的下行数据报文将经Device B转发给UP B或UP C。UP B或UP C将下行数据报文转发给Users。
如图2-35所示,当CUSP通道发生故障时,用户流量处理流程如下:
(1) 发生以下故障时,CP会通知UP设备触发1:N温备负载分担模式的主备UP接口切换,即CP通知UP A接口Interface A降为备用工作状态,通知UP B和UP C的接口升为主用,UP B接管报文目的MAC地址为MAC A-B的用户,UP C接管报文目的MAC地址为MAC A-C的用户。
¡ CP检测到与UP A的CUSP通道故障。
¡ UP B或UP C监测到UP A网络侧接口故障时,UP B或UP C向CP上报故障信息。
(2) UP B接收到升主通知后,Interface B升级为主用工作状态,并向Device A发送免费ARP报文,同时UP B添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC A-B的MAC地址表项的出接口修改为连接Interface B的接口。
(3) UP C接收到升主通知后,Interface C升级为主用工作状态,并向Device A发送免费ARP报文,同时UP C添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC A-C的MAC地址表项的出接口修改为连接Interface C的接口。
(4) 与UP A发布的原路由相比,UP B和UP C向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP B和UP C转发。
(5) 主备切换后,Users的数据报文将通过Device A发送给UP B或UP C。UP B或UP C接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network。
(6) IP network发送到Users的下行数据报文将经Device B转发给UP B或UP C。UP B或UP C将下行数据报文转发给Users。
图2-35 CUSP通道故障时的用户流量处理示意图
如图2-36所示,当主用接口、设备、网络侧链路等故障恢复时,用户流量处理流程如下:
(1) CP感知到UP A的故障恢复信息。等待回切定时器超时后,CP通知UP设备触发1:N温备负载分担模式的主备回切,即CP通知UP A的接口Interface A升为主用状态,并向UP A下发会话信息,通知UP B和UP C的接口降为备用状态,UP A从UP B上接管报文目的MAC地址为MAC A-B的用户,UP A从UP C上接管报文目的MAC地址为MAC A-C的用户。
(2) UP A接收到升主通知后,接口Interface A升级为主用状态,并向Device A发送免费ARP报文,同时UP A添加CP下发的会话信息。Device A收到免费ARP报文后,更新本地MAC地址表,即将目的MAC地址为MAC A-B和MAC A-C的MAC地址表项的出接口修改为连接Interface A的接口。
(3) 与UP B和UP C发布的路由相比,UP A向Device B发布优先级更高的路由,保证IP network通过Device B发往Users的报文优先从UP A转发。
(4) UP B和UP C删除接管的会话信息,通知Device B撤销用户路由。
(5) 主备切换后,Users的数据报文将通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(6) IP network中设备发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
负载分担模式是指N个主用接口间进行业务负载分担,无备用接口。当UP设备故障时,此设备上线的用户需要下线,并通过其他没有故障的UP设备重新上线。
如图2-37所示,UP A、UP B和UP C属于同一UP备份组。UP备份策略模板中备份模式为负载分担模式,UP A上的Interface A、UP B上的Interface B和UP C上的Interface C均为主用接口。
当用户的报文通过主用接口Interface A、Interface B或Interface C上送到CP设备后,CP对用户进行认证、授权等操作,生成会话信息。CP设备将会话信息通过CUSP下发给UP备份组中用户上线的UP设备。主用接口Interface A、Interface B和Interface C实时为业务提供支持,对业务流量进行负载分担。
当某一主用接口故障后,通过该接口上线的用户不会由其他主用接口接管,将会造成这些用户下线。
如图2-38所示,主用接口正常工作时,用户流量处理流程如下:
(1) Users发送上线请求报文,该报文的目的MAC地址为广播MAC地址。
(2) Device A接收到Users的广播上线请求报文后,将报文分别发送给主用设备UP A、UP B和UP C。
(3) UP A、UP B和UP C接收到Users的上线请求报文后,通过VXLAN协议通道转发给CP。
(4) CP处理主用设备UP A、UP B和UP C转发的上线请求报文。CP根据UP A、UP B和UP C的负载情况,为Users选择上线接口,例如选择上线接口为UP A的Interface A。CP将上线应答报文通过VXLAN协议通道发送给UP A,应答报文的源MAC为UP A上Interface A的MAC地址MAC A。UP A将CP发送的上线应答报文转发给Device A。
(5) Device A将上线应答发报文送给Users,同时生成MAC地址表项,目的MAC地址为UP A的MAC地址MAC A,出接口为连接Interface A的接口。
(6) Users收到应答报文后,发送上线交互报文,该报文为单播报文,目的MAC地址为MAC A。上线交互报文通过Device A发送给UP A。UP A将接收到的上线交互报文通过VXLAN协议通道转发给CP。
(7) 在CP上完成用户上线后,通知Users上线成功。同时,CP通过CUSP通道将会话信息下发到UP A。
(8) Users上线成功后,发送数据报文,该报文为单播报文,目的MAC地址为MAC A。数据报文通过Device A发送给UP A。UP A接收到Users的数据报文后,通过查找FIB表,将报文经Device B转发到IP network中。
(9) IP network中的设备收到Users的数据报文后,处理用户业务。之后,IP network发送到Users的下行数据报文将经Device B转发给UP A。UP A将下行数据报文转发给Users。
因为配置或者路由协议切换等原因,到用户的下行流量可能会被发送到备用UP设备,备用UP设备将下行流量丢弃,导致下行流量中断。
通过保护隧道,可以解决上述问题。如图2-39所示,UP A和UP B属于同一UP备份组,部署UP备份策略模板后,UP A为主用设备,UP B为备用设备,在UP A和UP B之间建立保护隧道。当进行主备切换时,由于Device B路由切换缓慢等问题,导致到用户的下行流量仍发送到UP A。此时,流量会通过保护隧道绕行到UP B进行转发,从而避免下行流量转发中断。
在转发与控制分离业务组网中,为了提升接入用户的上网体验,需要提高用户业务的可靠性。通过在UP设备之间部署1:1热备模式的UP备份功能,提高网络可靠性。当网络发生故障时,备用UP可以快速接管用户业务,使得用户感知不到网络故障,可以不中断网络资源的使用。
图3-1 接入用户可靠性示意图
在转发与控制分离业务组网中,为了提升设备的利用率,需要使用户均匀分布到各个接入设备上。通过在UP设备之间部署N:1温备模式或负载分担模式的UP备份功能,可以使用户在UP设备间的负载均衡,提高了设备利用率,减少了设备压力。
图3-2 接入用户负载分担示意图