SPB技术白皮书

 

概述

1.1  产生背景

为了实现高可靠性和冗余部署,当今大多数企业网络及其数据中心跨越了多个位于不同地理位置的物理站点。为了实现站点间的资源动态调配和管理,虚拟机在数据中心之间要能够自由迁移,由于虚拟机迁移过程对用户透明,不能改变IP地址,所以必须在分布于异地的站点之间实现二层网络互联。

对站点间二层互联的业务功能基本要求如下:

·              站点相互独立:数据中心二层互联后,某个站点的故障(如广播风暴)不会传递到其他站点,站点内的拓扑互不影响和依赖。

·              传输无关性:对站点之间传输数据时使用的技术与站点位置、提供商的网络无特殊要求,尽量使用最通用的技术,例如只要求核心网络支持IP即可。

·              高可靠性:使用多归宿来提供冗余接入,并具有避免流量环路的机制。

·              链路使用效率:站点之间的流量必须得到充分的优化从而尽量节省带宽,在具有冗余链路时实现负载分担。

·              灵活性:数据中心互联不要依赖于站点的拓扑结构,不对站点拓扑结构有特定要求。

·              运营维护简单:站点互联使用的技术尽量简单,可以快速新增和减少站点。边缘设备上的配置要尽量简单,并且对站点现有的网络变动最小化,部署过程对流量转发不产生影响。

1.2  技术优点

SPB技术基于现有的服务提供商网络和企业网络,给分散的物理站点提供灵活的二层互联功能。其技术优点包括:

·              支持网络虚拟化

·              快速的业务部署和方便的网络维护:业务和核心网络分离,业务只需在边缘设备部署,核心网络增加新的链路和设备无需感知业务。

·              快速故障恢复能力:基于链路状态的基础网络协议可以提供快速的故障恢复能力。

·              支持双归属组网:传统交换机可以以冗余备份的方式接入SPB网络。

·              优化带宽利用:SPB基于等价路径的负载均衡技术、支持单播、组播最短路径转发,很好地优化了带宽利用。

·              SPB技术支持现有网络的平滑升级,无需升级硬件,且有丰富的配套协议标准。

SPB技术实现

2.1  概念介绍

2.1.1  术语介绍

·              核心边缘设备:BEBBackbone Edge Bridge,骨干网边缘网桥)是位于核心网边缘执行SPB功能的交换设备,它完成从用户网络到核心网络的报文封装,以及核心网络到用户网络的报文解封装。

·              核心设备:BCBBackbone Core Bridge,骨干网核心网桥)是骨干网络的核心设备,它负责按照B-MACB-VLAN转发M-in-M报文。BCB只需要转发报文和学习骨干网中的MAC地址,不需要学习用户网络中大量的MAC地址,从而降低了网络部署的成本,也为骨干网络提供了更好的可扩展性。

·              M-in-M报文:经过MAC-in-MAC封装的报文简称为MAC-in-MAC报文。

·              B-MAC/B-VLANBEB在对用户报文进行封装时,会为其添加运营商分配的MAC地址和VLAN。这个由运营商分配的MAC地址和VLAN就分别称为B-MACBackbone MAC,骨干网MAC)和B-VLANBackbone VLAN,骨干网VLAN)。在骨干网络中,BCB就是按照B-MACB-VLAN转发MAC-in-MAC报文。B-MAC包括源B-MAC和目的B-MACBEB在对用户报文进行封装时,会将自己的MAC地址作为源B-MAC、将PBBNProvider Backbone Bridge Network,运营商骨干桥接网)隧道目的端BEBMAC地址作为目的B-MAC进行封装。

·              骨干链路/接入链路:BEBBCB之间的链路对应的端口称为骨干链路,连接用户网络的链路为接入链路。来自用户网络的报文被封装成MAC-in-MAC报文后,会通过BEB相应的骨干链路转发出去;而来自骨干网络的MAC-in-MAC报文被解封装后,会按照用户MAC地址通过BEB相应的接入链路转发出去。

·              服务实例和I-SID:在骨干网络中,一个服务实例代表的一类业务或者用户,I-SIDBackbone Service Instance Identifier,骨干网服务实例编号)是该实例的唯一编号。

2.1.2  网络模型

SPB基于“MAC-in-MAC”的技术称为SPBMShortest Path Bridging MAC,最短路径桥MAC模式),用于实现基于Ethernet核心网络的L2VPN技术。SPB整体网络由核心网络和用户网络组成。用户网络是通过一台或者多台核心边缘设备连接到核心网络的具有独立业务功能的二层网络,通常由单个组织管理控制,主要由主机和交换设备组成,向核心边缘设备通告自身的MAC地址;核心网络由支持SPB IS-IS协议的交换设备组成,提供用户网络之间的二层互联。典型的SPB组网模型如下图所示。

图1 SPB网络模型

 

BCB一旦完成部署,可以不再变化,后续增加新业务时只需在边缘设备上部署即可。

用户网络可以用两种方式接入核心网络:VLAN接入和VPN接入。

图2 SPB接入方式

 

VLAN接入方式整网以VLAN规划用户,服务实例作为承载不同VLAN的管理域,在网络接入点部署服务实例和VLAN,核心节点无需部署,配置简单。

VPN接入方式BEB作为VPN的边缘,服务实例标识网络用户,不同用户从不同的物理端口接入核心网。在网络接入点部署服务实例和接入虚拟端口,核心节点无需部署,支持VLAN映射,多用户接入,配置比较繁琐。

2.2  运行机制

2.2.1  控制平面原理

SPB控制平面提供了一个非常简单的运维模式,只需要运行IS-IS一个协议,降低了部署开销。

1. 拓扑发现过程

图3 SPB协议运行网络

 

在最短路径树计算之前,需要先发现网络拓扑。IS-IS协议运行在SPB域的所有设备上,相互之间建立点到点的协议邻接关系,交换拓扑信息,每个设备节点都有一个节点ID用于拓扑发布,另外,每台设备都至少有一个B-MAC,作为其他设备通过SPB网络向它发送报文的目的地址。

2. B-VLANECT通告

SPB业务承载在指定的B-VLAN上,一个B-VLAN可以承载一种或多种业务。为实现不同业务间的负载均衡,每个B-VLAN都有唯一的指定的等价路径算法ECT,以实现不同的B-VLAN之间的负载分担。IS-IS协议通过IIH报文在邻居间交互B-VLANECT的对应关系,同时通过LSPLabel Switched Path,标签交换路径)在全网同步上述对应关系。

3. MAC地址通告

IS-IS协议只通告核心网络的B-MAC地址,用户网络的MAC地址只在核心边缘设备上学习,不向核心网络通告。

IS-IS协议在建立邻居关系后,在LSP报文中通告本地单播B-MAC地址,LSP在全网同步。IS-IS协议根据LSDBLink State Data Base,链路状态数据库)计算最短路径树,获得到各个设备节点的单播路径,并在本地下发MAC地址表项。

MAC地址的回收过程与上述过程类似,如果某个网络实体从网络中移除,网络上该网络实体的邻接设备会触发控制平面的IS-IS协议的MAC地址更新过程,从而其他所有的设备将删除该MAC地址。

4. 新业务发布

当需要部署新的业务时,核心网络边缘设备通过IS-IS协议发布B-MACI-SID信息,宣告本地为该I-SID的业务成员。本例中,B-VLAN10I-SID200,有3个节点在I-SID 200中有业务成员。

图4 SPB发布I-SID

 

B-MAC/I-SID信息的泛洪如下图所示。

图5 SPB B-MAC/I-SID泛洪

 

B-MAC/I-SID信息通过LSP泛洪后,VLAN 10内的每个节点根据IS-IS最短路径树计算后得到FDBForwarding Database,转发数据库),因此在B-VLAN中没有传统的MAC地址泛洪、学习机制,FDB完全来源于IS-IS协议。

2.2.2  数据平面原理

1. 单播流量

一旦核心网络设备控制平面建立了IS-IS邻居关系且交互MAC地址可达性信息之后,就可以在站点之间转发流量。对于站点内流量,边缘设备进行VLAN内源MAC地址学习,根据目的MAC地址二层查找MAC地址表,从相应的本地接口转发。如下图所示,主机1MAC1)向主机2MAC2)发送以太帧时,边缘设备从端口Eth1收到该以太帧后,学习MAC1Eth1端口,查找MAC地址表得到MAC2的出端口为Eth2,从端口Eth2发送以太帧。

图6 站点内二层流量转发

 

对于站点之间的二层流量转发则与传统的二层转发大不相同,如下图所示。

图7 站点间的二层流量转发

 

流量转发的处理步骤如下:

(1)      边缘设备收到以太帧之后,进行源MAC地址学习,根据端口+VLAN映射到相应的服务实例中进行查表转发,如果出接口为SPBM隧道,则根据服务实例与B-VLAN的映射关系,得到B-Tag

(2)      边缘设备将原始的以太帧进行MAC-In-MAC封装:外层以太头中的源MAC地址为边缘设备的MAC地址,目的MAC地址为隧道目的端BEBMAC地址,VLAN Tag为步骤(1)得到的B-Tag

(3)      边缘设备将封装后的报文从承载接口发送到核心网,最终到达异地站点的边缘设备。

(4)      异地站点的边缘设备对报文进行解封装,剥离外层以太头。

(5)      异地站点的边缘设备根据内层以太帧目的MAC地址进行查找,得到出接口为本地接口,并且从本地接口发送该以太帧,最终到达目的主机。

2. 组播流量

当位于相同VLAN的异地主机之间需要交互组播流量时,就需要在SPB网络上传输组播帧,边缘设备对组播帧的处理方式有两种:

·              头端复制模式:组播流在边缘设备进行复制,组播源所在站点的边缘设备单播发送组播帧到组播组成员所在的站点边缘设备。

·              核心复制模式:组播源所在站点边缘设备将组播流映射到核心网络组播树上,由核心网络进行组播帧复制,发送到组播成员所在站点的边缘设备。

用户可以根据组网及网络承载的组播流量的情况,选择边缘设备的组播报文复制模式。

头端复制模式如下图所示。

图8 组播流量模型(头端复制)

 

在核心复制模式下,I-SIDBEB的分布情况表明了其数据在SPBM网中的传播范围。例如下图设备ABC拥有服务实例100,构成服务实例100SPBM组播域。每个服务实例在每个BEB上拥有组播地址,会建立以该BEB为源的组播树,用于进行组播发送。

图9 组播流量模型(核心复制)

 

如上图所示,I-SID 100的成员设备A下挂有组播源,设备BC下分别有该组播源的接收者,核心设备IS-IS协议完成运算后会下发组播表项到芯片,组播流量沿着蓝色标示路径复制、转发到接收者。

3. 隧道封装格式

SPBM采用标准的802.1ah封装格式。BEB为进入SPB网络的报文完成隧道封装,添加B-MACB-VLANI-SID,发送到核心网。核心网上,SPBMB-VLANB-MAC进行报文转发,报文离开SPB网络时,由BEB剥离隧道封装,把原始报文交给异地的用户网络。

图10 SPBM数据帧封装格式

 

最终核心网络传输的报文长度增加了22字节,SPB解决方案没有定义路径MTU发现功能,部署SPB之前要保证核心网络的MTU大于隧道封装的最大帧长度。

2.2.3  双归属

站点通过边缘设备接入核心网络时,为了实现高可靠性,防止网络中设备的单点故障,通常实现两台边缘设备双归属方式接入核心网络。对于双归属的接入站点,可能会存在环路,如下图所示。

图11 双归属接入导致站点内环路

 

通过IRF技术将物理上的多台设备虚拟化成逻辑上的单台设备,将若干双归属的边缘设备进行IRF堆叠并配置跨框聚合解决环路问题,如下图所示。

图12 IRF堆叠实现双归属接入

 

2.2.4  VLAN映射

数据中心各个站点的VLAN部署规划可能不一致,相同的业务被部署到不同的VLAN中,但要在这些VLAN之间进行互通而不改变站点内部原有网络,从而必须在边缘设备规划VLAN映射功能。SPB通过在BEB上绑定用户VLANI-SID,使得用户VLAN可以分布在不同的站点,网络管理员只需在业务接入点BEB上完成配置,SPB网络就可以自动为用户建立基于VLAN的连接。以下网络中,VLAN 10映射到I-SID 100VLAN 20映射到I-SID 200

图13 VLANI-SID的映射

 

SPB部署参考

3.1  数据中心部署参考

大部分企业数据中心都是分层的网络结构,在每一层都进行冗余部署来防止设备级故障造成的流量中断,在汇聚层有大量的业务处理,如SLBFWIPS等,这些业务可能作为交换机槽位上的模块,也可能是一个独立的设备,并且也支持冗余部署,二层广播域与三层路由网络的边界位于汇聚层设备。

数据中心的网络拓扑与其物理空间一般高度保持一致的,企业在需要不同的地理位置部署多个数据中心时,一般为了高可靠性和动态的资源管理,每个数据中心的结构和业务逻辑相同或相近,以及其运行维护的工作也趋于一致。为了提供良好的伸缩性和灵活性,目前流行的部署方法是采用模块化的思路来进行,即将服务器及机架、接入层交换机、汇聚层交换机部署到同一个逻辑单元中,称为一个PODPoint of Device,装置终端),当数据中心需要扩容时,只需要增加相类似的POD即可。这些POD通过核心层设备互联或者连接到外部网络。

在部署SPB解决方案时要结合数据中心的拓扑结构特点进行,通用而标准的SPB部署模型如下图所示。

图14 数据中心SPB部署通用模型

 

虚拟交换机通过万兆链路二层接入,在接入层和汇聚层部署SPB交换机,最大可支持16条等价路径。

在数据中心添加独立的边缘层设备负责数据中心之间的二层互联,边缘层支持设备冗余以提升高可靠性。数据中心的多个POD的汇聚层设备通过二层链路连接到边缘设备,从而不同数据中心站点之间的POD之间形成大的二层转发域。

图15 数据中心互联模型

 

SPB做为数据中心互联技术,数据中心汇聚和边缘独立,DCI边缘设备为BEBBEB连接站点内多个汇聚区域,分配不同的服务实例,构建逻辑的小型二层网络。

3.2  多租户城域网部署参考

SPB网络可以为多租户提供连接服务,如教育、政府、消防、警务等,这些租户分布在一个城市的不同地点,在一张网络中提供服务。核心网络运行2个数据中心,并通过SPB网络透明互联,满足服务器虚拟化的要求。

所有部门共用一套骨干网络,但各部门只在他们自己的安全域中操作,部门间在不穿越位于数据中的防火墙的情况下不能互相通信。

图16 多租户网络部署模型

 

上图为一个城市公共部门网络举例,各部门位于同城异地,所有数据保存在两个数据中心,之间通过SPB骨干网络相连。SPB链路组成园区网络骨干,每个节点12台设备接入骨干网络,互联链路为裸纤、E-Line服务、CWDMDWDM或者其他的支持以太网帧传输的链路,两个数据中心部署虚拟化的服务器和存储设备,每个部门分配不同的服务实例,同一部门用户可以二层互访,不同部门相互隔离。如教育部门分配I-SID 20,只需在相关的接入设备上部署该I-SID,其他节点无需配置,教育部门使用I-SID 20标识的逻辑二层网络,泛洪流量不会到达无关的设备。

图17 多租户教育部门逻辑网络

 

附件下载

联系我们