国家 / 地区

MPLS及LDP协议基础

\贾欣武

1      MPLS基础

1.1      MPLS的产生及现状

MPLS概念的最初提出是为了提高转发效率。因为当时IP转发大多靠软件进行,在转发的每一跳都要进行至少一次最长匹配查找,操作复杂导致转发速度比较慢。有些厂商借鉴ATM的转发方式来简化IP转发过程,由此产生了一种结合IPATM的优势于一身的新技术——MPLS。在当时的条件下这可以说是一个很大的创举,其优势也是显而易见的,但后来IP转发领域有很多新技术产生,如硬件转发与网络处理器的出现,导致MPLS的速度优势体现不出来,纯MPLS转发在实际应用中几乎没有用武之地。

MPLS是一个很有潜力的技术,可灵活扩展。很多新的应用依靠纯IP转发实现起来有很大的难度,但用MPLS再结合其它技术就可以实现,如:BGP/MPLS VPN、流量工程等技术的产生就是对MPLS灵活扩展的结果。当前,MPLS越来越受重视,成为当今网络技术的热点,还有一些新的应用需求也正在利用MPLS来实现。

1.2      MPLS相关概念

1.2.1  Label

即标签,在帧模式链路上,Label位于二层头与IP报文之间,一个Label头的结构如下:

1 标签格式

Label:标签值,长度为20bit,标签值是标签转发表的关键索引

Exp: 用于QoS,长度为3bit,作用与Ethernet802.1p值相似

S   栈底标识,长度为1bit,如果有多个Label时,在栈底的LabelS位置1,其它为0。只有一个LabelS位置1

TTL 存活时间,8bit,与IP报文中的TTL值相似,这个值从IP报文头的TTL域拷贝过来,每进行一次Label交换时,外层LabelTTL值就减1

需要注意的是一个MPLS报文可以有多个Label,靠近二层头的Label为栈顶Label,靠近IP报文的Label为栈底LabelLSR执行Label交换时总是基于栈顶Label。有多个Label时,每个Label都包括以上完整的32bit,并不是其它的Label只包括20bitLabel值,如下图所示:

2 多层标签

1.2.2 LSRLabel Switching Router

采用标签交换转发报文的路由器。

1.2.3 LERLabel Edge Router

标记边缘路由器,处在MPLS网络的边缘,负责将进入MPLS网络的报文或帧对应到具体的FEC并打上Label,变成MPLS帧转发;将离开MPLS网络的帧去掉Label还原成原来的报文或帧再查找相应的转发表转发。

1.2.4 FECForwarding Equivalence Class

LSR认为具有相同转发处理方式的报文,使用同一个标签来标记这些报文。如:匹配相同目的IP前缀的多个IP报文可属于一个FEC,由于这些报文在做IP转发时是相同的转发处理方式及路径,所以标记这些报文的时候用同一个标签。

1.2.5 PUSH(加标签)

在第一跳Ingress LER上在报文的二层头和三层头之间插入Label,或者中间LSRMPLS报文的标签栈顶增加新的Label

1.2.6 POP(弹出标签)

在最后一跳Egress LER上将报文中的Label全部去掉,还原成IP报文,或者中间LSR去掉栈顶标签减少标签栈层次。

1.2.7 SWAP(交换标签)

在转发的过程中根据标签转发表中的LSP替换报文中栈顶Label的过程。

1.2.8 LSPLabel Switched Path

标记转发路径,也就是转发MPLS报文的路径。

1.3      MPLS转发方式

MPLS技术综合了第二层交换和第三层路由的功能,将第二层的快速交换和第三层的路由有机地结合起来。MPLS网络边缘的LER主要完成以下工作:三层路由、分析IP包头用于决定对应的FEC和标签交换路径(LSP),进而标记报文。而在MPLS网络核心的LSR采用基于标签的第二层交换,工作相对较简单。从这里就可以看出MPLS的好处,虽然处在MPLS网络边缘的LER工作较复杂,但处在核心的LSR只需要像FRATM交换机那样执行二层交换就可以了,根本不需要最长匹配和多次查找。

典型的MPLS转发过程如下:

Step 1 所有LSR启用传统路由协议(OSPFIS-IS等),在LSR中建立IP路由表

Step 2 LDP结合IP路由表来建立LSP

Step 3 Ingress LER接收IP包,分析IP包头并对应到FEC,然后给IP包加上标记,根据标签转发表中的LSP将已标记的报文送到相应的出接口。

Step 4LSR收到带有标记的报文,将只分析标记头,不关注标记头之上的部分,根据Label头查找LSP,替换Label,送到相应的出接口

……………..(中途转发过程与Step 4类似)

Step n-1:倒数第二跳LSR收到带有标记的报文,查找标记转发表,发现对应的出口标签为隐式空标签或显式空标签,弹出标签,发送IP报文到最后一跳LSR

Step n:在最后一跳Egress LER上执行三层路由功能,根据报文的目的IP地址转发

 

2      LDP协议初步

LDP协议在[RFC 3036]中详细定义,LDP的协议报文除Hello报文基于UDP外,其它报文都是在TCP之上,端口号为646。当发生传输丢包时,能够利用TCP协议提供错误指示,实现快速响应和恢复。与BGP相似,这种基于TCP的可靠连接使得协议状态机较为简单。

2.1      报文格式

2.1.1 LDP PDU 头部

 

3 LDP PDU 头部

版本号:16bit,目前LDP只有一个版本,版本号始终为1

PDU长度:16bit,值为LDP PDU头部以后的数据部分的长度,不包括LDP PDU头部;

LDP Id长度为48bit,前32bitLSR-ID,后16bit为标记空间标志,全局空间为“0”,局部接口空间为“1”。如:收到的LDP PDU中的LDP-ID192.168.1.2:0,表示对方的LSR-ID192.168.1.2,标签空间为全局空间。

2.1.2 LDP 消息格式

4 LDP消息格式

U:这一位总是为“0”,代表可识别的消息,为“1”代表不可识别的消息;

类型域:协议根据这个域识别不同的消息;

长度域:指示出长度域之后的数据部分的长度;

消息ID:用来唯一地标识这个消息,如果消息为Notification,则ID与导致产生Notification的消息ID相关联。

2.2      消息种类

按照功能分类,LDP协议中总共有四类消息

邻居发现消息:在启用LDP协议的接口上周期性发送该消息

Ø  Hello消息

会话建立和维护消息:用来建立和维护LDP会话

Ø  Initialization消息

Ø  KeepAlive消息

标签分发消息:用来请求、通告及撤销标签绑定

Ø  Address message

Ø  Address Withdraw message

Ø  Label request message

Ø  Label mapping message

Ø  Label withdraw message

Ø  Label release message

Ø  Label abort request message

错误通知消息:用来提示LDP对等体在会话过程中的重要事件

Ø  Notification消息

2.3      LDP相关概念

2.3.1 标签空间

可分为全局标签空间和接口标签空间,全局标签空间表示LSR为特定目的地的FEC产生唯一的Label,接口标签空间表示LSR在每个接口上为特定目的地的FEC产生唯一的Label。在帧模式的链路上为全局标签空间,在信元模式的链路上为接口标签空间。LDP报文中的LDP-ID域中指示出标签空间值。

 

2.3.2 上游和下游LSR

5 /下游定义

如图所示,对于某FEC(图示中的IPv4前缀)来说,CB的下游路由器,AB的上游路由器

2.3.3 倒数第二跳弹出(Penultimate Hop Popping)

在实际应用当中(如MPLS VPN),对于Egress LSR在弹出最外层Label后还需要进行其它较复杂的三层工作。而事实上最外层标签的作用在MPLS VPN的应用中只是为了将报文送到Egress LSR。因此,在倒数第二跳LSR已知报文下一跳的情况下,可以将最外层的标签弹出后转发到最后一跳LER,而不必进行标签替换。这样使得最后一跳LSR的工作相对简单了一些。因此在 [RFC 3032] 中规定,最后一跳LSR发给倒数第二跳LSR的标签为隐式空标签“3”。据此,收到标签“3”的上游LSR就知道自己是该FEC的倒数第二跳,就知道自己在用该LSP转发Label报文时,应执行倒数第二跳弹出。

6 倒数第二跳弹出

2.4      标签分发方式

2.4.1 DUDownstream Unsolicited

下游LSR如果工作在DU方式(下游主动分发)下将根据某一触发策略向上游LDP邻居主动分发标签。下图中LSR-C标签分发触发策略是为直连32位掩码的路由分配标签,因此LSR-C通过Label mapping message向上游LDP邻居主动通告自己的直连路由172.16.1.1/32的标签,Comware系统缺省工作在DU方式。

7 下游主动分发

2.4.2 DODDownstream On Demand

下游LSR如果工作在DOD方式(下游按需分发)下,只有在接收到上游LDP邻居的Label request message后才回应Label mapping message分发标签(针对标记请求消息所指定的FEC)。下图中LSR-C工作在DOD模式下,LSR-A的触发策略生效(LSR-A转发到172.16.1.0/24的报文流量达到设定阀值)后将向172.16.1.0/24的下游发送标记请求消息Label request message(请求172.16.1.0/24的标签)。最终LSR-C收到请求,发送Label mapping message响应。

8 下游按需分发

2.5      标签控制方式

2.5.1 独立控制方式(Independent

LSR如果工作在独立控制方式下,如果标签分发方式是DU,即使在没有获得下游标签的情况下也会直接向上游分发标签。在标签控制的方式上显得很独立,不依赖下游LSR;如果标签分发方式是DOD,发送标签请求的LSR的直连上游LSR会直接回应标签,而不必等待来自最终下游的标签。

9 独立控制方式

在上图中,在LSR-B上采用独立控制方式。LSR-B路由表中有172.16.1.0/24的路由,但没有收到下游来的标签绑定。由于LSR-B工作于独立控制方式,所以对路由表中的所有路由都向上游发送标签。继而,无论LSR-A工作在独立模式还是有序模式,将向上游继续发送标签。这时,如果有目的IP172.16.1.0/24的报文进入LSR-A,它将采用MPLS转发。但数据到LSR-B后,由于没有关联172.16.1.0/24LSP,所以采用传统IP转发。

2.5.2 有序控制方式(Odered

LSR如果工作在有序控制方式下,如果标签分发模式为DU,则只有收到下游LSR分发的标签时才会向自己的上游LSR通告标签,如果没有收到下游的标签映射则不向上游LSR通告。Comware系统缺省工作在有序方式。

10 有序控制方式

在上图中,LSR-B路由表中有172.16.1.0/24的路由,但由于LSR-B没有收到下游的标签且工作在有序模式,因而不向上游通告关于172.16.1.0/24Label。如果LSR-A收到目的IP172.16.1.0/24的报文将采用传统IP转发。可以看出,在有序控制方式下,是否向上游LSR分发标签取决于自己是否收到下游LSR的标签。

 

2.6      标签保留方式

2.6.1 自由保留模式(Liberal retention mode

收到无效的Label通告后(没有对应的IP路由或路由通告与Label通告的下一跳不一致),虽然不生成LSP,但在标签绑定表里存储,并且LSR向上游通告其它FECLabel绑定时也不占用这些标签,这种方式的优点是LSR应对网络拓扑变化的响应较快,缺点是浪费标签,所有不能生成LSPLabel通告都需要保留。

11 自由保留模式

在上图中LSR-A工作于自由保留方式,对于FEC172.16.1.0/24将生成下一跳为LSR-BLSPLSR-C发来的Label通告将保留。如LSR-ALSR-B之间的直连链路down掉,对于FEC172.16.1.0/24的将很快生成下一跳为LSR-CLSP

2.6.2 保守保留模式(Conservative retention mode

工作于保守保留模式的LSR收到无效的Label通告后将不存放到标签绑定表里,在向上游通告Label时可以自由使用这些标签。保守保留模式的缺点是对拓扑变化的响应较慢,优点是节省标签。

12 保守保留模式

在上图中,LSR-A工作于保守保留模式,对于FEC172.16.1.0/24将生成下一跳为LSR-BLSPLSR-C发来的Label通告将不保留。如LSR-ALSR-B之间的直连链路down掉,对于FEC172.16.1.0/24将不能很快生成下一跳为LSR-CLSP

2.7      LDP会话建立过程

下图中用一个示例来演示LDP会话建立过程:

Step 1 :互发Hello消息,Hello消息中包括LDP-IDTransport Address。双方将用Transport Address建立LDP会话,收到Hello消息后再进一步比较Transport Address确定由谁作为主动方发起TCP连接。Transport Address大的一方将作为主动方发起TCP连接。被动方等待对方发起连接。在下图中将由LSR-B作为主动方发起TCP连接。

Step 2 TCP连接完成后由LSR-B发送Initialization消息来协商参数,包括:LDP协议版本、Label分发方式、HoldTime、接收者的LSR-ID等。

Step 3:如果接收InitializationLSR-A发觉对方的参数自己不能接受,则发送Notification消息结束会话:否则的话由LSR-A回应Initialization消息同时也发KeepAlive消息,两个消息可以在一个报文中同时携带。

Step 4:如果LSR-B接受Initialization消息中携带的参数则发送KeepAliveLDP会话成功建立。可以在同一个报文中携带KeepAlive消息和其它Session消息,如Address消息和Label mapping消息。

报文交互过程如下:

13 LDP会话建立过程

在此过程中,LSR检测到任何错误都会发Notification报文关闭连接。

2.8      状态机描述

1NON EXISTENT状态:该状态类似BGPIdle状态,为LDP会话的最初状态。在此状态双方发送Hello消息,选举主动方,在收到TCP连接建立成功事件的触发后变为INITIALIZED状态。

2INITIALIZED状态:在该状态下分主动方与被动方两种情况,主动方将发送Initialization报文,转向OPENSENT状态,等待回应的Initialization消息;被动方在此状态等待主动方发给自己Initialization消息,如果收到的Initialization报文的参数可接收,则发送InitializationKeepAlive转向OPENREC状态。主动方和被动方在此状态下收到任何非Initialization消息或等待超时,都会转向NON EXISTENT状态。

3OPENSENT状态:此状态为主动方发送Initialization报文后的状态,在此状态等待被动方回答Initialization消息和KeepAlive消息,如果收到的Initialization消息中的参数可以接受则转向OPENREC状态;如果参数不能接受或Initialization消息超时则断开TCP连接转向NON EXISTENT状态。

4OPENREC状态:在此状态不管主动方还是被动方都是发出KeepAlive后的状态,在等待对方回应KeepAlive,只要收到KeepAlive消息就转向OPERATIONAL状态;如果收到其它消息或者KeepAlive超时,则转向NON EXISTENT状态。

5OPERATIONAL状态:它是LDP Session成功建立的标志。在此状态下可以发送和接收所有其它的LDP消息。在此状态如果KeepAlive超时或者收到致命错误的Notification消息(Shutdown消息)或者自己主动发送Shutdown消息主动结束会话,都会转向NON EXISTENT状态。

14 LDP协议状态机

感谢您对本刊物的关注,如果您在阅读时有何感想,请点击反馈。