14-以太网OAM配置
本章节下载: 14-以太网OAM配置 (202.36 KB)
目 录
以太网OAM(Operations, Administration and Maintenance,操作、管理和维护)是一种监控网络问题的工具。它工作在数据链路层,利用设备之间定时交互OAMPDU(OAM Protocol Data Units,OAM协议数据单元)来报告网络的状态,使网络管理员能够更有效地管理网络。
目前,以太网OAM主要解决在以太网接入的“最后一公里”常见的链路问题。通过在两个点到点连接的设备上启用以太网OAM功能,可以监控两台设备之间的链路状态。以太网OAM的主要功能包括:
l 链路性能监测:可以对链路故障进行检测;
l 故障侦测和告警:可以在链路出现故障时及时通知网络管理员;
l 环路测试:通过将非OAMPDU环回来检测链路故障。
在本文中,我们称使能了以太网OAM功能的端口为“以太网OAM实体”,也简称为“OAM实体”。
几种OAMPDU的具体格式如图1-1所示。
几个重要字段的含义如下:
l Dest addr:以太网OAM报文的目的MAC地址,为组播MAC地址0180c2000002。
l Source addr:以太网OAM报文的源MAC地址,为发送端的桥MAC地址,该地址是一个单播MAC地址。
l Type:以太网OAM报文的协议类型,为0x8809。
l Subtype:以太网OAM报文的协议子类型,为0x03。
l Flags:Flags域,包含了以太网OAM实体的状态信息。
l Code:本字段指明了OAMPDU的报文类型。0x00表示Information OAMPDU、0x01表示Event Notification OAMPDU、0x04表示Loopback Control OAMPDU。
以下是几种常用的OAMPDU报文的作用:
l Information OAMPDU
Information OAMPDU报文用于将以太网OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端的以太网OAM实体,保持以太网OAM连接。
l Event Notification OAMPDU
Event Notification OAMPDU(事件通知OAMPDU)报文一般用于链路监控,是用于对连接本端和远端以太网OAM实体的链路发生的故障进行告警。
l Loopback Control OAMPDU
Loopback Control OAMPDU(环路控制OAMPDU)报文主要用于远端环回控制,环回控制OAMPDU报文用来控制远端设备的OAM环回状态,该报文中带有使能或去使能环回功能的信息,根据该信息开启或关闭远端环回功能。
以太网OAM的基本操作包括:
l 建立以太网OAM连接
l 链路监控
l 远端故障检测
l 远端环回
以太网OAM功能是在建立以太网OAM连接的基础上进行的,下面对以太网OAM的工作流程做个简要介绍。
以太网OAM连接过程也称作Discovery阶段,本阶段是OAM实体发现远端设备的OAM实体,并与之建立稳定对话的过程。
在这个阶段中,相连的以太网OAM实体(即使能OAM功能的端口)通过交互Information OAMPDU向对端通报各自的以太网OAM配置信息及本地节点支持的以太网OAM能力信息,OAM实体收到对端配置参数后,决定是否同意建立OAM连接。如果两端的以太网OAM对Loopback功能、单向链路检测及链路事件的配置都通过检查时,以太网OAM协议将在链路层开始正常工作。
设备可以选择两种模式来进行以太网OAM的连接:主动模式、被动模式。两种模式下设备的处理能力的比较如表1-1所示。连接过程只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待对端OAM实体的连接请求。
处理能力 |
主动模式 |
被动模式 |
初始化以太网OAM Discovery过程 |
可以 |
不可以 |
对以太网OAM Discovery初始化过程的响应 |
可以 |
可以 |
发送Information OAMPDU |
可以 |
可以 |
发送Event Notification OAMPDU |
可以 |
可以 |
发送不携带TLV的Information OAMPDU |
可以 |
可以 |
发送Loopback Control OAMPDU |
可以 |
不可以 |
对Loopback Control OAMPDU的响应 |
可以,但需要对端也处于主动模式下 |
可以 |
发送组织指定的OAMPDU |
可以 |
可以 |
以太网OAM连接建立后,两端的OAM实体通过发送Information OAMPDU保持连接。若在5秒钟内没有收到对端OAM实体的Information OAMPDU,则认为连接超时,需要重新建立OAM连接。
Information OAMPDU报文的发送由内部计数器控制,一秒钟内最多能够发送10个。
链路监控用于各种环境下检测和发现链路层的故障。
以太网OAM利用Event Notification OAMPDU的交互来进行链路监控。当链路故障发生时,本地链路监控到故障后,将向对端以太网OAM实体发送Event Notification OAMPDU,通报一般链路事件。管理员可以通过链路监控过程动态地掌握网络的状况。一般链路事件的定义如下:
表1-2 一般链路事件
一般链路事件 |
定义 |
错误信号事件 |
单位时间内的错误信号数量超过定义的阈值 |
错误帧事件 |
单位时间内的错误帧数量超过定义的阈值 |
错误帧周期事件 |
指定帧数N为周期,在收到N个帧的周期内错误帧数超过定义的阈值 |
错误帧秒数事件 |
指定M秒数下有错误帧的秒数超过了定义的阈值 (错误帧秒的定义:在某一秒内发生了错误帧,则该秒为错误帧秒) |
以太网的故障检测是非常困难的,特别是网络物理通信没有中断而网络性能缓慢下降的情况。OAMPDU定义了一个标志(Flag域)允许以太网OAM实体把该故障信息传送给对端。该标志可以表示下列紧急链路事件:
l 链路故障(Link Fault):对端链路信号丢失。
l 致命故障(Dying Gasp):不可预知的状态发生,比如电源中断。
l 紧急事件(Critical Event):不能确定的紧急事件发生。
以太网OAM连接过程中是不断的发送Information OAMPDU的,本端OAM实体可以将本端发生的紧急链路事件信息通过Information OAMPDU告诉远端OAM实体。这样,管理员可以动态地了解链路的状态,对相应的错误及时进行处理。
远端环回只有在以太网OAM连接建立完成后才能实现。在连接建立的情况下,主动模式的OAM实体发起远端环回命令,对端实体对该命令进行响应。当远端处于环回模式下,除了OAMPDU报文以外的所有报文都将按照原路返回。
定期地进行环回检测可以及时发现网络故障,并通过分段环回检测来帮助定位故障发生的具体区域,可以帮助用户排除故障。
表1-3 以太网OAM配置任务简介
配置任务 |
说明 |
详细配置 |
配置以太网OAM基本功能 |
必选 |
|
配置各一般链路事件的周期和阈值 |
可选 |
|
配置以太网OAM远端环回功能 |
可选 |
表1-4 配置以太网OAM基本功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入二层以太网端口视图 |
interface interface-type interface-number |
- |
设置以太网端口的以太网OAM工作模式 |
oam mode { active | passive } |
可选 缺省情况下,以太网OAM的工作模式为主动模式 |
使能以太网端口的以太网OAM功能 |
oam enable |
必选 缺省情况下,以太网OAM功能关闭 以太网OAM功能使能后,以太网端口开始使用预设的模式同对端建立以太网OAM连接 |
l 以太网OAM连接只能由active模式的以太网OAM实体发起,而passive模式的以太网OAM实体只能等待对端以太网OAM实体的连接请求。
l 两个passive模式的以太网OAM实体之间是无法建立以太网OAM连接的。
l 当以太网OAM功能使能后(即输入oam enable之后),不能更改以太网OAM的工作模式。如果需要更改工作模式,需要先将以太网OAM功能关闭,再更改工作模式。
l 在oam errored-symbol period所配置的检测周期结束时,如果该周期内某个以太网端口上所发生的错误信号数大于或等于oam errored-symbol threshold所设定的阈值,则在该以太网端口上会产生一个错误信号事件。
l 在oam errored-frame period所配置的检测周期结束时,如果该周期内某个以太网端口上所发生的错误帧数大于或等于oam errored-frame threshold所设定的阈值,则在该以太网端口上会产生一个错误帧事件。
l 系统会将oam errored-frame-period period所配置的周期转换为某端口在该周期内能发送的64字节帧的最大帧数,即以最大帧数作为周期,计算公式为:最大帧数=接口带宽(bps)*配置的周期值(ms)/(64*8*1000)。在所配置的检测周期结束时,如果该周期内某个以太网端口上所发生的错误帧数大于或等于oam errored-frame-period threshold所设定的阈值,则在该以太网端口上会产生一个错误帧周期事件。
l 在oam errored-frame-seconds period所配置的检测周期结束时,如果该周期内某个以太网端口上所发生的错误帧秒数大于或等于oam errored-frame-seconds threshold所设定的阈值,则在该以太网端口上会产生一个错误帧秒事件(错误帧秒的定义:在某一秒内发生了错误帧,则该秒为错误帧秒)。
表1-6 配置以太网OAM远端环回功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
进入以太网接口视图 |
interface interface-type interface-number |
- |
使能端口的以太网OAM远端环回功能 |
oam loopback |
必选 缺省情况下,没有使能以太网OAM远端环回功能 |
l 目前只有1000M的以太网端口(不包括安装电口模块的SFP端口)支持OAM远端环回功能,且当该端口的速率被设置为1000Mbit/s、100Mbit/s、10Mbit/s时,均可以支持OAM远端环回功能。
l 远端环回功能只有在以太网OAM连接建立完成后才能实现。
l 只有主动模式的以太网OAM实体才可以发起远端环回。
l 以太网OAM远端环回需要远端硬件的支持,如果远端硬件不支持,会提示用户。
l 由于远端环回主要检测单条链路,所以聚合端口下不支持以太网OAM远端环回,如果在聚合端口下启动以太网OAM远端环回,会提示错误;以太网OAM远端环回过程中的端口也不能参加聚合。
l 当开启以太网OAM远端环回功能时,会引起所有数据流量中断;在退出以太网OAM远端环回以后,端口会进行一次先关闭再开启的操作。导致端口退出以太网OAM远端环回的原因包括:运行undo oam enable命令关闭端口的以太网OAM功能、运行undo oam loopback命令关闭端口的以太网OAM远端环回功能以及OAM连接超时等。
在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。
在用户视图下执行reset命令可以清除以太网OAM报文统计信息和一般链路事件统计信息。
表1-7 以太网OAM显示和维护
操作 |
命令 |
显示以太网OAM全局配置信息 |
display oam configuration |
显示以太网OAM连接建立后紧急链路事件的统计信息 |
display oam critical-event [ interface interface-type interface-number ] |
显示以太网OAM连接建立后或清除统计信息后一般链路事件的统计信息 |
display oam link-event { local | remote } [ interface interface-type interface-number ] |
显示以太网OAM连接的相关信息 |
display oam { local | remote } [ interface interface-type interface-number ] |
清除以太网OAM报文统计信息和一般链路事件统计信息 |
reset oam [ interface interface-type interface-number ] |
l 通过在Device A和Device B上配置以太网OAM协议,从而对数据链路层进行管理;
l 验证链路的性能,测试用户Host接入的设备Device A上收到错误帧的情况。
图1-2 以太网OAM典型配置组网图
(1) 配置Device A
# 在端口Ethernet1/0/1上,配置其以太网OAM的连接模式为passive模式,并使能以太网OAM功能。
<DeviceA> system-view
[DeviceA] interface ethernet 1/0/1
[DeviceA-Ethernet1/0/1] oam mode passive
[DeviceA-Ethernet1/0/1] oam enable
[DeviceA-Ethernet1/0/1] quit
#配置错误帧事件的检测周期为20秒,检测阈值为10。
[DeviceA] oam errored-frame period 20
[DeviceA] oam errored-frame threshold 10
(2) 配置Device B
# 配置端口Ethernet1/0/1的以太网OAM工作模式为缺省模式active,并使能以太网OAM功能。
<DeviceB> system-view
[DeviceB] interface ethernet 1/0/1
[DeviceB-Ethernet1/0/1] oam mode active
[DeviceB-Ethernet1/0/1] oam enable
[DeviceB-Ethernet1/0/1] quit
(3) 检验配置效果
通过使用display oam configuration命令可以查看以太网OAM的配置信息,例如:
# 查看Device A上以太网OAM的配置信息。
[DeviceA] display oam configuration
Configuration of the link event window/threshold :
--------------------------------------------------------------------------
Errored-symbol Event period : 1
Errored-symbol Event threshol : 1
Errored-frame Event period : 20
Errored-frame Event threshold : 10
Errored-frame-period Event period : 1000
Errored-frame-period Event threshold : 1
Errored-frame-seconds Event period : 60
Errored-frame-seconds Event threshold : 1
通过使用display oam link-event命令可以查看以太网OAM的一般链路事件统计信息,例如:
# 查看Device B上以太网OAM的一般链路事件的统计信息。
[DeviceB] display oam link-event remote
Port :Ethernet1/0/1
Link Status :Up
OAMRemoteErrFrameEvent : (ms = milliseconds)
---------------------------------------------------------------------
Event Time Stamp : 5789 Errored FrameWindow : 10(100ms)
Errored Frame Threshold : 1 Errored Frame : 3
Error Running Total : 35 Event Running Total : 17
上面的显示信息表明:从Device A开始运行起,总共发生了35次错误,其中错误帧事件有17次,链路的性能不稳定。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!