选择区域语言: EN CN HK

10 可靠性配置指导

02-以太网OAM配置

本章节下载  (265.15 KB)

docurl=/cn/Service/Document_Software/Document_Center/Switches/Catalog/CE3000/CE3000-EI/Configure/Operation_Manual/H3C_CE3000-32F-EI_CG-Release_1211-6W100/10/201107/721446_30005_0.htm

02-以太网OAM配置


1 以太网OAM配置

1.1  以太网OAM简介

1.1.1  以太网OAM产生背景

以太网技术自诞生起,以其简单易用、价格低廉等特点逐步成为局域网的主导技术。近年来,随着千兆、万兆以太网技术的相继应用,以太网已经向城域网和广域网方向扩展。

由于以太网最初主要应用于局域网,而局域网对可靠性和稳定性的要求都较低,因此以太网一直缺乏有效的管理维护机制,这已成为以太网应用于城域网和广域网的严重障碍。因此,在以太网上实现OAM(Operation, Administration and Maintenance,操作、管理和维护)成为必然的发展趋势。以太网OAM是一种监控网络故障的工具,目前主要用于解决以太网接入“最后一公里”中常见的链路问题。用户通过在两个点到点连接的设备上启用以太网OAM功能,可以监控这两台设备之间的链路状态。

1.1.2  以太网OAM主要功能

以太网OAM能够有效提高以太网的管理和维护能力,保障网络的稳定运行,其主要功能包括:

l              链路性能监测:对链路的各种性能进行监测,包括对丢包、时延和抖动等的衡量,以及对各类流量的统计;

l              故障侦测和告警:通过发送检测报文来探测链路的连通性,当链路出现故障时及时通知网络管理员;

l              环路测试:通过监测所发出报文的返回情况来检测链路质量和定位链路故障。

1.1.3  以太网OAM协议报文

以太网OAM工作在数据链路层,其协议报文被称为OAMPDU(OAM Protocol Data Units,OAM协议数据单元)。以太网OAM就是通过设备之间定时交互OAMPDU来报告链路状态,使网络管理员能够对网络进行有效的管理。

图1-1 常见的OAMPDU报文

 

图1-1所示,是几种常见OAMPDU的报文格式,各重要字段的含义如表1-1所示。

表1-1 OAMPDU重要字段含义

字段

含义

Dest addr

以太网OAM报文目的MAC地址,为慢协议组播地址:0x0180-C200-0002。由于慢协议报文不能被网桥转发,因此以太网OAM报文也不能被转发

Source addr

以太网OAM报文源MAC地址,为发送端的桥MAC地址,是一个单播MAC地址

Type

以太网OAM报文的协议类型,为0x8809

Subtype

以太网OAM报文的协议子类型,为0x03

Flags

Flag域,包含了以太网OAM实体的状态信息

Code

OAMPDU报文的类型

 

我们称使能了以太网OAM功能的端口为“以太网OAM实体”,简称“OAM实体”。

 

图1-1中几类OAMPDU报文的作用如表1-2所示。

表1-2 各类OAMPDU报文的作用

报文类型

中文含义

作用

Information OAMPDU

信息OAMPDU

用于将OAM实体的状态信息(包括本地信息、远端信息和自定义信息)发给远端OAM实体,以保持以太网OAM连接

Event Notification OAMPDU

事件通知OAMPDU

一般用于链路监控,对连接本端和远端OAM实体的链路上所发生的故障进行告警

Loopback Control OAMPDU

环回控制OAMPDU

主要用于远端环回控制,用来控制远端设备的OAM环回状态,该报文中带有使能或去使能环回功能的信息,根据该信息开启或关闭远端环回功能

 

1.1.4  以太网OAM工作流程

以太网OAM功能建立在以太网OAM连接的基础上,下面对以太网OAM的工作流程进行简要介绍。

1. 建立以太网OAM连接

以太网OAM连接的建立过程也称为Discovery阶段,即本端OAM实体发现远端OAM实体、并与之建立稳定对话的过程。

在这个过程中,相连的OAM实体通过交互Information OAMPDU通报各自的以太网OAM配置信息和本端支持的以太网OAM能力信息。当OAM实体收到对端的配置参数后,决定是否建立OAM连接。当两端OAM实体对Loopback功能、单向链路检测及链路事件等配置信息的检查都通过之后,以太网OAM协议开始正常工作。

以太网OAM的连接模式有两种:主动模式和被动模式,在这两种模式下设备的处理能力如表1-3所示。

表1-3 主动模式与被动模式的处理能力比较

处理能力

主动模式

被动模式

初始化以太网OAM Discovery过程

可以

不可以

对以太网OAM Discovery初始化过程的响应

可以

可以

发送Information OAMPDU

可以

可以

发送Event Notification OAMPDU

可以

可以

发送不携带TLV的Information OAMPDU

可以

可以

发送Loopback Control OAMPDU

可以

不可以

对Loopback Control OAMPDU的响应

可以,但需要对端为主动模式

可以

 

l          以太网OAM连接只能由主动模式的OAM实体发起,而被动模式的OAM实体只能等待对端OAM实体的连接请求。

l          都处于被动模式下的两个OAM实体之间无法建立以太网OAM连接。

 

以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到对端OAM实体发来的Information OAMPDU,则认为OAM连接中断。

2. 链路监控

以太网的故障检测非常困难,特别是在网络物理通信没有中断而网络性能缓慢下降的情况下。链路监控用于在各种环境下检测和发现链路层故障,以太网OAM通过交互Event Notification OAMPDU来监控链路:当一端OAM实体监控到一般链路事件(其所含类型如表1-4所示)时,将向其对端发送Event Notification OAMPDU以进行通报,管理员可以通过观察日志信息动态地掌握网络的状况。

表1-4 一般链路事件

事件类型

描述

错误信号事件(Errored Symbol Event)

单位时间内的错误信号数量超过定义的阈值

错误帧事件(Errored Frame Event)

单位时间内的错误帧数量超过定义的阈值

错误帧周期事件(Errored Frame Period Event)

指定帧数N为周期,在收到N个帧的周期内错误帧数超过定义的阈值

错误帧秒数事件(Errored Frame Seconds Event)

指定M秒数下有错误帧的秒数超过了定义的阈值

 

l          错误帧周期事件的检测周期将被系统转换为某端口在该周期内能发送64字节帧的最大帧数,即以最大帧数作为周期,其计算公式为:最大帧数=接口带宽(bps)×错误帧周期事件的检测周期(ms)÷(64×8×1000)。

l          错误帧秒:如果在某一秒内发生了错误帧,则将该秒称为错误帧秒。

 

3. 远端故障检测

在以太网OAM连接已建立的情况下,两端的OAM实体会不断交互Information OAMPDU。当设备故障或不可用导致流量中断时,故障端OAM实体会通过Information OAMPDU中的Flag域将故障信息(即紧急链路事件类型)通知给对端OAM实体。这样,管理员可以通过观察日志信息动态地了解链路状态,对相应的错误及时进行处理。紧急链路事件的类型及其对应的Information OAMPDU发送频率如表1-5所示。

表1-5 紧急链路事件

事件类型

描述

OAMPDU发送频率

链路故障(Link Fault)

对端链路信号丢失

每秒发送一次

致命故障(Dying Gasp)

不可预知的状态发生,比如电源中断

不间断发送

紧急事件(Critical Event)

不能确定的紧急事件发生

不间断发送

 

CE3000-32F-EI交换机对收发携带有紧急链路事件的Information OAMPDU的支持情况如下:

l          支持接收携带以上三种类型紧急链路事件的Information OAMPDU。

l          仅千兆光口支持发送携带链路故障事件的Information OAMPDU。

l          仅支持在设备重启或端口被shutdown时发送携带致命故障事件的Information OAMPDU,但IRF物理端口不支持发送该报文。

l          不支持发送携带紧急事件的Information OAMPDU。

 

4. 远端环回

远端环回是指主动模式下的OAM实体向对端(远端)发送除OAMPDU以外的所有其它报文时,对端收到报文后不按其目的地址进行转发,而是将其按原路返回给本端。远端环回只有在以太网OAM连接建立之后才能实现。

远端环回功能可用于检测链路质量和定位链路故障。定期进行环回检测可以及时发现网络故障,并可通过分段环回检测来定位故障发生的具体区域。

1.1.5  协议规范

与以太网OAM相关的协议规范有:

l              IEEE 802.3ah:Carrier Sense Multiple Access with Collision Detection (CSMA/CD) Access Method and Physical Layer Specifications

1.2  以太网OAM配置任务简介

表1-6 以太网OAM配置任务简介

配置任务

说明

详细配置

配置以太网OAM基本功能

必选

1.3 

配置以太网OAM连接检测定时器

可选

1.4 

配置一般链路事件的检测参数

配置错误信号事件的检测参数

可选

1.5.1 

配置错误帧事件检测参数

可选

1.5.2 

配置错误帧周期事件检测参数

可选

1.5.3 

配置错误帧秒数事件检测参数

可选

1.5.4 

配置以太网OAM远端环回功能

使能以太网OAM远端环回功能

可选

1.6.1 

拒绝对端发起的以太网OAM远端环回

可选

1.6.2 

 

1.3  配置以太网OAM基本功能

以太网OAM的连接模式分为主动和被动模式,当使能了以太网OAM功能之后,以太网端口开始使用预设的连接模式与其对端端口建立以太网OAM连接。

表1-7 配置以太网OAM基本功能

操作

命令

说明

进入系统视图

system-view

-

进入以太网接口视图

interface interface-type interface-number

-

配置以太网OAM的连接模式

oam mode { active | passive }

可选

缺省情况下,以太网OAM的连接模式为主动模式

使能以太网OAM功能

oam enable

必选

缺省情况下,以太网端口的以太网OAM功能处于关闭状态

 

在使能了以太网OAM功能的端口上不能改变以太网OAM的连接模式。如需改变连接模式,请先关闭该端口上的以太网OAM功能。

 

1.4  配置以太网OAM连接检测定时器

以太网OAM连接建立后,两端的OAM实体会以一定的时间间隔为周期发送Information OAMPDU来检测连接是否正常,该间隔被称为握手报文发送间隔。如果一端OAM实体在连接超时时间内未收到对端OAM实体发来的Information OAMPDU,则认为OAM连接中断。

通过调整握手报文发送间隔和连接超时时间,可以改变以太网OAM连接的检测精度。

表1-8 配置以太网OAM连接检测定时器

操作

命令

说明

进入系统视图

system-view

-

配置以太网OAM握手报文的发送间隔

oam timer hello interval

可选

缺省情况下,以太网OAM握手报文的发送间隔为1000毫秒

配置以太网OAM连接的超时时间

oam timer keepalive interval

可选

缺省情况下,以太网OAM连接的超时时间为5000毫秒

 

由于以太网OAM连接超时后,本端OAM实体将老化与对端OAM实体的连接关系,使OAM连接中断,因此连接超时时间必须大于握手报文发送间隔(建议配置为其五倍或以上),否则会导致以太网OAM连接的不稳定。

 

1.5  配置一般链路事件的检测参数

当以太网OAM连接建立后,本节中所配置的各事件检测周期和阈值将会在所有以太网端口上自动有效。

 

1.5.1  配置错误信号事件的检测参数

在错误信号事件的检测周期内,如果某以太网端口上所发生的错误信号数大于或等于错误信号事件的检测阈值,则将在该端口上产生一个错误信号事件。

表1-9 配置错误信号事件的检测参数

操作

命令

说明

进入系统视图

system-view

-

配置错误信号事件的检测周期

oam errored-symbol period period-value

可选

缺省情况下,错误信号事件的检测周期为1秒

配置错误信号事件的检测阈值

oam errored-symbol threshold threshold-value

可选

缺省情况下,错误信号事件的检测阈值为1

 

1.5.2  配置错误帧事件的检测参数

在错误帧事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧事件的检测阈值,则将在该端口上产生一个错误帧事件。

表1-10 配置错误帧事件的检测参数

操作

命令

说明

进入系统视图

system-view

-

配置错误帧事件的检测周期

oam errored-frame period period-value

可选

缺省情况下,错误帧事件的检测周期为1秒

配置错误帧事件的检测阈值

oam errored-frame threshold threshold-value

可选

缺省情况下,错误帧事件的检测阈值为1

 

1.5.3  配置错误帧周期事件的检测参数

在错误帧周期事件的检测周期内,如果某以太网端口上所发生的错误帧数大于或等于错误帧周期事件的检测阈值,则将在该端口上产生一个错误帧周期事件。

表1-11 配置错误帧周期事件的检测参数

操作

命令

说明

进入系统视图

system-view

-

配置错误帧周期事件的检测周期

oam errored-frame-period period period-value

可选

缺省情况下,错误帧周期事件的检测周期为1000毫秒

配置错误帧周期事件的检测阈值

oam errored-frame-period threshold threshold-value

可选

缺省情况下,错误帧周期事件的检测阈值为1

 

1.5.4  配置错误帧秒数事件的检测参数

在错误帧秒数事件的检测周期内,如果某以太网端口上所发生的错误帧秒数大于或等于错误帧秒数事件的检测阈值,则将在该端口上产生一个错误帧秒数事件。

表1-12 配置错误帧秒数事件的检测参数

操作

命令

说明

进入系统视图

system-view

-

配置错误帧秒数事件的检测周期

oam errored-frame-seconds period period-value

可选

缺省情况下,错误帧秒数事件的检测周期为60秒

配置错误帧秒数事件的检测阈值

oam errored-frame-seconds threshold threshold-value

可选

缺省情况下,错误帧秒数事件的检测阈值为1

 

错误帧秒数事件检测的阈值不要大于设定的周期值,否则不会发生错误帧秒数事件。

 

1.6  配置以太网OAM远端环回功能

1.6.1  使能以太网OAM远端环回功能

在本端端口上使能了以太网OAM远端环回功能之后,该端口将向对端端口发送Loopback Control OAMPDU,使对端进入OAM环回状态。然后,用户可以从本端向对端发送测试报文,并通过观察这些报文的返回情况来计算链路丢包率,以此来评判链路性能。

用户可以在用户视图或系统视图下使能指定端口的以太网OAM远端环回功能,也可以在端口视图下使能当前端口的以太网OAM远端环回功能,三者的配置效果相同。

1. 在用户视图下使能以太网OAM远端环回功能

表1-13 在用户视图下使能以太网OAM远端环回功能

操作

命令

说明

使能指定端口的以太网OAM远端环回功能

oam loopback interface interface-type interface-number

必选

缺省情况下,端口上的以太网OAM远端环回功能处于关闭状态

 

2. 在系统视图下使能以太网OAM远端环回功能

表1-14 在系统视图下使能以太网OAM远端环回功能

操作

命令

说明

进入系统视图

system-view

-

使能指定端口的以太网OAM远端环回功能

oam loopback interface interface-type interface-number

必选

缺省情况下,端口上的以太网OAM远端环回功能处于关闭状态

 

3. 在端口视图下使能以太网OAM远端环回功能

表1-15 在端口视图下使能以太网OAM远端环回功能

操作

命令

说明

进入系统视图

system-view

-

进入二层以太网端口视图

interface interface-type interface-number

-

使能当前端口的以太网OAM远端环回功能

oam loopback

必选

缺省情况下,端口上的以太网OAM远端环回功能处于关闭状态

 

由于远端环回功能将使正常业务受到影响,因此请慎重使用。

 

l          只有当端口上的以太网OAM连接已建立完成,且以太网OAM的连接模式为主动模式时,才能在该端口上使能以太网OAM远端环回功能。

l          只有本端和对端端口都支持远端环回功能、且在全双工链路上才能实现远端环回功能。

l          远端环回功能需要远端硬件的支持,如果远端硬件不支持,会提示用户。

l          在开启远端环回时,将引起所有数据流量的中断;当退出远端环回后,端口将自动执行一次先关闭再开启的操作。导致端口退出远端环回的原因有:使用undo oam enable命令关闭以太网OAM功能、使用undo oam loopback interfaceundo oam loopback命令关闭以太网OAM远端环回功能或OAM连接超时等。

l          由于远端环回功能主要用于测单条链路,所以聚合成员端口和业务环回成员端口并不支持该功能;此外,处于远端环回过程中的端口也不能加入聚合组或业务环回组。有关聚合组和业务环回组的详细介绍,请分别参见“二层技术-以太网交换配置指导”中的“以太网链路聚合配置”和“业务环回组配置”。

l          如果在远端环回过程中开启了内部环回测试功能,远端环回将终止。有关环回测试功能的详细介绍,请参见“二层技术-以太网交换配置指导”中的“以太网端口配置”。

 

1.6.2  拒绝对端发起的以太网OAM远端环回

由于远端环回功能会使正常业务受到影响,为了避免这种情况,用户可以通过本配置使本端端口不受对端发来的Loopback Control OAMPDU的控制,从而拒绝对端发起的以太网OAM远端环回。

表1-16 拒绝对端发起的以太网OAM远端环回

操作

命令

说明

进入系统视图

system-view

-

进入二层以太网端口视图

interface interface-type interface-number

-

拒绝对端发起的以太网OAM远端环回

oam loopback reject-request

必选

缺省情况下,端口不拒绝对端发起的以太网OAM远端环回

 

1.7  以太网OAM显示和维护

在完成上述配置后,在任意视图下执行display命令可以显示配置后以太网OAM的运行情况,通过查看显示信息验证配置的效果。

在用户视图下执行reset命令可以清除以太网OAM的统计信息。

表1-17 以太网OAM显示和维护

操作

命令

查看以太网OAM的全局配置信息

display oam configuration [ | { begin | exclude | include } regular-expression ]

查看以太网OAM的紧急链路事件统计信息

display oam critical-event [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ]

查看以太网OAM的一般链路事件统计信息

display oam link-event { local | remote } [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ]

查看以太网OAM连接的信息

display oam { local | remote } [ interface interface-type interface-number ] [ | { begin | exclude | include } regular-expression ]

清除以太网OAM的报文和一般链路事件统计信息

reset oam [ interface interface-type interface-number ]

 

1.8  以太网OAM典型配置举例

1. 组网需求

l              通过在Device A和Device B上配置以太网OAM功能,实现二者之间链路连通性故障的自动检测;

l              通过观察Device A上收到错误帧的情况,来检测Device A与Device B之间的链路性能。

2. 组网图

图1-2 以太网OAM典型配置组网图

 

3. 配置步骤

(1)        配置Device A

# 在端口GigabitEthernet1/0/1上配置以太网OAM的连接模式为被动模式,并使能以太网OAM功能。

<DeviceA> system-view

[DeviceA] interface gigabitethernet 1/0/1

[DeviceA-GigabitEthernet1/0/1] oam mode passive

[DeviceA-GigabitEthernet1/0/1] oam enable

[DeviceA-GigabitEthernet1/0/1] quit

# 配置错误帧事件的检测周期为20秒,检测阈值为10。

[DeviceA] oam errored-frame period 20

[DeviceA] oam errored-frame threshold 10

(2)        配置Device B

# 在端口GigabitEthernet1/0/1上配置以太网OAM的连接模式为主动模式,并使能以太网OAM功能。

<DeviceB> system-view

[DeviceB] interface gigabitethernet 1/0/1

[DeviceA-GigabitEthernet1/0/1] oam mode active

[DeviceB-GigabitEthernet1/0/1] oam enable

[DeviceB-GigabitEthernet1/0/1] quit

(3)        检验配置效果

通过使用display oam configuration命令可以查看以太网OAM的配置信息,例如:

# 查看Device A上以太网OAM的配置信息。

[DeviceA] display oam configuration

Configuration of the link event window/threshold :

--------------------------------------------------------------------------

Errored-symbol Event period(in seconds)           :     1

Errored-symbol Event threshold                    :     1

Errored-frame Event period(in seconds)            :     20

Errored-frame Event threshold                     :     10

Errored-frame-period Event period(in ms)          :     1000

Errored-frame-period Event threshold              :     1

Errored-frame-seconds Event period(in seconds)    :     60

Errored-frame-seconds Event threshold             :     1

 

Configuration of the timer :

--------------------------------------------------------------------------

Hello timer(in ms)                                :     1000

Keepalive timer(in ms)                            :     5000

以上显示信息表明:除错误帧事件的检测周期为20秒、检测阈值为10以外,其余参数都为缺省值。

通过使用display oam critical-event命令可以查看以太网OAM的紧急链路事件统计信息,例如:

# 查看Device A所有端口上以太网OAM的紧急链路事件统计信息。

[DeviceA] display oam critical-event

Port        : GigabitEthernet1/0/1

Link Status : Up

Event statistic :

-------------------------------------------------------------------------

Link Fault    :0    Dying Gasp    : 0    Critical Event    : 0

以上显示信息表明:Device A与Device B之间的链路上尚未发生过任何紧急链路事件。

通过使用display oam link-event命令可以查看以太网OAM的一般链路事件统计信息,例如:

# 查看Device B所有端口上以太网OAM的一般链路事件的远端统计信息。

[DeviceB] display oam link-event remote

Port :GigabitEthernet1/0/1

Link Status :Up

OAMRemoteErrFrameEvent : (ms = milliseconds)

---------------------------------------------------------------------

Event Time Stamp          : 5789        Errored Frame Window   : 10(100ms)

Errored Frame Threshold   : 1           Errored Frame         : 3

Error Running Total       : 35          Event Running Total   : 17

以上显示信息表明:从Device A开始运行时起,总共发生了35次错误,其中错误帧事件有17次,链路性能并不稳定。

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!