• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

02-设备管理配置指导

目录

03-硬件资源管理配置

本章节下载 03-硬件资源管理配置  (422.90 KB)

03-硬件资源管理配置

目 

1 硬件资源管理

1.1 硬件资源管理任务简介

1.2 监控CPU

1.2.1 配置CPU利用率告警功能

1.2.2 配置CPU利用率历史记录功能

1.2.3 CPU一键诊断

1.2.4 CPU显示和维护

1.3 监控CPU核

1.3.1 监控CPU核利用率告警功能

1.4 监控内存

1.4.1 配置内存告警门限

1.4.2 内存一键诊断

1.4.3 监控DMA内存

1.4.4 内存显示和维护

1.5 监控资源剩余情况

1.5.1 配置资源告警通知功能

1.5.2 资源监控功能显示和维护

1.6 监控设备温度

1.6.1 配置温度告警门限

1.6.2 显示设备温度信息

1.7 关闭硬件资源告警的发送功能

1.8 电源管理

1.8.1 功能简介

1.8.2 配置任务简介

1.8.3 开启电源管理功能

1.8.4 配置冗余电源

1.8.5 显示电源信息

1.9 监控风扇

1.9.1 配置风扇的工作模式

1.9.2 显示风扇信息

1.10 配置端口状态检测定时器

1.11 配置设备的MAC地址表、ARP表/ND表、路由表的硬件资源模式

1.12 可插拔接口模块的识别与诊断

1.12.1 识别可插拔接口模块

1.12.2 诊断可插拔接口模块

1.13 管理和维护400G/800G光模块

1.13.1 开启400G/800G光模块的光通道

1.13.2 配置400G/800G光模块的功耗模式

1.13.3 配置400G/800G光模块的平衡因子和功率幅值

1.13.4 显示400G/800G光模块的参数和状态

1.13.5 软件复位400G/800G光模块

1.14 配置可插拔光模块诊断的选项

1.15 监控光模块光功率

1.15.1 配置光模块接收/发送功率告警门限

1.15.2 配置光模块接收/发送功率变化幅值的告警阈值

1.16 开启光通道的通道环回检测功能

1.17 显示设备硬件信息

1.18 显示设备硬件电子标签信息

1.19 显示设备硬件告警信息

 


1 硬件资源管理

通过硬件资源管理功能,用户能够查看CPU、内存的使用情况,电源和风扇的工作状态,配置设备运行的相关参数,实现对设备硬件资源的日常维护和管理。

1.1  硬件资源管理任务简介

设备管理的所有配置任务均为可选配置,配置时无先后顺序要求,请根据实际需要选择配置。设备管理配置任务如下:

·     监控CPU

¡     配置CPU利用率告警功能

¡     配置CPU利用率历史记录功能

¡     CPU一键诊断

¡     CPU显示和维护

·     监控内存

¡     配置内存告警门限

¡     内存一键诊断

¡     监控DMA内存

¡     监控DMA内存

1. 功能简介

部分业务的运行需要使用DMA(Direct Memory Access,直接内存存取)内存,如果DMA内存不足,会导致业务模块功能异常。系统周期监控DMA空闲内存大小:当DMA空闲内存小于或等于告警阈值,产生告警事件,表示DMA内存可能不足;当DMA空闲内存大于告警恢复阈值,产生告警解除事件,表示DMA内存充足。

DMA内存告警通知会同时向NETCONF、SNMP和信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF、SNMP、信息中心的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”、“SNMP”、“信息中心”。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置DMA内存告警阈值。

memory-threshold dma [ slot slot-number [ cpu cpu-number ] ] [ ratio ] critical critical-value normal normal-value

DMA内存告警阈值为2048KB,告警恢复阈值为4096KB。

(3)     配置发送DMA内存告警事件的间隔。

monitor resend memory-threshold dma critical-interval critical-interval [ slot slot-number [ cpu cpu-number ] ]

undo monitor resend memory-threshold dma critical-interval [ slot slot-number [ cpu cpu-number ] ]

DMA内存告警事件周期发送的间隔为300秒。

¡     内存显示和维护

·     监控资源剩余情况

¡     配置资源告警通知功能

¡     资源监控功能显示和维护

·     监控设备温度

¡     配置温度告警门限

¡     显示设备温度信息

·     关闭硬件资源告警的发送功能

·     监控风扇

¡     配置风扇的工作模式

¡     显示风扇信息

·     配置端口状态检测定时器

·     可插拔接口模块的识别与诊断

¡     识别可插拔接口模块

¡     诊断可插拔接口模块

·     管理和维护400G/800G光模块

¡     开启400G/800G光模块的光通道

¡     配置400G/800G光模块的功耗模式

¡     配置400G/800G光模块的平衡因子和功率幅值

¡     显示400G/800G光模块的参数和状态

¡     软件复位400G/800G光模块

·     配置可插拔光模块诊断的选项

·     监控光模块光功率

¡     配置光模块接收/发送功率告警门限

¡     配置光模块接收/发送功率变化幅值的告警阈值

·     显示设备硬件信息

·     显示设备硬件电子标签信息

·     显示设备硬件告警信息

1.2  监控CPU

1.2.1  配置CPU利用率告警功能

1. 功能简介

系统每隔1分钟会对CPU的利用率进行采样,并将采样值和用户配置的CPU利用率告警门限比较。

·     当采样值大于低级别告警门限时,则CPU进入低级别告警状态,会周期发送CPU低级别告警通知,直到CPU进入高级别告警状态或者低级别告警状态解除。

·     当采样值大于高级别告警门限时,则CPU进入高级别告警状态,会周期发送CPU高级别告警通知,直到高级别告警状态解除。

·     当采样值回落,小于CPU利用率恢复门限时,则认为CPU利用率已经恢复到正常范围,并发送恢复告警通知。

CPU告警通知会同时向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,CPU告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。

图1-1 CPU告警示意图

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置CPU利用率阈值。

monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold recovery-threshold recovery-threshold ] [ slot slot-number [ cpu cpu-number ] ]

缺省情况下,CPU利用率高级别告警门限为99%,低级别告警门限为79%,恢复门限为69%。

注意

CPU利用率高级别告警门限如果设置过低,可能导致设备提前进入门限状态,不再进行正常业务处理。

 

(3)     配置发送CPU告警事件的间隔。

monitor resend cpu-usage { minor-interval minor-interval | severe-interval severe-interval } * [ slot slot-number [ cpu cpu-number ] ]

缺省情况下,持续300秒超过低级别告警门限则上报一次CPU低级别告警事件,持续60秒超过高级别告警门限则上报一次CPU高级别告警事件。

1.2.2  配置CPU利用率历史记录功能

1. 功能简介

开启CPU利用率历史记录功能后,系统会每隔一定时间对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置CPU利用率历史记录的采样周期。

monitor cpu-usage interval interval [ slot slot-number [ cpu cpu-number ] ]

缺省情况下,CPU使用率历史记录采样周期为1分钟。

(3)     开启CPU利用率历史记录功能。

monitor cpu-usage enable [ slot slot-number [ cpu cpu-number ] ]

缺省情况下,CPU使用率历史记录功能处于开启状态。

1.2.3  CPU一键诊断

CPU一键诊断功能用于诊断CPU利用率是否处于正常范围内,例如,是否发生过CPU利用率超门限、CPU利用率突增事件,帮助用户定位CPU利用率异常问题。关于CPU一键诊断功能的详细描述和配置请参见“智能运维配置指导”中的“一键诊断”。

1.2.4  CPU显示和维护

可在任意视图下执行以下命令:

·     显示CPU监控功能的相关配置。

display cpu-usage configuration [ slot slot-number [ cpu cpu-number ] ]

·     显示CPU利用率的统计信息。

display cpu-usage control-plane [ summary ] [ slot slot-number ]

·     以图表方式显示CPU利用率的历史记录。

display cpu-usage history [ job job-id ] [ slot slot-number [ cpu cpu-number ] ]

1.3  监控CPU

1.3.1  监控CPU核利用率告警功能

1. 功能简介

系统按5秒周期对CPU核的利用率进行采样,然后对统计周期内的采样值进行计算,并将计算值和用户配置的CPU核利用率的门限比较。当计算值大于门限值时,则认为CPU核利用率过高,设备会发送告警信息并记录日志。

2. 配置限制和指导

统计周期建议配置为5的整数倍,不是整数倍时,最接近且小于配置值的、5的整数倍数生效。例如统计周期配置为18秒,实际生效的统计周期为15秒。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置CPU核利用率统计周期。

monitor cpu-usage statistics-interval interval slot slot-number cpu cpu-number core core-id-list

缺省情况下,CPU核利用率信息统计间隔时间为60秒。

(3)     配置CPU核利用率告警门限。

monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold recovery-threshold recovery-threshold ] slot slot-number cpu cpu-number core core-id-list

缺省情况下,CPU核利用率高级别告警门限为99%,低级别告警门限为79%,恢复门限为69%。

(4)     配置发送CPU核告警事件的间隔。

monitor resend cpu-usage core-interval { minor-interval minor-interval | severe-interval severe-interval } * [ slot slot-number [ cpu cpu-number ] ]

发送CPU核低级别事件告警间隔时间为300秒,发送CPU核高级别事件告警间隔时间为60秒。

 

1.4  监控内存

1.4.1  配置内存告警门限

1. 功能简介

系统实时监控剩余空闲内存大小,当条件达到一级、二级、三级告警门限或者恢复正常状态门限时,就产生相应的告警/告警解除通知,通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。

除了一级、二级、三级告警,设备还支持预警功能。预警门限用于内存使用率尚处于正常范围内,但需要提醒用户提前关注内存的情况。预警恢复门限用于解除预警。

预告警(early-warning)、一级(minor)、二级(severe)和三级(critical)门限,对应的剩余空闲内存越来越少,紧急程度越来越严重。

设备监控的是系统内存中剩余空闲内存的大小,使用display memory命令可以查看系统内存的使用情况。(不支持低端内存的设备)

设备监控的是低端内存中剩余空闲内存的大小,使用display memory命令可以查看低端内存的使用情况。(支持低端内存的设备)

对于支持低端内存的slot,设备监控的是低端内存中剩余空闲内存的大小;对于不支持低端内存的slot,设备监控的是系统内存中剩余空闲内存的大小。执行display memory命令,如果显示信息中包含LowMem字段,则表示该slot支持低端内存。(部分单板支持低端内存的设备)

·     当剩余空闲内存值从大于变成小于等于预告警门限时,产生预告警。

·     当剩余空闲内存值从大于变成小于等于一级告警门限时,产生一级告警。

·     当剩余空闲内存值从大于变成小于等于二级告警门限时,产生二级告警。

·     当剩余空闲内存值从大于变成小于等于三级告警门限时,产生三级告警。

·     当剩余空闲内存值从小于等于变成大于二级告警门限时,产生三级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于一级告警门限时,产生二级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于正常内存大小时,产生一级告警解除通知。

·     当剩余空闲内存值从小于等于变成大于预告警内存大小时,产生预告警解除通知。

同一级别的告警/告警解除通知是交替进行的:当剩余空闲内存值小于等于某级告警门限,设备产生相应级别的告警,后续只有该告警解除了,剩余空闲内存值再次小于等于某级告警门限时,才会再次生成该级别的告警。

当剩余空闲内存大小如图1-2中曲线所示时,会生成如图1-2所示的告警和解除告警通知。

图1-2 内存告警示意图

内存告警事件的发送周期如下:持续12小时超过一级告警门限则上报一次一级告警事件通知,持续3小时超过二级告警门限则上报一次二级告警事件通知,持续1小时超过三级告警门限则上报一次三级告警事件通知。

2. 配置限制和指导

当设备出现内存告警时,可删除暂时不用的配置或关闭部分功能来释放内存。但因为内存不足,部分配置可能删除失败。

满足以下条件时,系统会重启单板。

·     产生三级告警后,剩余空闲内存值持续小于三级告警门限,其时长到达30秒,则系统会重启单板。

·     如果连续产生两次三级告警的时间间隔小于30秒,则系统会重启单板。

·     如果3分钟内产生三次三级告警,则系统会重启单板。

·     产生三级告警后,系统将会周期采样,预测剩余空闲内存是否会在30秒之内耗尽,如果预测结果为会在30秒之内耗尽,则系统会重启单板。

系统监控到剩余空闲内存值达到一级、二级、三级告警门限后,用户在Console或Telnet登录设备,以及执行每条命令时,都会显示当前内存使用情况。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置内存利用率阈值。

memory-threshold [ slot slot-number [ cpu cpu-number ] ] usage memory-threshold

缺省情况下,内存利用率阈值为100%。

(3)     配置空闲内存告警的门限值。

memory-threshold [ slot slot-number [ cpu cpu-number ] ] [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value

一级告警门限为256MB,二级告警门限为192MB,三级告警门限为128MB,系统恢复到正常的内存门限为320MB。

1.4.2  内存一键诊断

内存一键诊断功能用于诊断内存使用量是否处于正常范围内,例如,是否发生过内存使用量超门限、内存使用量突增事件,帮助用户定位内存使用量异常问题。关于内存一键诊断功能的详细描述和配置请参见“智能运维配置指导”中的“一键诊断”。

1.4.3  监控DMA内存

1. 功能简介

部分业务的运行需要使用DMA(Direct Memory Access,直接内存存取)内存,如果DMA内存不足,会导致业务模块功能异常。系统周期监控DMA空闲内存大小:当DMA空闲内存小于或等于告警阈值,产生告警事件,表示DMA内存可能不足;当DMA空闲内存大于告警恢复阈值,产生告警解除事件,表示DMA内存充足。

DMA内存告警通知会同时向NETCONF、SNMP和信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF、SNMP、信息中心的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”、“SNMP”、“信息中心”。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置DMA内存告警阈值。

memory-threshold dma [ slot slot-number [ cpu cpu-number ] ] [ ratio ] critical critical-value normal normal-value

DMA内存告警阈值为2048KB,告警恢复阈值为4096KB。

(3)     配置发送DMA内存告警事件的间隔。

monitor resend memory-threshold dma critical-interval critical-interval [ slot slot-number [ cpu cpu-number ] ]

undo monitor resend memory-threshold dma critical-interval [ slot slot-number [ cpu cpu-number ] ]

DMA内存告警事件周期发送的间隔为300秒。

1.4.4  内存显示和维护

可在任意视图下执行以下命令:

·     显示设备的内存使用状态。

display memory [ summary ] [ slot slot-number [ cpu cpu-number ] ]

·     显示DMA内存的使用情况。

display memory dma [ slot slot-number [ cpu cpu-number ] ]

·     显示内存告警门限相关信息。

display memory-threshold [ slot slot-number [ cpu cpu-number ] ]

·     显示DMA内存告警相关信息

display memory-threshold dma [ slot slot-number [ cpu cpu-number ] ]

1.5  监控资源剩余情况

1.5.1  配置资源告警通知功能

1. 功能简介

配置本功能后,设备会监测ARP表项等资源的剩余情况,周期采样监测对象的值,并和配置的告警门限进行比较:

·     如果剩余的资源小于或等于低级别告警门限且大于高级别告警门限,则资源进入低级别告警状态,并生成低级别告警通知;

·     如果剩余的资源小于或等于高级别告警门限,则资源进入高级别告警状态,并生成高级别告警通知;

·     如果剩余的资源大于低级别告警门限,则资源进入恢复告警状态,并生成恢复通知。

当资源一直处于低级别告警状态时:

·     开启周期发送低级别资源告警通知功能后,第一次达到低级别告警状态时,会生成低级别告警通知,后续还会周期生成低级别告警通知。当剩余资源达到更高级别告警门限时,将会生成更高级别的告警通知,暂时抑制低级别的告警通知。直到高级别的告警状态解除,再周期输出低级别的告警通知。

·     关闭周期发送低级别资源告警通知功能后,只有第一次达到低级别告警状态时,才生成低级别告警通知,不会连续生成低级别告警通知。

当资源一直处于高级别告警状态时,设备会周期生成高级别告警通知。

资源告警通知可向NETCONF、SNMP、信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,资源告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF和SNMP的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”和“SNMP”。信息中心的详细介绍请参见“设备管理配置指导”中的“信息中心”。

图1-3 资源监控示意图

 

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置生成资源告警通知的门限。

resource-monitor resource resource-name slot slot-number cpu cpu-number { by-absolute | by-percent } minor-threshold minor-threshold severe-threshold severe-threshold

不同类型资源的缺省情况不同,请使用display resource-monitor命令查看。

(3)     配置资源告警通知的输出方向。

resource-monitor output { netconf-event | snmp-notification | syslog } *

缺省情况下,资源告警通知会同时向NETCONF、SNMP、信息中心三个方向输出。

(4)     开启周期发送低级别资源告警通知功能。

resource-monitor minor resend enable

缺省情况下,周期发送低级别资源告警通知功能处于开启状态。

1.5.2  资源监控功能显示和维护

可在任意视图下执行以下命令,显示资源监控功能的相关信息。

display resource-monitor [ resource resource-name ] [ slot slot-number [ cpu cpu-number ] ]

1.6  监控设备温度

1.6.1  配置温度告警门限

1. 功能简介

通过以下配置任务,用户可以根据实际应用的需要配置不同的温度告警门限,来监控设备上不同位置温度传感器的温度。

设备可配置的温度告警门限包括:低温告警门限、一般级(Warning)高温告警门限、严重级(Alarm)高温告警门限。

如果温度低于低温告警门限、高于一般级或严重级高温门限,系统均会生成相应的日志信息和告警信息提示用户,并通过设备面板上的指示灯来告警,以便用户及时进行处理。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置设备的温度告警门限。

temperature-limit slot slot-number hotspot sensor-number lowlimit warninglimit [ alarmlimit ]

不同温度传感器的温度门限可能不同,请先使用undo temperature-limit命令恢复缺省情况后,再通过display environment命令查看设备的缺省温度告警门限。

高温告警门限必须大于低温告警门限;Alarm高温告警门限必须大于Warning高温告警门限。

1.6.2  显示设备温度信息

可在任意视图下执行以下命令,显示设备的温度信息。

display environment [ slot slot-number ]

1.7  关闭硬件资源告警的发送功能

1. 功能简介

本功能用于关闭硬件资源告警的发送功能。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     关闭硬件资源告警的发送功能。

hardware-alarm { syslog | trap } resource-type { all | board | bus | chip-channel | chip-port | device | disk | fan | interface | power | subcard | transceiver | voltage } disable

缺省情况下,所有硬件资源告警的发送功能处于开启状态。

1.8  电源管理

1.8.1  功能简介

某些电源模块发生过载、过流、过压、过温、短路等故障时,会进行自我硬件保护,比如:当电源由于输出过压而告警时,电源可能进入锁死状态、停止对整个机框进行供电,以便保护电源和设备不被损坏。这样虽然保护了电源和设备的安全使用,但会对设备的正常使用造成一定的影响,严重时将导致业务全部中断。为了尽可能减小这种影响,用户可使用电源管理功能,来尽可能的避免电源模块过载现象的发生。

电源管理功能的原理是,系统实时监控电源的可用功率和系统负载,在电源将要过载、进行自身硬件保护之前,采取保护措施(比如给用户发送提示信息、启用冗余电源以及抑制接口板供电)。

1.8.2  配置任务简介

电源管理配置任务如下:

(1)     开启电源管理功能

(2)     (可选)配置冗余电源

通过配置冗余电源,可以给设备预留功率。

1.8.3  开启电源管理功能

(1)     进入系统视图。

system-view

(2)     开启电源管理功能。

power-supply policy enable

缺省情况下,电源管理功能处于开启状态。

1.8.4  配置冗余电源

1. 功能简介

冗余电源技术通过部署多余的电源模块,来避免电源过载。比如,设备至少需要N个电源才能运行,通常会给设备配备M(M大于N)个电源,多余的(M-N)个电源可配置为冗余电源。正常情况下,这M个电源负载均衡,共同为设备输出功率。当其中某个电源故障时,其余电源能立即接管其工作,从而避免发生电源过载。

配置冗余电源后,如果有接口板插入,系统会先比较待上电接口板的最大功耗和系统的剩余功率:

·     当最大功耗小于等于剩余功率时,直接给接口板供电。

·     当最大功耗大于剩余功率时,不会给接口板供电,接口板不能启动。此时,可增加电源模块,或者减少冗余电源的数量。

2. 配置限制和指导

只有在开启电源管理功能后,本特性才会生效。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置冗余电源模块数。

power-supply policy redundant module-count

缺省情况下,冗余电源模块数量的值为0。

1.8.5  显示电源信息

1. 显示电源状态

可在任意视图下执行以下命令,显示设备的电源状态。

display power [ slot slot-number [ power-id ] ]

2. 显示电源电子标签信息

可在任意视图下执行以下命令,显示指定电源的电子标签信息。

display device manuinfo slot slot-number power power-id

1.9  监控风扇

 

 

1.9.1  配置风扇的工作模式

1. 功能简介

可根据实际情况,选择相应的风扇工作模式:

·     balance:配置风扇工作在均衡模式。该模式下风扇的转速和噪音介于低温模式和静音模式之间,在优先保证散热的情况下尽量降低噪音。

·     low-temperature:低温模式。该模式下风扇转速较高,以便优先保证单板在较低的温度下工作。

·     silence:静音模式。该模式下风扇转速较低、噪音较小,但是单板温度比低温模式略高。在对噪音比较敏感的场合推荐使用此模式。

2. 配置限制和指导

本功能仅缺省MDC支持,非缺省MDC不支持。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置风扇自动调速模式。

 

fan auto-control-mode { balance | low-temperature | silence }

1.9.2  显示风扇信息

可在任意视图下执行以下命令:

·     显示风扇的工作状态。

display fan [ slot slot-number [ fan-id ] ]

·     显示指定风扇的电子标签信息。

display device manuinfo slot slot-number fan fan-id

1.10  配置端口状态检测定时器

1. 功能简介

在开启环路检测功能或生成树协议的网络中,某些协议模块(比如STP等)会自动关闭某个端口。在协议自动关闭端口的同时,系统会启动一个检测端口状态的定时器。当定时器超时,如果该端口仍处于关闭状态,则系统自动将端口恢复到真实的物理状态。本功能用于配置系统检测端口状态定时器的时长。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置端口状态检测定时器的时长。

shutdown-interval time

缺省情况下,端口状态检测定时器时长为30秒。

1.11  配置设备的MAC地址表、ARP表/ND表、路由表的硬件资源模式

1. 功能简介

设备支持多种类型的硬件资源模式,不同硬件资源模式下支持的MAC地址表、ARP表/ND表、路由表容量不同。详情请参见表1-1表1-2

表1-1 各表项模式下MAC地址表、ARP表/ND表、路由表容量(适用于S9827系列交换机)

表项模式

MAC地址表

ARP表/ND表

路由表

IPv4路由

IPv6路由

EM

8K

16K

786000

786000

ROUTING

8K

16K

1000000

1000000

 

表1-2 各表项模式下MAC地址表、ARP表/ND表、路由表容量(适用于S9857系列交换机)

表项模式

MAC地址表

ARP表/ND表

路由表

IPv4路由

IPv6路由

ROUTING

16K

28K

1460000

872000

 

2. 配置限制和指导

配置该特性后,须手工保存配置并重启设备才能生效。重启设备前请评估重启对网络造成的影响,做好相关准备工作。

各硬件资源模式下MAC地址表、ARP表/ND表容量、路由表容量支持的规格为理论最大值。请以实际情况为准。

仅S9827系列交换机支持EM参数。

对于S9827系列交换机,当hardware-resource switch-mode为EM模式时,不支持VXLAN流量统计。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置MAC地址表、ARP表/ND表、路由表的硬件资源模式。

hardware-resource switch-mode { EM | ROUTING }

缺省情况下,MAC地址表、ARP表/ND表、路由表的硬件资源模式为ROUTING模式。

4. 显示和维护

可在任意视图下执行以下命令,显示MAC地址表、ARP表/ND表、路由表的硬件资源模式。

display hardware-resource switch-mode

1.12  可插拔接口模块的识别与诊断

1.12.1  识别可插拔接口模块

1. 功能简介

可以通过显示可插拔接口模块的主要特征参数或者电子标签信息来识别可插拔接口模块。

·     可插拔接口模块的主要特征参数包括:模块型号、连接器类型、发送激光的中心波长、信号的有效传输距离、模块生产厂商名称等信息。

·     电子标签信息也可以称为永久配置数据或档案信息,在光模块或者设备的调试、测试过程中被写入到光模块或者设备的存储器件中,包括光模块或者设备的名称、生产序列号、MAC地址、制造商等信息。

另外,当设备上插入的光模块的生产厂商不是H3C时,设备会打印Log信息提醒用户,要求用户更换成H3C的光模块,以便管理和维护光模块。关于Log输出规则的配置请参见“设备管理配置指导”中的“信息中心”。

2. 配置步骤

请在任意视图下执行以下命令。

·     显示可插拔接口模块的主要特征参数。

display transceiver interface [ interface-type interface-number ]

·     显示可插拔接口模块的电子标签信息。

display transceiver manuinfo interface [ interface-type interface-number ]

1.12.2  诊断可插拔接口模块

1. 功能简介

系统提供故障告警信息描述了可插拔接口模块的故障来源,以便用户诊断和解决故障。系统还提供了数字诊断功能,其原理是对影响光模块工作的关键参数进行监控(这些关键参数包括:温度、电压、激光偏置电流、发送光功率和接收光功率等),当这些参数的值异常时,用户可以采取相应的措施,预防故障发生。

2. 配置步骤

请在任意视图下执行以下命令。

·     显示可插拔接口模块的当前故障告警信息。

display transceiver alarm interface [ interface-type interface-number ]

·     显示可插拔光模块的数字诊断参数的当前测量值。

display transceiver diagnosis interface [ interface-type interface-number ]

·     显示可插拔光模块的VDM(Versatile diagnostics monitoring,多功能诊断监控)信息。

display transceiver vdm interface interface-type interface-number vdm-id vdm-id

仅部分支持CMIS 4.0的200G、400G和800G光模块支持本命令。

1.13  管理和维护400G/800G光模块

1.13.1  开启400G/800G光模块的光通道

1. 功能简介

本功能主要用于调测光模块的功能是否正常,正常情况下,不建议配置。

2. 配置限制和指导

关闭光通道将导致光模块不能传输信号。

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     开启光模块的光通道。

transceiver lane [ lane-number ] enable

缺省情况下,光模块的光通道处于开启状态。

1.13.2  配置400G/800G光模块的功耗模式

1. 功能简介

通常情况下,光模块处于高功耗工作模式。当光模块长时间不需要工作时,可将光模块切换到低功耗工作模式,节省能耗。低功耗模式下,光模块不能传输信号,如果有流量传输需求,需要手工将光模块调整到高功耗工作模式。

2. 配置限制和指导

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     配置400G/800G光模块的功耗模式。

transceiver power-mode { high | low }

本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。

1.13.3  配置400G/800G光模块的平衡因子和功率幅值

1. 功能简介

本功能用于调测和优化400G/800G光模块的高速信号,以便光链路达到最优工作状态。通常情况下,使用缺省配置即可置。如果确实需要调整,请在专业人士指导下进行,以免光模块工作异常。

2. 配置限制和指导

当接口在传输业务流量时,建议不要执行本命令。因为执行本命令,设备会自动关闭、开启光模块一次,影响流量的传输。

本配置会保存在光模块内部的寄存器中,不会保存到配置文件中。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入400G/800G以太网接口及其拆分接口视图。

interface interface-type interface-number

(3)     设置光模块光模块接收通道的平衡因子和功率幅值。

transceiver lane [ lane-number ] equalization { precursor precursor-value | postcursor postcursor-value | amplitude amplitude-value }

本命令的缺省情况与光模块的型号有关,请以光模块的实际情况为准。

1.13.4  显示400G/800G光模块的参数和状态

可在任意视图下执行以下命令:

·     显示可插拔400G/800G光模块的当前运行参数。

display transceiver active-control interface [ interface-type interface-number ]

·     显示可插拔400G/800G光模块支持的能力。

display transceiver advertising interface [ interface-type interface-number ]

·     显示可插拔400G/800G光模块支持的应用及相关信息。

display transceiver application interface [ interface-type interface-number ]

·     显示可插拔400G/800G光模块的状态信息。

display transceiver status interface [ interface-type interface-number ]

1.13.5  软件复位400G/800G光模块

1. 功能简介

当光模块工作异常时,可以通过软件复位光模块来尝试修复光模块。正常情况下,不建议配置。

2. 配置限制和指导

使用本功能会重启光模块,请谨慎使用。

3. 配置步骤

在用户视图下,使用以下命令可软件复位400G/800G光模块。

reset transceiver interface [ interface-type interface-number]

1.14  配置可插拔光模块诊断的选项

1. 功能简介

本功能用于配置可插拔光模块诊断的选项,并显示对应的诊断信息。

2. 配置限制和指导

仅部分支持CMIS 4.0的200G、400G和800G光模块支持本功能。

本功能的配置将会保存到光模块内部的寄存器中,如果光模块掉电,本功能的配置会被清空。当光模块重新上电后,需要重新设置本功能。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     配置可插拔光模块诊断的选项,并显示对应的诊断信息。

transceiver diagnostic selector selector-id

缺省情况下,未配置可插拔光模块诊断的选项。

1.15  监控光模块光功率

1.15.1  配置光模块接收/发送功率告警门限

1. 功能简介

为了及时发现光功率异常并采取措施,用户可以根据光模块的具体使用情况和网络环境,在光模块接收/发送功率的固有预警门限和固有告警门限范围内设置告警阈值,如图1-4所示。当光模块接收/发送功率超过用户设置的告警阈值时,系统将打印告警信息。

使用display transceiver diagnosis命令可以查看接收/发送功率当前测量值、预警门限、用户自定义告警门限和告警门限。

图1-4 光模块接收/发送功率告警示意图

2. 注意事项

本功能仅适用于支持数字诊断功能的SFP、QSFP、QSFPDD、QSFP56和OSFP系列光模块,且不适用于400G ZR光模块、400G ZR+光模块和光转电模块。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     (可选)配置光模块接收功率告警上限。

transceiver rx-power high-threshold power-value

缺省情况下,未配置光模块接收功率告警上限。

(4)     (可选)配置光模块接收功率告警下限。

transceiver rx-power low-threshold power-value

缺省情况下,未配置光模块接收功率告警下限。

(5)     (可选)配置光模块发送功率告警上限。

transceiver tx-power high-threshold power-value

缺省情况下,未配置光模块发送功率告警上限。

(6)     (可选)配置光模块发送功率告警下限。

transceiver tx-power low-threshold power-value

缺省情况下,未配置光模块发送功率告警下限。

1.15.2  配置光模块接收/发送功率变化幅值的告警阈值

1. 功能简介

光模块在链路首次启动并稳定后的初始接收光功率被设定为基准值。执行transceiver rx-power change-thresholdtransceiver tx-power change-threshold命令后,系统将周期性地检查光模块的接收/发送光功率。如果发现接收/发送光功率相对于基准值的变化超过用户设定的阈值,系统将判断为接收/发送光功率发生了重大变化,从而触发告警。

2. 注意事项

本功能仅适用于支持数字诊断功能的SFP、QSFP、QSFPDD、QSFP56和OSFP系列光模块,且不适用于400G ZR光模块、400G ZR+光模块和光转电模块。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     (可选)配置光模块接收功率变化幅值的告警阈值。

transceiver rx-power change-threshold power-value

缺省情况下,光模块接收功率变化幅值的告警阈值为5.00dBm。

(4)     (可选)配置光模块发送功率变化幅值的告警阈值。

transceiver tx-power change-threshold power-value

缺省情况下,光模块发送功率变化幅值的告警阈值为4.00dBm。

1.16  开启光通道的通道环回检测功能

1. 功能简介

本功能用于开启光通道的通道环回检测功能,并配置环回检测模式。

2. 配置限制和指导

仅部分支持CMIS 4.0的200G、400G和800G光模块支持本功能。

光通道环回检测功能用于测试指定发送端和接收端之间能否正常转发报文,如果不能正常转发报文,用于判断故障点。当光模块能正常转发报文时,无需配置本功能。

本功能配置后会保存到光模块内部的寄存器中,如果光模块掉电,本功能会被清除。当光模块重新上电后,需要重新配置。

3. 配置步骤

(1)     进入系统视图。

system-view

(2)     进入以太网接口视图。

interface interface-type interface-number

(3)     开启光通道的通道环回检测功能,并配置环回检测模式。

transceiver lane [ lane-number ] loopback loopback-mode

缺省情况下,可插拔光模块通道的环回功能处于关闭状态。

 

1.17  显示设备硬件信息

可在任意视图下执行以下命令,显示设备的硬件信息。

display device [ flash | usb ] [ slot slot-number | verbose ]

1.18  显示设备硬件电子标签信息

可在任意视图下执行以下命令,显示设备的电子标签信息。

display device manuinfo [ slot slot-number [ subslot subslot-number ] ]

1.19  显示设备硬件告警信息

可在任意视图下执行以下命令,显示设备硬件的告警信息。

display alarm [ slot slot-number ]

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们