05-第5章 硬件管理
本章节下载: 05-第5章 硬件管理 (321.68 KB)
目 录
本章主要介绍交换机提供的各种硬件管理功能,通过这些功能,您能够方便地查看交换机当前的工作状态,对硬件模块进行管理和日常维护。
请以实际显示为准,本章仅以18XX版本上的显示信息为示例。
电子标签信息也可以称为永久配置数据或档案信息等,在硬件调测(调试、测试)过程中被写入到存储器件中,包括名称、生产序列号、模块生产或定制厂商等信息。
您可以通过display device manuinfo命令来查看交换机的电子标签信息,包括设备名称、序列号、MAC地址、生产日期和制造商信息。
# 显示设备第3号槽位的单板的电子标签信息。
独立运行模式:
<Sysname> display device manuinfo slot 3
Slot 3:
DEVICE_NAME : LST1MRPNC1
DEVICE_SERIAL_NUMBER : 210231A9680089000004
MAC_ADDRESS : 000F-E212-3400
MANUFACTURING_DATE : 2009-02-27
VENDOR_NAME : H3C
IRF模式:
<Sysname> display device manuinfo chassis 1 slot 3
chassis 1 slot 3:
DEVICE_NAME : LST1MRPNC1
DEVICE_SERIAL_NUMBER : 210231A9680089000004
MAC_ADDRESS : 000F-E212-3400
MANUFACTURING_DATE : 2009-02-27
VENDOR_NAME : H3C
表5-1 display device manuinfo命令信息显示描述表
字段 |
描述 |
DEVICE_NAME |
设备名称 |
DEVICE_SERIAL_NUMBER |
设备序列号 |
MAC_ADDRESS |
设备出厂MAC地址 |
MANUFACTURING_DATE |
设备调测日期 |
VENDOR_NAME |
制造商名称 |
Chassis n Slot m |
成员编号为n的设备上的m号槽单板 |
您可以通过display device命令来查看交换机上的单板信息,包括槽位号、单板型号、单板状态、软件版本等。
# 显示交换机上各单板的概要信息。
<Sysname> display device
独立运行模式下的显示信息如下:
Slot No. Brd Type Brd Status Software Version
0 NONE Absent NONE
1 LST1MRPNC1 Master S12500-CMW520-A1221
2 NONE Absent NONE
3 NONE Absent NONE
4 NONE Absent NONE
5 LST1GT48LEC1 Normal S12500-CMW520-A1221
6 NONE Absent NONE
7 NONE Absent NONE
8 NONE Absent NONE
9 NONE Absent NONE
10 NONE Absent NONE
11 NONE Absent NONE
12 LST1SF08B1 Normal S12500-CMW520-A1221
13 LST1SF08B1 Normal S12500-CMW520-A1221
14 LST1SF08B1 Normal S12500-CMW520-A1221
15 LST1SF08B1 Normal S12500-CMW520-A1221
16 LST1SF08B1 Normal S12500-CMW520-A1221
17 LST1SF08B1 Normal S12500-CMW520-A1221
18 LST1SF08B1 Normal S12500-CMW520-A1221
IRF模式下的显示信息如下:
Slot No. Brd Type Brd Status Software Version
1/0 NONE Absent NONE
1/1 LST1MRPNC1 Master S12500-CMW520-A1221
1/2 NONE Absent NONE
1/3 NONE Absent NONE
1/4 NONE Absent NONE
1/5 LST1GT48LEC1 Normal S12500-CMW520-A1221
1/6 NONE Absent NONE
1/7 NONE Absent NONE
1/8 NONE Absent NONE
1/9 NONE Absent NONE
1/10 NONE Absent NONE
1/11 NONE Absent NONE
1/12 LST1SF08B1 Normal S12500-CMW520-A1221
1/13 LST1SF08B1 Normal S12500-CMW520-A1221
1/14 LST1SF08B1 Normal S12500-CMW520-A1221
1/15 LST1SF08B1 Normal S12500-CMW520-A1221
1/16 LST1SF08B1 Normal S12500-CMW520-A1221
1/17 LST1SF08B1 Normal S12500-CMW520-A1221
1/18 LST1SF08B1 Normal S12500-CMW520-A1221
表5-2 display device命令显示信息描述表
字段 |
描述 |
Slot No. |
单板的槽位号,IRF模式下为:成员编号/槽位号 |
Brd Type |
单板的硬件类型,关键字解释如下: · 显示单板型号:如LST1MRPNC1,与单板丝印一致 · NONE:表示该槽位没有单板 · UNKNOWN:表示当前软件版本不支持该单板,单板无法正常使用 |
Brd Status |
单板状态,关键字解释如下: · Absent:表示该槽位没有单板 · Master:表示该槽位单板为主用主控板 · Slave:表示该槽位单板为备用主控板 · Normal:表示该槽位的单板状态正常 · Fault:表示该槽位的单板没有启动完成或者单板出现故障 · Off:表示该槽位的单板没有上电 · Illegal:表示当前软件版本不支持该单板,单板无法正常使用 |
Software Version |
当前单板的软件版本,关键字解释如下: · 显示软件版本:应与设备软件版本一致 · NONE:表示该槽位没有单板 · Mismatched:表示当前软件版本不支持该单板,无法正常加载软件 |
当交换机运行出现故障时,您可以根据实际情况,通过重启交换机来排除故障。
重启的方式有三种:
· 通过断电后重新上电立即重启交换机(该方式又称为硬件重启或者冷启动)。该方式对交换机冲击较大,如果对运行中的交换机进行强制断电,可能会造成数据丢失或者硬件损坏。一般情况下,建议不要使用这种方式。
· 通过命令行立即重启交换机。
· 通过命令行定时重启交换机。该方式下,您可以设置一个时间,让交换机定时自动重启,或者设置一个时延,让交换机经过指定时间后自动重启。
后两种方式都属于命令行重启。命令行重启又称为热启动,主要用于远程维护时,可以直接重启交换机,而不需要到交换机所在地进行硬件重启。
操作 |
命令 |
说明 |
立即重启指定单板或整个交换机(独立运行模式) |
reboot [ slot slot-number ] |
可选 该命令在用户视图下执行 |
立即重启指定单板、指定成员设备或整个系统(IRF模式) |
reboot [ chassis chassis-number [ slot slot-number ] ] |
可选 该命令在用户视图下执行 |
开启交换机定时重启功能,并指定重启的具体时间 |
schedule reboot at hh:mm [ date ] |
可选 缺省情况下,交换机定时重启功能处于关闭状态 该命令在用户视图下执行 |
开启交换机定时重启功能,并指定重启的等待时延 |
schedule reboot delay { hh:mm | mm } |
可选 缺省情况下,交换机定时重启功能处于关闭状态 该命令在用户视图下执行 |
· 重新启动会导致业务中断,请谨慎使用。
· 重启前请使用save命令保存当前配置,以免重启后配置丢失。
· 重启前请使用display startup和display boot-loader命令分别确认是否设置了合适的下次启动配置文件和下次启动文件。
· 交换机定时器的精度为1分钟。在到达用户设定的重启时刻的前一分钟,交换机会提示:“REBOOT IN ONE MINUTE(交换机将在一分钟后重启)”,并在一分钟后重新启动。
· 使用reboot命令时,不指定slot参数或者重启主用板,均会导致整个交换机重启。
· 如果交换机在准备重启时,您正在进行文件操作,为了安全起见,系统将不会执行此次重启操作。
您可以通过display device manuinfo power-monitor命令来查看电源监控模块的电子标签信息,包括:模块名称、序列号、生产日期和制造商信息。
# 独立运行模式下,显示电源监控模块2的电子标签信息。
<Sysname> display device manuinfo power-monitor 2
Power Monitor unit 2:
DEVICE_NAME : PMU
DEVICE_SERIAL_NUMBER : 210235A36L1234567890
MAC_ADDRESS : NONE
MANUFACTURING_DATE : 2010-01-20
VENDOR_NAME : H3C
# IRF模式下,显示成员设备1上电源监控模块2的电子标签信息。
<Sysname> display device manuinfo chassis 1 power-monitor 2
Chassis 1:
Power Monitor unit 2:
DEVICE_NAME : PMU2
DEVICE_SERIAL_NUMBER : 210235A36L1234567891
MAC_ADDRESS : NONE
MANUFACTURING_DATE : 2010-01-20
VENDOR_NAME : H3C
未启用电源管理的情况下,当您向交换机加入新单板(直接插入或通过命令power-supply给单板供电)时,交换机将不做判断直接给该单板供电。如果因此造成交换机电源过载,将会导致系统不稳定甚至重启。
启用电源管理功能之后,系统将处于过载保护状态。在这种状态下,当您向交换机加入新单板(直接插入或通过命令power-supply给单板供电)时,系统将首先判断新加入的单板是否会造成交换机电源(包括冗余电源)过载,如果会造成交换机电源过载,为了保证系统稳定,系统将不对新加入单板供电。
表5-4 启用电源管理功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
启用电源管理功能(独立运行模式) |
power-supply policy enable |
必选 缺省情况下,交换机启用电源管理功能 |
启用电源管理功能(IRF模式) |
power-supply policy enable chassis chassis-number |
必选 缺省情况下,交换机启用电源管理功能 |
系统从总电源中预留的一部分作为冗余电源,用于电源备份或电源门限告警。如果出现当前使用的电源模块的输出功率无法满足系统需求的情况(如某些电源模块故障或新加入单板),系统会自动启用冗余电源增加输出功率,冗余电源模块数自动减少。
表5-5 管理冗余电源数量
操作 |
命令 |
说明 |
|
进入系统视图 |
system-view |
- |
|
启用电源管理功能(独立运行模式) |
power-supply policy enable |
必选 缺省情况下,交换机启用电源管理功能 |
|
启用电源管理功能(IRF模式) |
power-supply policy enable chassis chassis-number |
必选 缺省情况下,交换机启用电源管理功能 |
|
配置冗余电源模块数量(独立运行模式) |
power-supply policy redundant module-count |
必选 缺省情况下,交换机冗余电源模块数量根据预留功率决定,可以使用命令display power-supply查看 |
|
配置冗余电源模块数量(IRF模式) |
power-supply policy chassis chassis-number redundant module-count |
必选 缺省情况下,交换机冗余电源模块数量根据预留功率决定,可以使用命令display power-supply查看 |
|
在未启用电源管理功能的情况下,系统没有预留冗余电源模块。这时您仍然可以通过power-supply policy redundant命令配置冗余电源模块数,该配置将在您使能电源管理功能之后生效。
交换机运行时,为了保证系统的稳定或满足特定业务的需要,您可以通过power-supply命令为指定单板供电或断电。
表5-6 配置单板供电与断电状态
操作 |
命令 |
说明 |
配置单板供电与断电状态(独立运行模式) |
power-supply { on | off } slot slot-number |
可选 指定的单板不能为主控板或交换网板 该命令在用户视图下配置 |
配置单板供电与断电状态(IRF模式) |
power-supply { on | off } chassis chassis-number slot slot-number |
可选 指定的单板不能为主控板或交换网板 该命令在用户视图下配置 |
您在配置为单板供电之前,需要确认新加入的单板是否会造成交换机电源过载。如果为新单板供电之后,系统消耗的功率大于电源的额定功率,则:
· 如果系统启用了电源管理功能,由于系统处于过载保护状态,将不会为新单板供电。
· 如果系统没有启动电源管理功能,由于新加入的单板使系统消耗的功率大于电源的额定功率,将会导致系统不稳定甚至重启。
· 本节内容仅适用于型号为PSE9000的交流电源(电源型号可通过display power-supply命令查询)。
交换机的交流电源模块在系统启动之后,会随机分配到一个本地唯一的ID。由于随机分配的ID和交流电源模块所在的具体槽位没有对应关系,不利于后期对交换机的管理、维护和故障定位,因此您必须在交换机安装完毕之后,重新配置交流电源模块的ID以便于管理。推荐将交流电源模块ID号配置为与槽位号一致,如图5-1和图5-2所示。
对交换机上的交流电源模块进行热插拔操作时,必须注意以下两点,否则可能造成一个交流电源模块ID号被分配给多个不同模块的现象:
· 将交流电源模块插入交流电源框后,至少需要等待3秒时间,才能再插入下一个交流电源模块。
· 将交流电源模块从交流电源框中拔出后,至少需要等待15秒时间,才能再插拔下一个交流电源模块。
图5-1 S12508交流电源模块槽位号示意图
图5-2 S12518交流电源模块槽位号示意图
命令power-supply led-blink执行后,指定交流电源模块的运行指示灯将会闪烁一段时间,以此确定交流电源模块ID和所在槽位的对应关系。您可以配置指示灯的闪烁时间长度和命令执行到指示灯开始闪烁的延迟时间;如果没有指定交流电源模块ID,将按照ID从小到大顺序依次闪烁。
交流电源模块获得ID之后,如果交换机重启,则交流电源模块ID的分配情况如下:
· 如果交流电源模块获得ID后至交换机重启这段时间内,交流电源模块没有发生变化或仅从交换机上拔出部分模块,那么交换机重启之后,交流电源模块将保持重启之前的ID不变。
· 如果交流电源模块获得ID后至交换机重启这段时间内,交流电源模块位置进行了互换或增加了模块数量,那么交换机重启之后,交流电源模块ID将重新随机分配。
表5-7 配置交流电源模块ID
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置交流电源模块运行指示灯(独立运行模式) |
power-supply led-blink [ module id ] [ blink-time value ] [ delay-time value ] |
可选 缺省情况下,交流电源模块运行指示灯连续闪烁时间长度为3秒,没有延迟时间 |
配置交流电源模块运行指示灯(IRF模式) |
power-supply led-blink chassis chassis-number [ module id ] [ blink-time value ] [ delay-time value ] |
可选 缺省情况下,交流电源模块运行指示灯连续闪烁时间长度为3秒,没有延迟时间 |
配置交流电源模块ID(独立运行模式) |
power-supply module old-id-list new-id new-id-list |
必选 缺省情况下,交流电源模块的ID号由系统随机分配 |
配置交流电源模块ID(IRF模式) |
power-supply module chassis chassis-number old-id-list new-id new-id-list |
必选 缺省情况下,交流电源模块的ID号由系统随机分配 |
每个交流电源模块只能分配一个ID,多个交流电源模块不能使用同一ID。
您可以通过display power-supply命令来查看交换机上的电源系统信息,包括电源管理是否使能、配置的冗余电源数目、电源功率、输出电压/电流、单板上电情况等。
# 独立运行模式下查看电源系统的详细信息。
<Sysname> display power-supply verbose
Power info on chassis 0:
System power-supply policy: enable
System power-module redundant(configured): 1
System power usable: 18000 Watts
System power redundant(actual): 2000 Watts
System power allocated: 2620 Watts
System power available: 15380 Watts
SYSTEM POWER USED(CURRENT): 470.00 Watts
System power monitoring unit:
Software version: 100
Type In/Out Rated-Vol(V) Existing Usable Redundant(actual)
---------- ------ ------------ -------- ------ -----------------
PSE9000 AC/DC 220(default) 10 9 1
DC output voltage information:
Tray Value(V) Upper-Threshold(V) Lower-Threshold(V) Status
---- -------- ------------------ ------------------ -------
1 50.00 53.00 47.00 Normal
2 50.00 53.00 47.00 Normal
DC output current information:
Total current(A): 2.00
Branch Value(A)
------ --------
1/1 N/A
1/2 0.90
1/3 1.40
1/4 0.80
1/5 1.50
1/6 0.40
2/1 0.90
2/2 0.60
2/3 0.90
2/4 N/A
2/5 1.00
2/6 1.00
PSU Status:
ID Status Input-Err Output-Err High-Temperature Fan-Err Closed Current-Limit
-- ------- ----------- ---------- ---------------- ------- ------ -------------
1/1 Absent
1/2 Normal
1/3 Normal
1/4 Normal
1/5 Normal
1/6 Normal
2/1 Normal
2/2 Normal
2/3 Normal
2/4 Absent
2/5 Normal
2/6 Normal
Line-card power status:
Slot Board-Type Watts Status
---- --------------- ----- ------
2 None -- Absent
3 None -- Absent
4 None -- Absent
5 None -- Absent
6 None -- Absent
7 None -- Absent
8 LST1GT48LEC1 190 On
9 None -- Absent
10 None -- Absent
11 None -- Absent
12 None -- Absent
13 None -- Absent
14 None -- Absent
15 None -- Absent
16 None -- Absent
17 None -- Absent
18 None -- Absent
19 None -- Absent
# IRF模式下查看电源系统的详细信息。
<Sysname> display power-supply verbose
Power info on chassis 1:
System power-supply policy: enable
System power-module redundant(configured): 1
System power usable: 18000 Watts
System power redundant(actual): 2000 Watts
System power allocated: 2620 Watts
System power available: 15380 Watts
SYSTEM POWER USED(CURRENT): 470.00 Watts
System power monitoring unit:
Software version: 100
Type In/Out Rated-Vol(V) Existing Usable Redundant(actual)
---------- ------ ------------ -------- ------ -----------------
PSE9000 AC/DC 220(default) 10 9 1
DC output voltage information:
Tray Value(V) Upper-Threshold(V) Lower-Threshold(V) Status
---- -------- ------------------ ------------------ -------
1 50.00 53.00 47.00 Normal
2 50.00 53.00 47.00 Normal
DC output current information:
Total current(A): 9.40
Branch Value(A)
------ --------
1/1 N/A
1/2 0.90
1/3 1.40
1/4 0.80
1/5 1.50
1/6 0.40
2/1 0.90
2/2 0.60
2/3 0.90
2/4 N/A
2/5 1.00
2/6 1.00
PSU Status:
ID Status Input-Err Output-Err High-Temperature Fan-Err Closed Current-Limit
-- ------- ----------- ---------- ---------------- ------- ------ -------------
1/1 Absent
1/2 Normal
1/3 Normal
1/4 Normal
1/5 Normal
1/6 Normal
2/1 Normal
2/2 Normal
2/3 Normal
2/4 Absent
2/5 Normal
2/6 Normal
Line-card power status:
Slot Board-Type Watts Status
---- --------------- ----- ------
2 None -- Absent
3 None -- Absent
4 None -- Absent
5 None -- Absent
6 None -- Absent
7 None -- Absent
8 LST1GT48LEC1 190 On
9 None -- Absent
10 None -- Absent
11 None -- Absent
12 None -- Absent
13 None -- Absent
14 None -- Absent
15 None -- Absent
16 None -- Absent
17 None -- Absent
18 None -- Absent
19 None -- Absent
Power info on chassis 2:
System power-supply policy: enable
System power-module redundant(configured): 1
System power usable: 2000 Watts
System power redundant(actual): 0 Watts
System power allocated: 1055 Watts
System power available: 945 Watts
SYSTEM POWER USED(CURRENT): 429.65 Watts
System power monitoring unit 1:
Software version: 101
Type In/Out Rated-Vol(V) Existing Usable Redundant(actual)
---------- ------ ------------ -------- ------ -----------------
PSE9000-A AC/DC 220(default) 1 1 0
DC output voltage information:
Tray Value(V) Upper-Threshold(V) Lower-Threshold(V) Status
---- -------- ------------------ ------------------ -------
1 49.96 51.00 49.00 Normal
DC output current information:
Total current(A): 8.60
Branch Value(A)
------ --------
1/1 N/A
1/2 N/A
1/3 N/A
1/4 8.60
1/5 N/A
1/6 N/A
PSU Status:
ID Status Input-Err Output-Err High-Temperature Fan-Err Closed Current-Limit
-- ------- ----------- ---------- ---------------- ------- ------ -------------
1/1 Absent
1/2 Absent
1/3 Absent
1/4 Normal
1/5 Absent
1/6 Absent
Line-card power status:
Slot Board-Type Watts Status
---- --------------- ----- ------
2 None -- Absent
3 None -- Absent
4 None -- Absent
5 None -- Absent
6 None -- Absent
7 None -- Absent
8 LST1GT48LEC1 190 On
9 None -- Absent
表5-8 display power-supply verbose命令显示信息描述表
字段 |
描述 |
System power-supply policy: |
电源管理功能配置情况 |
System power-module redundant(configured): |
系统配置的冗余电源模块个数 |
System power usable: |
系统当前电源可用功率,单位为瓦特 |
System power redundant(actual): |
系统当前冗余电源功率,单位为瓦特 |
System power allocated: |
系统当前已分配电源功率,单位为瓦特 |
System power available: |
系统当前实际剩余电源功率,单位为瓦特 |
SYSTEM POWER USED(CURRENT): |
系统当前实时功率,单位为瓦特 |
System power monitoring unit: Software version: |
系统中电源监控模块的软件版本 |
Type |
电源框型号: · PSE9000:旧型号交流电源框 · PSE9000-A:新型号交流电源框 · PSE9000-D:直流电源 |
In/Out |
输入和输出的电流类型 |
Rated-Vol(V) |
额定电压,单位为伏特 |
Existing |
当前设备上电源模块总数 |
Usable |
当前设备使用电源模块数 |
Redundant(actual) |
当前设备冗余电源模块数 |
DC output voltage information: |
直流输出电压信息 |
Tray |
电源框编号 |
Value(V) |
直流输出电压值,单位为伏特 |
Upper-Threshold(V) |
输出电压上限,单位为伏特 |
Lower-Threshold(V) |
输出电压下限,单位为伏特 |
Status |
当前状态 |
DC output current information: |
直流输出电流信息 |
Total current(A): |
输出电流总量 |
PSU Status: |
电源模块状态 |
ID |
1/1~1/6分别对应交流电源模块ID的1~6,2/1~2/6分别对应交流电源模块ID的7~12 |
Status |
电源模块状态 |
Input-Err |
电源模块输入异常 |
Output-Err |
电源模块输出异常 |
High-Temperature |
电源模块高温异常 |
Fan-Err |
电源模块风扇异常 |
Closed |
电源模块关闭 |
Current-Limit |
电源模块电流限制 |
Line-card power status: |
单板功率使用状态 |
Slot |
槽位号 |
Board-Type |
单板类型 |
Watts |
功率,单位为瓦特 |
Status |
单板的供电状态: · on:单板处于正常供电状态; · absent:单板不在位; · wait:由于系统功率不足,单板处于待上电状态。一旦系统功率足够,会自动给单板上电; · off:单板由于用户操作或过温保护等原因被主动下电,这类单板不会自动上电。 |
Power info on chassis 1: |
成员编号为1的设备上的电源信息 |
通过以下配置任务,您可以设置指定单板上各温度传感器的告警阈值。当单板的温度超出您设定的阈值时,系统会发出告警,便于您及时进行处理。
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置单板的温度告警阈值(独立运行模式) |
temperature-limit slot slot-number { inflow | hotspot | outflow } sensor-num LowerLimit WarningLimit [ AlarmLimit ] |
可选 |
配置单板的温度告警阈值(IRF模式) |
temperature-limit chassis chassis-number slot slot-number { inflow | hotspot | outflow } sensor-num LowerLimit WarningLimit [ AlarmLimit ] |
可选 |
您可以通过display environment命令来查看交换机上各单板的温度传感器的温度信息,包括当前温度和设定的温度告警阈值。
# 查看交换机上各单板的温度信息。
<Sysname> display environment
独立运行模式下的显示信息:
System temperature information (degree centigrade):
-------------------------------------------------------------------------------
Slot Sensor Temperature LowerLimit WarningLimit AlarmLimit ShutdownLimit
0 inflow 1 27 -10 55 80 N/A
0 outflow 1 32 -10 55 80 N/A
0 hotspot 1 32 -10 55 85 N/A
9 inflow 1 34 -10 55 75 N/A
9 outflow 1 34 -10 55 85 N/A
9 hotspot 1 37 -10 55 80 N/A
10 inflow 1 29 -10 55 80 N/A
10 outflow 1 51 -10 55 95 N/A
IRF模式下的显示信息:
System temperature information (degree centigrade):
-------------------------------------------------------------------------------
Slot Sensor Temperature LowerLimit WarningLimit AlarmLimit ShutdownLimit
1/0 inflow 1 27 -10 55 80 N/A
1/0 outflow 1 32 -10 55 80 N/A
1/0 hotspot 1 32 -10 55 85 N/A
1/9 inflow 1 34 -10 55 75 N/A
1/9 outflow 1 34 -10 55 85 N/A
1/9 hotspot 1 37 -10 55 80 N/A
1/10 inflow 1 29 -10 55 80 N/A
1/10 outflow 1 51 -10 55 95 N/A
表5-10 display environment命令显示信息描述表
字段 |
描述 |
System Temperature information (degree centigrade) |
系统各单板温度信息(摄氏度) |
Slot |
单板的槽位号,IRF模式下为:成员编号/槽位号 |
Sensor |
温度传感器 · hotspot:表示热点温度传感器 · inflow:表示入风口温度传感器 · outflow:表示出风口温度传感器 |
Temperature |
当前温度 |
Lower limit |
低温告警门限 |
WarningLimit |
一般级(Warning)高温告警门限 |
AlarmLimit |
严重级(Alarm)高温告警门限 |
ShutdownLimit |
关断级(Shutdown)高温告警门限。交换机暂不支持此参数 |
当单板发生故障或需要升级单板CPU扣板逻辑时,您可以通过单板隔离操作来中断单板上的转发业务,且不会影响系统整体运行和其他单板的业务,从而方便地对被隔离单板进行现场诊断或升级。
配置单板隔离之后,您可以通过test diag-offline命令收集单板的诊断信息。
表5-11 配置单板隔离及诊断
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
隔离指定单板(独立运行模式) |
board-offline slot slot-number |
必选 缺省情况下,单板没有从系统中被隔离 |
隔离指定单板 (IRF模式) |
board-offline chassis chassis-number slot slot-number |
必选 缺省情况下,单板没有从系统中被隔离 |
对单板进行诊断(独立运行模式) |
test diag-offline slot slot-number |
必选 诊断结果除直接显示之外,还将以日志信息的形式保存在交换机flash的根目录下,文件名以“diag_单板所在槽位_诊断操作时间” 规则命名 |
对单板进行诊断(IRF模式) |
test diag-offline chassis chassis-number slot slot-number |
必选 诊断结果除直接显示之外,还将以日志信息的形式保存在交换机flash的根目录下,文件名以“diag_单板所在槽位_诊断操作时间” 规则命名 |
· 主用主控板不能从系统中被隔离。
· 当交换机上仅剩一块网板工作时,该网板不能从系统中被隔离。
· 升级接口板逻辑之前,必须使接口板处于Offline状态。
· 除test diag-offline命令外,请不要对处于隔离状态的单板进行其他配置操作,否则相应配置可能无法生效。
· 您可以通过display device命令查询单板是否处于被隔离(Offline)的状态。
· 建议您拔出处于工作状态的网板之前,配置该网板处于Offline状态,减轻对系统运行的影响。
· 执行test diag-offline命令后,终端上显示的诊断信息末尾处会提示您诊断结果的保存路径,例如:flash:/diag_slot3_20080522_103458.txt。
· 诊断结果请交由H3C技术支持工程师或代理商工程师分析。
当交换机发生硬件故障时,可能会导致整个系统的转发异常、造成业务中断。为了提高交换机自动检测和处理硬件故障的能力,您可以配置硬件在线诊断和故障保护功能。
交换机的硬件在线诊断和故障保护功能包括:
· 针对器件、单板和转发三种类型的硬件故障进行在线检测,并对检测到的故障自动执行相应的修复操作;
· 针对端口的硬件故障保护:当系统检测到硬件故障时,将自动关闭被保护的端口。
· 针对聚合组的硬件故障保护。当系统检测到硬件故障时,会按顺序遵循如下原则处理:如果聚合组成员端口配置了hardware-failure-protection auto-down命令,则该端口会被自动关闭;如果聚合组成员端口没有配置hardware-failure-protection auto-down命令,且该端口不是聚合组中最后一个UP状态的端口,则该端口也会被关闭;如果聚合组成员端口没有配置hardware-failure-protection auto-down命令,且该端口是聚合组中最后一个UP状态的端口,则该端口不会被关闭。
表5-12 配置硬件在线诊断和故障保护功能
操作 |
命令 |
说明 |
进入系统视图 |
system-view |
- |
配置硬件故障在线检测和故障发生时自动采取的操作 |
hardware-failure-detection { chip | board | forwarding } { off | warning | reset | isolate } |
必选 检测到故障时系统可自动采取的修复操作包括: · off:检测到故障时,交换机不进行任何操作 · warning:检测到故障时,交换机只进行告警,不执行修复故障的操作 · reset:检测到故障时,交换机会自动重启单板以尝试修复故障 · isolate:检测到故障时,交换机会自动执行关闭端口、单板隔离、禁止单板加载、单板下电操作以减小故障的影响 缺省情况下,系统检测到硬件故障时自动采取的操作为warning |
配置针对聚合组的硬件故障保护 |
hardware-failure-protection aggregation |
可选 缺省情况下,系统没有开启针对聚合组的硬件故障保护 只有当交换机配置的硬件故障修复操作为isolate时,本命令才会生效 |
进入以太网接口视图 |
interface interface-type interface-number |
- |
配置针对端口的硬件故障保护 |
hardware-failure-protection auto-down |
可选 缺省情况下,端口没有开启硬件故障保护 只有当交换机配置的硬件故障修复操作为isolate时,本命令才会生效 |
对端口配置hardware-failure-protection auto-down命令时,请确保该端口存在备份的链路,以免造成业务中断。
以下任一种情况下,hardware-failure-protection aggregation和hardware-failure-protection auto-down命令会对所配置的端口失效:
· 端口配置了以太网接口环回测试功能(loopback { external | internal });
· 端口配置了以太网接口的强制开启功能(port up-mode)。
· 当端口因硬件故障保护而自动关闭时,通过display interface命令可看到该端口当前状态为Protect DOWN。如果要恢复端口的UP状态,可以在端口上执行undo shutdown。
· 由于硬件故障修复造成单板处于隔离或者禁止加载的状态时,可以通过插拔单板的方式使单板状态恢复正常。
· 配置在线诊断和保护功能后,可以通过display hardware-failure-detection命令查看硬件在线检测的运行情况。
您可以通过display fan命令来查看交换机上风扇的状态信息。
# 独立运行模式下显示交换机上所有风扇的详细状态信息。
<Sysname> display fan verbose
Fan-tray 1:
Software version: 101
Hardware version: Ver.A
CPLD version: 001
Fan number: 12
Temperature: 29 C
High temperature alarm threshold: 70 C
Low speed alarm threshold: 900 rpm
Fan Status Speed(rpm)
--- ---------- ----------
1 normal 2700
2 normal 2400
3 normal 2400
4 normal 2400
5 normal 2700
6 normal 2700
7 normal 2400
8 normal 2400
9 normal 2700
10 normal 2400
11 normal 2700
12 normal 2400
Fan-tray 2:
Software version: 101
Hardware version: Ver.A
CPLD version: 001
Fan number: 12
Temperature: 29 C
High temperature alarm threshold: 70 C
Low speed alarm threshold: 900 rpm
Fan Status Speed(rpm)
--- ---------- ----------
1 normal 2700
2 normal 2400
3 normal 2400
4 normal 2400
5 normal 2700
6 normal 2700
7 normal 2400
8 normal 2400
9 normal 2700
10 normal 2400
11 normal 2700
12 normal 2400
# IRF模式下查看交换机上所有风扇的详细状态信息。
<Sysname> display fan chassis 1 verbose
Fan-tray verbose state on chassis 1:
Fan-tray 1:
Software version: 102
Hardware version: Ver.A
CPLD version: 001
Fan number: 12
Temperature: 26 C
High temperature alarm threshold: 60 C
Low speed alarm threshold: 1450 rpm
Fan Status Speed(rpm)
--- ---------- ----------
1 normal 4300
2 normal 4350
3 normal 4050
4 normal 4350
5 normal 4350
6 normal 4350
7 normal 4400
8 normal 4100
9 normal 4200
10 normal 4100
11 normal 4300
12 normal 4350
Fan-tray 2:
Software version: 102
Hardware version: Ver.A
CPLD version: 001
Fan number: 12
Temperature: 26 C
High temperature alarm threshold: 60 C
Low speed alarm threshold: 1450 rpm
Fan Status Speed(rpm)
--- ---------- ----------
1 normal 4300
2 normal 4350
3 normal 4050
4 normal 4350
5 normal 4350
6 normal 4350
7 normal 4400
8 normal 4100
9 normal 4200
10 normal 4100
11 normal 4300
12 normal 4350
表5-13 display fan verbose命令显示信息描述表
字段 |
描述 |
Fan-tray 1: |
以下信息为1号风扇框上风扇的详细状态 |
Software version: |
软件版本 |
Hardware version |
风扇监控板硬件版本 |
CPLD version |
风扇监控板CPLD版本 |
Fan number: |
风扇数量 |
Temperature: |
设备温度 |
High temperature alarm threshold: |
设备温度告警阈值 |
Low speed alarm threshold: |
风扇低速告警阈值 |
Fan |
风扇编号 |
Status |
风扇状态 |
Speed(rpm) |
风扇转速 |
Fan-tray verbose state on chassis 1: |
成员编号为1的设备上的风扇状态 |
您可以通过display alarm命令来查看单板的告警信息。
独立运行模式:
<Sysname> display alarm
Slot Level Info
6 ERROR The board in slot 10 is faulty.
表5-14 display alarm命令显示信息描述表
字段 |
描述 |
Slot |
感知该告警的单板槽位号 |
Level |
告警的级别,级别由高到低依次为ERROR、WARNING、NOTICE、INFO |
Info |
告警的详细信息 |
The board in slot n is faulty. |
单板n处于fault状态(可能是该单板处于启动过程中,也可能是单板故障) |
IRF模式:
<Sysname> display alarm
Chassis Slot Level Info
1 6 ERROR The board in slot 10 is faulty.
表5-15 display alarm命令显示信息描述表
字段 |
描述 |
Chassis |
告警交换机的成员编号 |
Slot |
告警单板所在的槽位号 |
Level |
告警的级别,级别由高到低依次为ERROR、WARNING、NOTICE、INFO |
Info |
告警的详细信息 |
The board in slot n is faulty. |
n号槽位上的单板处于faulty状态(该单板可能正在启动,或者当前处于故障状态) |
目前,常用的可插拔接口模块有三种,这三种模块又可以细分为多种,比如按传输介质类型又可以分为光接口模块和电接口模块,其简介请参见表5-16。
可插拔接口模块类型 |
适用环境 |
能否为光接口模块 |
能否为电接口模块 |
SFP(Small Form-factor Pluggable,小封装可热插拔) |
一般用于百兆/千兆以太网、POS 155M/622M/2.5G等环境 |
是 |
是 |
SFP+(Enhanced 8.5 and 10 Gigabit Small Form-factor Pluggable增强型8.5G和10G小封装可热插拔) |
一般用于10G以太网环境 |
是 |
是 |
XFP(10-Gigabit small Form-factor Pluggable,万兆以太网接口小封装可热插拔) |
一般用于10G以太网环境 |
是 |
否 |
可通过以下显示命令可以查看可插拔接口模块的主要特征参数(包括模块型号、连接器类型、发送激光的中心波长、信号的有效传输距离、模块生产或定制厂商等),以便识别可插拔接口模块。
表5-17 识别可插拔接口模块信息
操作 |
命令 |
说明 |
显示可插拔接口模块的主要特征参数 |
display transceiver interface [ interface-type interface-number ] |
对可插拔接口模块均生效 |
显示可插拔接口模块的部分电子标签信息 |
display transceiver manuinfo interface [ interface-type interface-number ] |
对可插拔接口模块均生效 |
显示接口GigabitEthernet3/0/19上插入的可插拔接口模块的主要特征参数。
<Sysname> display transceiver interface Gigabitethernet 3/0/19
GigabitEthernet3/0/19 transceiver information:
Transceiver Type : 1000_BASE_SX_SFP
Connector Type : LC
Wavelength(nm) : 850
Transfer Distance(m) : 550(50um),270(62.5um)
Digital Diagnostic Monitoring : YES
Vendor Name : H3C
Ordering Name : SFP-GE-SX-MM850
表5-18 display transceiver命令显示信息描述表
字段 |
描述 |
transceiver information |
可插拔接口模块信息 |
Transceiver Type |
可插拔接口模块的物理型号 |
Connector Type |
可插拔接口模块的连接器类型,其中: · 光纤连接器包括SC(SC Connector,NTT公司推出的拔插锁紧式光纤连接器)、LC(LC Connector,Lucent公司推出的1.25mm/RJ45锁紧式光纤连接器)两种类型 · 其他连接器包括RJ-45、CX4等类型 |
Wavelength(nm) |
· 光模块:显示发送激光中心波长,单位nm;对于支持多条不同波长光路的模块(例如10GBASE-LX4模块),各个波长值之间用逗号分隔 · 电模块:显示为“N/A” |
Transfer distance(xx) |
传输距离,对于单模模块,xx显示为km,其他模块xx显示为m。当模块支持多种传输介质时,各个传输距离值之间用逗号分隔。距离值后面括号里包含对应的“传输介质”。下面是各个介质的名称: · 9um:表示9/125um单模光纤 · 50um:表示50/125um多模光纤 · 62.5um:表示62.5/125um多模光纤 · TP:表示双绞线 · CX4:表示CX4电缆 |
Digital Diagnostic Monitoring |
对数字诊断功能的支持情况,其中: · YES:表示支持数字诊断 · NO:表示不支持数字诊断 |
Vendor Name |
模块生产或定制厂商名称 |
Ordering Name |
可插拔接口模块的对外型号 |
# 显示接口GigabitEthernet3/0/19上插入的可插拔接口模块的电子标签信息。
<Sysname> display transceiver manuinfo interface Gigabitethernet 3/0/19
GigabitEthernet3/0/19 transceiver manufacture information:
Manu. Serial Number : 213410A0000054000251
Manufacturing Date : 2008-09-01
Vendor Name : H3C
表5-19 display transceiver manuinfo命令显示信息描述表
字段 |
描述 |
Manu. Serial Number |
在调测(调试、测试)过程中生成的序列号 |
Manufacturing Date |
调测日期,取值为调测平台计算机的系统日期 |
Vendor Name |
定制厂商名称 |
系统提供故障告警信息标志可插拔接口模块的故障来源,以便诊断和解决故障。系统还提供了数字诊断功能,其原理主要是对影响光模块工作的关键参数进行监控,这些关键参数包括:温度、电压、激光偏置电流、发送光功率和接收光功率等。当这些参数的值异常时,您可以采取相应的措施,预防故障发生。
表5-20 诊断可插拔接口模块
操作 |
命令 |
说明 |
显示可插拔接口模块的当前故障告警信息 |
display transceiver alarm interface [ interface-type interface-number ] |
对可插拔接口模块均生效 如果没有故障,则显示为“None” |
显示可插拔光模块的数字诊断参数的当前测量值 |
display transceiver diagnosis interface [ interface-type interface-number ] |
对可插拔接口模块均生效 |
# 显示接口GigabitEthernet 3/0/1的可插拔光模块的当前故障告警信息。
<Sysname> display transceiver alarm interface GigabitEthernet 3/0/1
GigabitEthernet3/0/1 transceiver current alarm information:
TX fault
目前使用的可插拔接口模块可能出现的故障告警信息见表5-21。
表5-21 display transceiver alarm interface命令显示信息描述表
字段 |
说明 |
transceiver current alarm information |
接口光模块当前故障告警信息 |
SFP |
|
RX loss of signal |
接收信号丢失 |
TX fault |
发送错误 |
RX power high |
接收光功率高 |
RX power low |
接收光功率低 |
TX power high |
发送光功率高 |
TX power low |
发送光功率低 |
TX bias high |
偏置电流高 |
TX bias low |
偏置电流低 |
Temp high |
温度高 |
Temp low |
温度低 |
Voltage high |
电压高 |
Voltage low |
电压低 |
Transceiver info I/O error |
模块读写错误 |
Transceiver info checksum error |
模块信息校验和错误 |
Transceiver type and port configuration mismatch |
模块类型和端口配置不匹配 |
Transceiver type not supported by port hardware |
端口不支持该模块类型 |
XFP |
|
RX loss of signal |
接收信号丢失 |
RX not ready |
接收状态未就绪 |
RX CDR loss of lock |
RX CDR时钟失锁 |
TX fault |
发送错误 |
TX not ready |
发送状态未就绪 |
TX CDR loss of lock |
TX CDR时钟失锁 |
Module not ready |
模块状态未就绪 |
APD supply fault |
APD错误 |
TEC fault |
TEC错误 |
Wavelength unlocked |
光信号波长失锁 |
RX power high |
接收光功率高 |
RX power low |
接收光功率低 |
TX power high |
发送光功率高 |
TX power low |
发送光功率低 |
TX bias high |
偏置电流高 |
TX bias low |
偏置电流低 |
Temp high |
温度高 |
Temp low |
温度低 |
Voltage high |
电压高 |
Voltage low |
电压低 |
Transceiver info I/O error |
模块读写错误 |
Transceiver info checksum error |
模块信息校验和错误 |
Transceiver type and port configuration mismatch |
模块类型和端口配置不匹配 |
Transceiver type not supported by port hardware |
端口不支持该模块类型 |
# 显示接口GigabitEthernet 3/0/1上插入的可插拔光模块的数字诊断参数的当前测量值。
<Sysname> display transceiver diagnosis interface Gigabitethernet 3/0/1
GigabitEthernet3/0/1 transceiver diagnostic information:
Current diagnostic parameters:
Temp(°C) Voltage(V) Bias(mA) RX power(dBM) TX power(dBM)
36 3.31 6.13 -35.64 -5.19
表5-22 display transceiver diagnosis显示信息描述表
字段 |
描述 |
transceiver diagnostic information |
接口插入的光模块的数字诊断信息 |
Current diagnostic parameters |
当前的诊断参数 |
Temp.(°C) |
数字诊断参数——温度,单位为°C,精确到1°C |
Voltage(V) |
数字诊断参数——电压,单位为V,精确到0.01V |
Bias(mA) |
数字诊断参数——偏置电流,单位为mA,精确到0.01mA |
RX power(dBM) |
数字诊断参数——接收光功率,单位为dBM,精确到0.01dBM |
TX power(dBM) |
数字诊断参数——发送光功率,单位为dBM,精确到0.01dBM |
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!