• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C S6300系列以太网交换机 故障处理手册-6W100

手册下载

H3C S6300系列以太网交换机 故障处理手册-6W100-整本手册.pdf  (475.39 KB)

  • 发布时间:2021/2/8 14:33:38
  • 浏览量:
  • 下载量:

H3C S6300故障处理手册

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Copyright © 2021 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,

并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。

H3C_彩色.emf


 

1 硬件类故障处理··· 1

1.1 运行过程中设备异常重启故障处理·· 1

1.1.1 故障描述·· 1

1.1.2 故障处理流程·· 1

1.1.3 故障处理步骤·· 2

1.2 电源运行中上报Fault问题处理方法·· 2

1.2.1 故障描述·· 2

1.2.2 故障处理步骤·· 2

1.3 新插入电源模块状态异常处理方法·· 3

1.3.1 故障描述·· 3

1.3.2 故障处理步骤·· 3

1.4 风扇模块运行中上报Fault或新安装风扇模块后状态异常问题处理方法·· 4

1.4.1 故障描述·· 4

1.4.2 故障处理步骤·· 4

1.5 故障诊断命令·· 5

2 ACL相关特性故障处理··· 5

2.1 ACL下发失败故障处理·· 5

2.1.1 故障描述·· 5

2.1.2 故障处理流程·· 6

2.1.3 故障处理步骤·· 6

2.2 故障诊断命令·· 7

3 IRF相关特性故障处理··· 8

3.1 IRF建立不成功故障处理·· 8

3.1.1 故障描述·· 8

3.1.2 故障处理流程·· 8

3.1.3 故障处理步骤·· 9

3.2 故障诊断命令·· 10

4 聚合相关特性故障处理··· 10

4.1 聚合不成功故障处理·· 10

4.1.1 故障描述·· 10

4.1.2 故障处理流程·· 11

4.1.3 故障处理步骤·· 11

4.2 故障诊断命令·· 12

5 端口相关故障处理··· 13

5.1 光口(万SFP+40GEQSFP+口)不UP故障处理·· 13

5.1.1 故障描述·· 13

5.1.2 故障处理流程·· 13

5.1.3 故障处理步骤·· 13

5.2 故障诊断命令·· 14

5.3 电口(1/10GBase-T万兆电口)不UP故障处理·· 15

5.3.1 故障描述·· 15

5.3.2 故障处理流程·· 15

5.3.3 故障处理步骤·· 15

5.4 故障诊断命令·· 16

6 其它常见故障处理··· 16

6.1 二层流量转发丢包·· 16

6.1.1 故障描述·· 16

6.1.2 故障处理流程·· 17

6.1.3 故障处理步骤·· 17

6.1.4 故障诊断命令·· 20

6.2 三层转发丢包故障·· 21

6.2.1 故障描述·· 21

6.2.2 故障处理流程·· 21

6.2.3 故障处理步骤·· 22

6.2.1 故障诊断命令·· 22

6.3 协议震荡故障处理·· 22

6.3.1 故障描述·· 22

6.3.2 故障处理流程·· 23

6.3.3 故障处理步骤·· 23

6.4 风扇异常·· 24

6.4.1 故障描述·· 24

6.4.2 故障处理流程·· 24

6.4.3 故障处理步骤·· 24

6.4.4 故障诊断命令·· 25

 


1 硬件类故障处理

说明

本章节主要讲述电源、风扇等部件故障的处理方法。其它部件如光模块、端口故障等问题请参见端口相关故障处理

 

1.1  运行过程中设备异常重启故障处理

1.1.1  故障描述

设备在使用中发生异常重启。

1.1.2  故障处理流程

图1-1 故障诊断流程图

 

 

1.1.3  故障处理步骤

1. 收集设备日志信息

设备重启后查看是否能够进入命令行模式,使用display diagnostic-information命令收集设备的日志信息,待收集完成后,将设备信息导出后发给H3C技术支持寻求帮助。

2. 检查设备上的启动文件是否正常

通过Console口登录故障设备,重新启动设备,如果BOOTROM提示CRC错误或者找不到启动文件,请重新加载启动文件。加载后请设置该文件为当前启动文件(在BOOTROM加载过程中,BOOTROM能自动将该文件设置为当前启动文件)。

3. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

1.2  电源运行中上报Fault问题处理方法

1.2.1  故障描述

电源运行中上报Fault

1.2.2  故障处理步骤

1. 检查是否存在FaultAbsent状态的电源模块

使用display power命令显示电源模块状态,查看是否存在FaultAbsent状态的电源模块。

<H3C> display power

Slot 1:                                                                       

 Input Power: 78(W)                                                            

 PowerID State          Mode   Current(A)  Voltage(V)  Power(W)                

 1       Normal         AC        --          --          --                   

 2       Absent         --        --          --          --                   

如果存在Absent状态的电源模块,请前往步骤2

如果存在Fault状态的电源模块,请前往步骤3

2. 检查Absent状态电源模块

如果电源模块状态为Absent,表示对应槽位没有在位的电源模块或者电源模块没有安装牢固。

如果电源模块槽位有电源模块在位且显示为Absent,请将电源模块拆卸后重新安装,然后使用display power命令查看对应槽位电源状态是否显示为Normal。如果仍然显示为Absent状态,请更换新电源模块

如果更换新电源模块后仍然显示为Absent状态,请前往步骤4

3. 检查Fault状态电源模块

如果设备已安装另一电源模块,但该电源模块没有上电,此时该电源模块的运行状态为fault,此时请为该电源模块上电。

如果存在Fault状态电源模块,表示该电源模块异常,无法供电。

电源处于Fault状态有可能是电源模块本身温度过高导致。如果电源模块上积灰较多可能引起电源模块温度升高。请查看电源模块积灰情况,如果灰尘较多,请清理灰尘,并将电源模块拆卸后重新安装。然后使用display power命令查看对应槽位电源状态是否显示为Normal如果没有恢复Normal,请将该电源模块插入其它空闲电源模块槽位并查看电源状态是否为Normal。如果该电源模块仍然显示为Fault状态,请更换电源模块。

如果更换新电源模块后仍然显示为Fault状态,请前往步骤4

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

1.3  新插入电源模块状态异常处理方法

1.3.1  故障描述

新插入电源模块状态异常。

1.3.2  故障处理步骤

1. 查看电源模块状态

使用display power命令查看电源模块状态。

<H3C> display power

Slot 1:                                                                       

 Input Power: 78(W)                                                            

 PowerID State          Mode   Current(A)  Voltage(V)  Power(W)                

 1       Normal         AC        --          --          --                   

 2       Absent         --        --          --          --                   

如果该电源模块显示为Absent状态,请前往步骤2

如果该电源模块显示为Fault状态,请前往步骤3

2. 检查Absent状态电源模块

如果该电源模块显示为Absent状态,表示电源模块没有安装牢固。请将该电源模块拆卸后重新安装,然后查看对应槽位电源状态是否显示为Normal。如果仍然显示为Absent状态,请将该电源模块插入其它空闲电源模块槽位并查看对应槽位电源状态是否为Normal状态。如果仍然显示为Absent状态,请前往步骤4

3. 检查Fault状态电源模块

如果该电源模块显示为Fault状态,表示该模块异常,无法供电。请将该电源模块插入其它空闲电源模块槽位并查看对应槽位电源状态是否为Normal状态。如果仍然显示为Fault状态,请前往步骤4

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

1.4  风扇模块运行中上报Fault或新安装风扇模块后状态异常问题处理方法

1.4.1  故障描述

风扇模块运行中上报Fault或新安装风扇模块后状态异常

1.4.2  故障处理步骤

1. 查看风扇模块状态

使用display fan命令查看风扇模块状态。

<H3C> display fan

Slot 1:                                                                       

 Fan 1:                                                                        

 State    : Normal                                                             

 Airflow Direction: Port-to-power                                              

 Prefer Airflow Direction: Port-to-power                                       

 Fan 2:                                                                         

 State    : Normal                                                             

 Airflow Direction: Port-to-power                                              

 Prefer Airflow Direction: Port-to-power

·     如果Airflow Direction显示的风向与Prefer Airflow Direction显示的风向不一致,请重新安装正确风向的风扇或使用fan prefer-direction命令配置与风扇模块风向一致的期望风道风向。

·     如果风扇模块工作状态显示为Absent,请前往步骤2

·     如果风扇模块工作状态显示为Fault,请前往步骤3

2. 检查风扇模块是否安装牢固

如果风扇模块工作状态显示为Absent状态,表示风扇模块不在位或者没有安装牢固。如果风扇模块在位,请将该风扇模块拆卸后重新安装,然后查看风扇模块状态是否显示为Normal状态。如果仍然显示为Absent状态,请更换风扇模块。如果更换新风扇模块后仍然显示为Absent状态,请前往步骤4

3. 检查设备的工作温度信息

如果风扇模块工作状态显示Fault状态,表示该风扇模块异常,无法提供通风散热功能。请使用下述步骤进一步定位。

(1)     使用display environment命令查看系统温度是否持续升高。如果系统温度持续升高,建议用手在设备出风口触摸进一步判断出风口是否有出风。

(2)     如果温度持续升高,且出风口无风,可以肯定风扇模块异常。请将风扇模块拆卸后重新安装,然后使用display fan命令查看是否恢复为Normal状态

(3)     如果仍然不能恢复为Normal状态,请更换该风扇模块。如果现场没有风扇模块,不能立即更换,请关闭设备以免温度过高导致电路烧坏(如果有降温措施保证系统工作在60摄氏度以下,也可以继续使用设备)。

(4)     如果更换新的风扇模块仍然不能恢复为Normal状态,请前往步骤4

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

1.5  故障诊断命令

命令

说明

dir

用来显示目录或文件信息

display boot-loader

用来显示启动软件包的信息

display environment

显示设备的工作温度信息

display fan

显示设备风扇模块的工作状态

display logbuffer

用来显示系统日志缓冲区记录的日志信息

display power

显示设备电源的信息

 

2 ACL相关特性故障处理

2.1  ACL下发失败故障处理

2.1.1  故障描述

用户下发ACL失败,具体分两种失败情况:

·     执行下发命令后设备提示资源不足。

·     执行下发命令后设备无任何错误提示,但ACL不起作用。

2.1.2  故障处理流程

图2-1 ACL下发失败故障诊断流程图

 

2.1.3  故障处理步骤

1. 查看下发时是否报硬件资源不足

下发ACL配置时如果界面打印出“Reason: Not enough hardware resource”字样,则表明ACL下发失败是由硬件资源不足导致。通过display qos-acl resource命令可以进一步确认ACL硬件资源使用情况。如果显示信息中Remaining条目为0了,则表示ACL硬件资源已用尽,设备无法再下发ACL。如果下发时没有报“Reason: Not enough hardware resource”字样,则根据下发方式进行步骤选择:

·     通过MQCQoS策略)方式下发,请进行步骤2

·     通过包过滤(packet-filter)方式下发,请进行步骤3

2. 检查QoS策略配置是否正确

通过下面命令分别检查不同使用情况下QoS策略的配置情况:

·     显示端口上QoS 策略配置信息,display qos policy interface

·     显示VLANQoS 策略配置信息,display qos vlan-policy

·     显示全局QoS策略配置信息,display qos policy global

·     显示控制平面上QoS策略配置信息,display qos policy control-plane slot slot-number

如果QoS策略中缺少流分类和流行为关联的配置,则补充相应配置。否则可通过以下两个命令分别检查下QoS策略中的类和流行为是否配置正确。

·     显示配置的类信息,display traffic classifier user-defined

·     显示配置的流行为信息,display traffic behavior user-defined

如果没有正确配置,则进行正确配置,否则进行步骤4

3. 检查packet-filter配置是否正确

可以通过display packet-filter命令检查packet-filter配置是否正确,如果不正确,则进行正确配置,否则进行步骤4

4. 检查ACl配置是否正确

可以通过display acl命令检查ACL是否配置正确,如果不正确,则进行正确配置,否则进行步骤5

5. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

2.2  故障诊断命令

命令

说明

display qos-acl resource

显示ACL资源的使用情况

display qos policy interface

显示指定端口或所有端口上QoS策略的配置信息和运行情况

display qos vlan-policy

显示基于VLAN应用QoS策略的信息

display qos policy global

显示基于全局应用QoS策略的信息

display qos policy control-plane

显示控制平面应用QoS策略的信息

display traffic classifier user-defined

显示配置的类信息

display traffic behavior user-defined

显示配置的流行为信息

display packet-filter

显示ACL在报文过滤中的应用情况

 

3 IRF相关特性故障处理

3.1  IRF建立不成功故障处理

3.1.1  故障描述

用户规划IRF后,尝试将多台设备配置为一个IRF系统,发现没有成功建立IRF

3.1.2  故障处理流程

图3-1 IRF故障处理流程图

 

3.1.3  故障处理步骤

1. IRF中的成员数量是否已达到支持的最大值

通过display irf命令可以查看当前IRF中的成员个数,如果当前IRF成员数目已经达到支持的最大值,则其它设备不能再加入该IRF

2. IRF中各成员的编号是否唯一

执行display irf命令可以查看到IRF中各成员的编号,如果新增设备的编号与IRF中现有成员设备的编号相同,则新增设备无法加入IRF;如果两台IRF中的设备具有相同的成员编号,则将导致IRF合并失败。

3. 物理连接是否正确

根据IRF规划进行线路检查,检查物理线路是否完全按照规划进行连接。通过display irf configuration命令可以查看当前设备上的IRF端口配置,其中一台设备的IRF-Port1端口必须与另外一台设备的IRF-Port2端口相连才能建立IRF,否则IRF建立失败。

需要注意的是,如果选择10Gbps速率的端口作为堆叠口,需要注意端口的分组规则,同一组内的端口必须同时作为IRF物理端口或普通业务端口,哪些端口为一组在配置过程中会有提示。

4. 光模块连接时是否为SFP+模块或QSFP+模块

检查插入IRF物理端口的模块是否带有10GbpsSFP+40GbpsQSFP+标记,如果使用堆叠电缆连接,检查堆叠线缆上的标签是否带有10GbpsSFP+40GbpsQSFP+标记

S6300设备只支持通过10G/40G链路堆叠,所以只有使用10G双绞线、SFP+模块/QSFP+模块、SFP+电缆/QSFP+电缆、或QSFP+ to SFP+电缆才可以用于多台设备之间的堆叠连接。

如果使用模块+光纤的连接方式,请查看链路两端的模块型号是否一致,光纤是否连接正确。

5. IRF链路状态是否正常

执行display irf topology命令,查看显示信息中的Link字段,可以判断IRF端口的链路状态:

·     如果Link字段显示UP,表示IRF链路状态正常,请执行步骤6

·     如果Link字段显示DOWN,表示IRF链路状态异常,请执行display irf link命令查看IRF物理端口的状态,注意观察Status字段:

¡     如果与IRF端口绑定的所有IRF物理端口的当前状态均为DOWNADMAdministratively DOWN),请检查物理连接状态或使用undo shutdown命令开启该端口,使之变为UP状态。

¡     如果与IRF端口绑定的IRF物理端口中至少有一个处于UP状态,请在保存当前配置后,在系统视图下执行irf-port-configuration active命令来激活IRF端口的配置。

说明

irf-port-configuration active命令用于激活IRF端口的配置,该操作会使被选举为Slave的设备自动重启以加入IRF。因此,在执行该命令前,请在各成员设备上使用save命令保存当前配置,避免设备重启后因IRF配置丢失造成无法成功建立IRF

 

6. 各设备上运行的软件版本差异是否过大

用户可通过display version命令查看各设备上运行的软件版本,如果两台设备上使用的软件版本差异过大,则不能堆叠在一起,出现这种现象时,建议采用升级低版本的方式解决。

说明

IRF的启动文件自动加载功能(irf auto-update enable命令)可以自动同步IRF中各成员设备的版本。但是当成员设备使用的软件版本间差异过大时,该功能可能无法实现自动同步,此时请手工升级较低的版本。

 

7. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

3.2  故障诊断命令

命令

说明

display version

显示系统版本信息

display irf

显示本IRF的相关信息

display irf topology

显示IRF的拓扑信息

display irf configuration

显示本IRF中所有设备的配置信息

irf-port-configuration active

激活设备上所有IRF端口下的配置

 

4 聚合相关特性故障处理

4.1  聚合不成功故障处理

4.1.1  故障描述

用户配置链路聚合功能后,发现聚合组中的成员端口不能被选中,聚合失败。

4.1.2  故障处理流程

图4-1 聚合不成功故障处理流程图

 

4.1.3  故障处理步骤

1. 物理连线是否正确

根据聚合规划进行线路检查,检查物理链接线路是否完全按照规划进行连接。

2. 聚合组中成员端口是否UP

通过display interface命令查看聚合组中的成员端口是否处于UP状态,如果没有UP,可按照端口不UP故障流程处理,具体请参见端口相关故障处理

3. 本端口的操作key和属性类配置与参考端口是否相同

在本设备上通过执行display current-configuration interface查看聚合接口及本端Unselected端口(通过display link-aggregation verbose命令查看端口是否为Selected状态,只有Selected状态的端口才可以在该聚合组中正常工作)的操作key和属性类配置与参考端口是否相同,如果不同,则将其配置相同。

4. 是否为动态聚合

若不是动态聚合,则直接到步骤6,否则进行步骤5

5. 本端口的对端端口的操作key和属性类配置与参考端口的对端端口是否相同

在与本端Unselected端口相连接设备上执行display current-configuration interface命令查看对端Unselected端口的操作key和属性类配置与参考端口的对端端口是否相同,如果不同,则将其配置相同。

6. 聚合成员端口数量是否超过上限

可在聚合接口视图下通过link-aggregation selected-port maximum命令配置聚合组中的最大选中端口数。通过display link-aggregation verbose命令查看聚合组中成员端口是否超过上限,如果超过上限,则多出来的端口为Unselected状态。Selected端口按照端口编号从小到大排序,可以在成员端口视图下使用undo port link-aggregation group命令将Selected端口中不适用的端口从聚合组中删除,以使必须使用的端口为Select状态。

7. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

4.2  故障诊断命令

命令

说明

display current-configuration interface

显示接口当前生效的配置

display interface

显示以太网接口的相关信息

display link-aggregation verbose

显示系统上已有聚合接口所对应的聚合组的详细信息

link-aggregation selected-port maximum

配置聚合组中的最大选中端口数

 

5 端口相关故障处理

5.1  光口(万SFP+40GEQSFP+口)不UP故障处理

5.1.1  故障描述

光口(万SFP+40GEQSFP+口)不UP故障

5.1.2  故障处理流程

图5-1 光口不UP故障处理流程图

 

5.1.3  故障处理步骤

1. 检查两端端口的速率,双工模式是否匹配

执行display interface brief命令,查看两端端口的速率、双工配置是否匹配。若不匹配,请通过speed命令和duplex命令配置端口的速率和双工模式。

2. 检查端口与光模块的速率,双工模式是否匹配

执行display interface brief命令,查看端口与光模块的速率、双工配置是否匹配。若不匹配,请通过speed命令和duplex命令配置端口的速率和双工模式。

3. 检查两端端口是否正常

对于SFP+口,在本设备上的SFP+端口上用万兆SFP+电缆(适用于短距离连接)直接互连;对于40GEQSFP+在本设备上的40GEQSFP+上用QSFP+电缆(适用于短距离连接)直接互连。查看该端口是否能UP。如果能UP,则说明对端端口异常;如果不能UP,则说明本端端口异常。可通过更换本端、对端端口来检查故障是否解决。

4. 检查光模块、电缆是否正常

可通过如下步骤检查光模块是否正常,若不正常可通过更换与光接口匹配的光模块(请使用H3C光模块电缆)来检查故障是否排除。关于光模块电缆的具体描述请参见产品的安装手册。

(1)     可通过display transceiver alarm interface命令,查看当前端口上的光模块的故障告警信息,若显示为“None”,则表示没有故障;若显示有告警信息,则表示该光模块有故障或该模块与光接口类型不匹配

(2)     可使用光功率计测试端口收发光功率是否在正常范围内,是否稳定。

(3)     可通过display transceiver interface命令检查两的光模块波长、距离等参数是否一致。

需要注意的是,对于40GEQSFP+光口,如果使用QSFP+ to SFP+电缆连接时,由于QSFP+光模块发送光功率超过了SFP+模块要求接收的光功率上限,在使用时需要加光衰。

5. 检查光纤是否正常

首先要确定光纤与光模块是否匹配。如果不匹配,可通过更换光纤来检查故障是否排除,关于光纤的具体描述请参见产品的安装手册。

6. 寻求技术支持

如果上述检查完成后故障仍无法排除,可通过display diagnostic-information命令收集设备的diagnostic-information联系H3C的技术支持工程师

<H3C> display diagnostic-information

Save or display diagnostic information (Y=save, N=display)? [Y/N]:Y

5.2  故障诊断命令

命令

说明

display diagnostic-information

显示或保存系统当前多个功能模块运行的统计信息

display interface brief

显示端口的概要信息

display transceiver alarm interface

显示可插拔接口模块的当前故障告警信息

display transceiver interface

显示接口上插入的可插拔接口模块的主要特征参数

 

5.3  电口(1/10GBase-T万兆电口)不UP故障处理

5.3.1  故障描述

电口(1/10GBase-T万兆电口)不UP故障

5.3.2  故障处理流程

图5-2 电口不UP故障诊断流程图

 

5.3.3  故障处理步骤

1. 检查两端端口的速率,双工模式是否匹配

执行display interface brief命令,查看两端端口的速率、双工配置是否匹配。若不匹配,请通过speed命令和duplex命令配置端口的速率和双工模式。

2. 检查链路情况,网线是否正常

可通过更换网线来检查故障是否排除。

3. 检查本端端口是否正常

可通过更换本端设备端口来检查故障是否排除。

4. 检查对端端口是否正常

可通过更换对端设备端口来检查故障是否排除。

5. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

5.4  故障诊断命令

命令

说明

display interface brief

显示以太网端口的概要信息

 

6 其它常见故障处理

6.1  二层流量转发丢包

6.1.1  故障描述

设备二层转发丢包,即源端和目的端在同一二层网络的同一VLAN内,通信过程中有丢包。

6.1.2  故障处理流程

图6-1 二层流量转发丢包故障诊断流程图

 

6.1.3  故障处理步骤

1. 查看端口下是否有错包

使用display interface命令查看端口下是否有错包。如果有错包,请前往步骤2,如果没有错包,请前往步骤3进行后续步骤的检查。

<H3C>display interface Ten-GigabitEthernet1/0/36

Ten-GigabitEthernet1/0/36

Current state: Administratively DOWN                                           

Line protocol state: DOWN                                                       

IP packet frame type: Ethernet II, hardware address: 00e0-fc20-6334            

Description: Ten-GigabitEthernet1/0/36 Interface                               

Bandwidth: 10000000 kbps                                                       

Loopback is not set                                                            

Media type is not sure, port hardware type is No connector                     

Unknown-speed mode, unknown-duplex mode                                        

Link speed type is autonegotiation, link duplex type is autonegotiation        

Flow-control is not enabled                                                    

Maximum frame length: 10000                                                    

Allow jumbo frames to pass                                                     

Broadcast max-ratio: 100%                                                      

Multicast max-ratio: 100%                                                      

Unicast max-ratio: 100%                                                         

PVID: 13                                                                       

MDI type: Automdix                                                             

Port link-type: Access                                                          

 Tagged VLANs:   None                                                          

 Untagged VLANs: 13                                                            

Port priority: 0                                                                

Last link flapping: Never                                                      

Last clearing of counters: Never                                               

 Peak input rate: 0 bytes/sec, at 2011-01-01 01:59:36                           

 Peak output rate: 0 bytes/sec, at 2011-01-01 01:59:36                         

 Last 300 second input: 0 packets/sec 0 bytes/sec -%                           

 Last 300 second output: 0 packets/sec 0 bytes/sec -%                          

 Input (total):  0 packets, 0 bytes                                            

          0 unicasts, 0 broadcasts, 0 multicasts, 0 pauses                     

 Input (normal):  0 packets, - bytes                                           

          0 unicasts, 0 broadcasts, 0 multicasts, 0 pauses                     

 Input:  0 input errors, 0 runts, 0 giants, 0 throttles                        

          0 CRC, 0 frame, - overruns, 0 aborts                                 

          - ignored, - parity errors                                           

 Output (total): 0 packets, 0 bytes                                            

          0 unicasts, 0 broadcasts, 0 multicasts, 0 pauses                     

 Output (normal): 0 packets, - bytes                                           

          0 unicasts, 0 broadcasts, 0 multicasts, 0 pauses                     

 Output: 0 output errors, - underruns, - buffer failures                       

          0 aborts, 0 deferred, 0 collisions, 0 late collisions                

          0 lost carrier, - no carrier

2. 端口下有错包

端口下有错包有以下几种可能的故障原因,可使用排除法定位:

·     端口本身硬件故障:通过将连接端口的线缆连接到配置相同且可正常工作的端口查看是否端口本身硬件故障。如果是端口本身硬件故障,请将线缆连接到可正常工作的端口。

·     链路上光模块、光纤或以太网双绞线故障:通过更换完好的光模块、光纤或以太网双绞线定位是否光纤或以太网双绞线故障。如果是光模块、光纤或以太网双绞线故障,请更换完好的光模块、光纤或以太网双绞线。

·     对端配置问题,查看对端速率、双工模式的配置是否和本端一致。如果对端速率和双工模式的配置与本端不一致,请更新配置保证本端和对端速率和双工模式的配置一致。

·     当通过上述方法无法解决错包问题需要联系技术支持时,请先通过如下方法收集信息,然后前往步骤7

# 进入Probe视图(使用probe命令进入),先确认面板端口对应的芯片端口。

[H3C-probe] debug port mapping slot 1

 

[Interface] [Unit] [Port] [Name] [Combo?] [Active?] [IfIndex]  [MID]  [Link]

===============================================================================

 XGE1/0/1     0      1     xe0     no        no      0x1         4     up

 XGE1/0/2     0      2     xe1     no        no      0x2         4     down

 XGE1/0/3     0      3     xe2     no        no      0x3         4     down

 XGE1/0/4     0      4     xe3     no        no      0x4         4     down

 XGE1/0/5     0      5     xe4     no        no      0x5         4     down

 XGE1/0/6     0      6     xe5     no        no      0x6         4     down

 XGE1/0/7     0      7     xe6     no        no      0x7         4     down

 XGE1/0/8     0      8     xe7     no        no      0x8         4     down

 XGE1/0/9     0      9     xe8     no        no      0x9         4     down

 XGE1/0/10    0      10    xe9     no        no      0xa         4     down

 XGE1/0/11    0      11    xe10    no        no      0xb         4     down

 XGE1/0/12    0      12    xe11    no        no      0xc         4     down

 XGE1/0/13    0      13    xe12    no        no      0xd         4     down

 XGE1/0/14    0      14    xe13    no        no      0xe         4     down

 XGE1/0/15    0      15    xe14    no        no      0xf         4     down

# 查到Ten-GigabitEthernet1/0/1对应的芯片端口名字为xe0,然后执行下面命令两次或两次以上,查看是否有接收丢包统计(RDBGC)和发送丢包统计(TDBGC)计数。如果有将相关信息反馈技术支持。

[H3C-probe] bcm slot 1 chip 0 show/c/xe0

RDBGC2.xe0        :                 8,118              +8,118

R511.xe0          :                 8,118              +8,118

RPKT.xe0          :                 8,118              +8,118

RMCA.xe0          :                 8,118              +8,118

RPOK.xe0          :                 8,118              +8,118

RBYT.xe0          :             2,726,553          +2,726,553

T511.xe0          :                 8,208              +8,208

TPOK.xe0          :                 8,208              +8,208

TPKT.xe0          :                 8,208              +8,208

TMCA.xe0          :                 8,208              +8,208

TBYT.xe0          :             2,741,472          +2,741,472

PERQ_PKT(3).xe0   :                 8,208              +8,208

PERQ_BYTE(3).xe0  :             2,741,472          +2,741,472             330/s

例如上述显示信息表示设备存在RDBGC2(组播相关丢包),如果执行上面命令两次或两次以上均显示RDBGC2丢包,则需要收集设备实际的丢包情况(丢包的业务模块、端口以及端口的配置)和上述显示信息反馈给技术支持。

3. 报文因匹配ACL被过滤

(1)     检查端口、VLAN以及全局下是否配置了ACLQoS策略,如果配置了ACLQoS策略,请检查端口进入的报文是否匹配了ACLQoS策略的流分类而被丢弃,包括端口下的packet-filter(使用display packet-filter查看)qos policy(使用display qos policy查看)vlan policy(使用display qos vlan-policy查看)以及global policy(使用display qos policy global查看)如果报文因匹配了ACLQoS策略的流分类而被丢弃,请参考ACLQoS的配置方法通过更新配置使报文不被丢弃。

(2)     检查是否因匹配一些特性自动创建的的ACL而被过滤在以太网接口视图下使用display this命令查看端口下是否配置了下面特性或使用特性相关的具体命令查看

端口是否配置ip source bindingip verify source,使用display ip source binding/ display ipv6 source binding可以查看绑定表项信息。如果端口配置了ip source guard且通过上述 display命令发现没有匹配报文的表项,请根据您使用的绑定表项的生成方法进一步排查。

4. 端口被协议设置为block状态

·     使用display stp brief命令查看端口是否被stp设置为discarding状态。如果端口被stp设置为discarding状态,请根据stp的相关配置进一步排查。H3C建议您将连接终端设备的端口配置为边缘端口或关闭该端口的stp功能。

·     如果端口属于某个聚合组,使用display link-aggregation verbose命令查看聚合口的详细信息,当该端口StatusUnselected状态时,该端口无法收发数据报文。请定位端口成为Unselected状态的原因,如聚合组内成员端口的属性类配置与参考端口不一致,进一步排查解决。

5. 配置相关丢包

·     在以太网接口视图下使用display this命令查看端口是否在报文所属VLAN。如果端口不在报文所属VLAN中,请将端口加入该VLAN

·     使用display mac-address blackhole命令查看是否因为匹配了黑洞MAC地址表项被丢包。请根据实际情况确定是否可以取消该黑洞MAC。如果需要删除该黑洞MAC,请使用undo mac-address blackhole mac-address vlan vlan-id命令删除。

·     使用display qos lr interface查看是否有端口限速的配置。如果端口有限速的配置,请查看令牌生成速度和突发流量配置值是否合理,可以通过使用qos lr { inbound | outbound } cir committed-information-rate [ cbs committed-burst-size ]命令调整令牌生成速度和突发流量配置值定位解决。

·     在以太网接口视图下使用display this命令查看端口是否有风暴抑制相关配置,包括广播风暴抑制比broadcast-suppression),组播风暴抑制比multicast-suppression),未知单播风暴抑制比unicast-suppression)。如果端口下配置了风暴抑制比,可以通过将风暴抑制比的数值调大定位解决。

6. 拥塞丢包

通过display qos queue-statistics interface命令查看端口是否有拥塞丢包。请参考拥塞管理的相关内容定位解决拥塞问题。

7. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

6.1.4  故障诊断命令

命令

说明

display interface

显示以太网端口的相关信息

display packet-filter

显示ACL在报文过滤中的应用情况

display qos policy

显示用户定义策略的配置信息

display qos policy interface

显示指定端口或所有端口上QoS策略的配置信息和运行情况

display qos vlan-policy

显示基于VLAN应用QoS策略的信息

display qos policy global

显示基于全局应用QoS策略的信息

display this

在以太网接口视图下使用此命令查看接口的当前配置

display ip source binding/ display ipv6 source binding

查看IP Source Guard绑定表项信息

display link-aggregation verbose

查看聚合口的详细信息

display mac-address blackhole

查看黑洞MAC地址表项信息

display qos lr interface

显示端口限速配置情况

display qos queue-statistics interface

显示端口队列统计信息

 

6.2  三层转发丢包故障

6.2.1  故障描述

设备三层转发丢包,即发送端IP地址和目的端IP地址不在同一网段内,通信过程中有丢包。

6.2.2  故障处理流程

图6-2 三层转发丢包故障诊断流程图

6.2.3  故障处理步骤

1. 检查端口是否有故障

根据6.1  二层流量转发丢包一节的故障定位处理方法,定位是否是设备端口故障(包括端口硬件故障和端口配置故障):

·     如果是端口故障,请按照6.1  二层流量转发丢包节的故障处理思路进行处理。

·     如果不是端口故障,则执行步骤2

2. 查看ARP表项是否正确

使用display arp命令查看设备上是否学习到网关设备的ARP表项、学习到的ARP表项是否正确:

·     如果设备上未学习到ARP表项或学习到的表项错误,通过在用户视图打开debugging arp packet查看设备ARP表项学习情况,来定位ARP问题的原因。对于未学习到ARP表项,可以使用arp static命令手工添加静态ARP表项

·     使用display mac-address命令查看对应的MAC地址表项的出接口和ARP表项中的出接口是否一致,如果不一致,使用reset命令清除ARP表项,让设备重新学习表项。

·     如果设备上ARP表项学习正确,请执行步骤3

3. 查看路由表项是否正确

使用display ip routing-table命令查看设备上学习的路由信息是否正确:

·     如果设备上学习到的路由信息不正确,请根据您使用的具体的路由协议进行进一步排查。

·     使用display fib命令查看对应的FIB表项的出接口和路由表项中的出接口是否一致,如果不一致,使用reset命令清除路由表项,让设备重新学习表项。

·     如果设备上的路由信息正确,请执行步骤4

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

6.2.1  故障诊断命令

命令

说明

debugging arp packet

打开ARP的报文调试信息开关

display arp

显示ARP表项

display ip routing-table

显示路由表中当前激活路由的摘要信息

display mac-address

显示MAC地址表信息

display fib

显示FIB表项的信息

 

6.3  协议震荡故障处理

6.3.1  故障描述

协议震荡一般都是协议报文交互时不通导致的。

6.3.2  故障处理流程

图6-3 协议震荡故障诊断流程图

 

6.3.3  故障处理步骤

1. 查看二层转发是否丢包

根据6.1  二层流量转发丢包一节的故障定位处理方法,定位是否是设备端口故障(包括端口硬件故障和端口配置故障):

如果是端口故障,请按照6.1  二层流量转发丢包节的故障处理思路进行处理。

如果不是端口故障,则执行步骤2

2. 查看三层转发是否丢包

根据6.2  三层转发丢包故障一节的故障定位处理方法,定位是否为三层故障(包括ARP表项错误和路由表项错误):

如果是三层故障,请按照6.2  三层转发丢包故障一节的故障处理思路进行处理。

如果不是三层故障,则执行步骤3

3.  查看软件收包是否丢包

# 进入Probe视图。

[H3C-Probe] debug rxtx softcar show slot 1

ID  Type                RcvPps Rcv_All    DisPkt_All Pps  Dyn Swi Hash ACLmax  

0   ROOT                0      0          0          300  S   On  SMAC 0       

1   ISIS                0      0          0          200  D   On  SMAC 8       

2   ESIS                0      0          0          100  S   On  SMAC 8       

3   CLNP                0      0          0          100  S   On  SMAC 8       

4   VRRP                0      0          0          1024 S   On  SMAC 8       

5   UNKNOWN_IPV4MC      0      0          0          100  S   On  SMAC 8       

6   UNKNOWN_IPV6MC      0      0          0          100  S   On  SMAC 8       

7   IPV4_MC_RIP         0      0          0          150  D   On  SMAC 8       

8   IPV4_BC_RIP         0      0          0          150  D   On  SMAC 8     

DisPkt_All为丢包计数,Rcv_All为收包总数,RcvPps为接收速率。如果发现有丢包发生,请收集信息,然后前往步骤4

4. 寻求技术支持

如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。

6.4  风扇异常

6.4.1  故障描述

设备风扇工作不正常。

6.4.2  故障处理流程

图6-4 风扇异常故障处理流程图

 

6.4.3  故障处理步骤

1. 查看风扇风向

通过display fan命令查看风扇本身的风向和通过命令行配置的风向是否一致,如果不一致可以通过fan prefer-direction slot slot-number { power-to-port | port-to-power }命令设置风向。

[Sysname] display fan

Slot 1:

 Fan 1:

 State    : FanDirectionFault

 Airflow Direction: Port-to-power

 Prefer Airflow Direction: Power-to-port

 Fan 2:

 State    : FanDirectionFault

 Airflow Direction: Port-to-power

 Prefer Airflow Direction: Power-to-port             

 

[Sysname] fan prefer-direction slot 1 port-to-power

[Sysname]display fan

Slot 1:

 Fan 1:

 State    : Normal

 Airflow Direction: Port-to-power

 Prefer Airflow Direction: Port-to-power

 Fan 2:

 State    : Normal

 Airflow Direction: Port-to-power

 Prefer Airflow Direction: Port-to-power   

2. 确认风扇是否损坏。

如果风向问题已经排除,但风扇状态仍显示为fault,请更换风扇。

3. 寻求技术支持

如果故障仍无法排除,请联系H3C的技术支持工程师。

6.4.4  故障诊断命令

命令

说明

display fan

显示风扇的工作状态

fan prefer-direction slot slot-number { power-to-port | port-to-power }

配置用户期望的风扇模块的风道方向

 

新华三官网
联系我们