手册下载
H3C SOHO交换机 故障排除手册(Comware V5)-6W101-整本手册.pdf (325.94 KB)
H3C SOHO交换机 故障排除手册
(Comware V5)
Copyright © 2017 新华三技术有限公司 版权所有,保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部, 并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。 |
|
本文档适用于H3C SOHO交换机(基于Comware V5),不严格和具体的软件版本对应。
H3C SOHO交换机目前包含的产品系列有:
S2100、S2600、S3110、S3110-SI、S5000PV2-EI、S5110、S5110-D、S5110-SI、S1850、IE4100和IE4300。
按端口速率可以划分为如下两类:
· 百兆下行+千兆上行:S2100、S2600、S3110、S3110-SI和IE4100 ;
· 上下行全千兆:S5000PV2-EI、S5110、S5110-D、S5110-SI、S1850和IE4300。
按下行端口数量,H3C SOHO交换机可分为4端口设备、8端口设备、16端口设备、24端口设备和48端口设备。不同系列的交换机的下行端口数量有所差异,请以实际情况为准。
仅设备丝印中带有“PWR”或“HPWR”的设备支持PoE。
各系列包括的具体交换机产品型号,可以通过H3C网站(www.h3c.com)进行查询:
(1) 请访问网址:http://www.h3c.com/cn/Technical_Documents;
(2) 查询产品类别和产品型号。
用户下发ACL失败,具体分两种失败情况:
· 执行下发命令后设备提示硬件资源不足或其他提示信息。
· 执行下发命令后设备无任何错误提示,但ACL不起作用。
图1-1 ACL下发失败故障诊断流程图
下发ACL配置时如果界面打印出“Reason: Not enough hardware resource”字样,则表明ACL下发失败是由硬件资源不足或该ACL已被引用导致。通过display acl resource命令可以进一步确认ACL硬件资源使用情况,如果显示信息中Remaining条目为0,则表示ACL硬件资源用尽,设备无法再下发ACL(有部分ACL资源是系统保留,剩余ACL不为0的情况下也可能资源用尽)。若ACL资源足够,则通过display qos policy interface等命令查看已下发的ACL number。如果下发时没有报“Reason: Not enough hardware resource”字样,则根据下发方式进行步骤选择,如果是通过MQC(QoS策略)方式下发请进行步骤2,通过包过滤(packet-filter)方式下发请进行步骤3。
如果是,则检查packet-filter配置是正确。可以通过display packet-filter命令检查packet-filter配置是否正确,如果不正确,则进行正确配置,否则进行步骤4。
通过下面命令分别检查不同使用情况下QoS策略的配置情况:
· 显示端口上QoS策略配置信息,display qos policy interface
· 显示VLAN上QoS策略配置信息,display qos vlan-policy
· 显示全局QoS策略配置信息,display qos policy global
如果QoS策略中缺少流分类和流行为关联的配置,则补充相应配置。否则可通过下面两个命令分别检查下QoS策略中的类和流行为是否配置正确。
· 显示配置的类信息,display traffic classifier user-defined
· 显示配置的流行为信息,display traffic behavior user-defined
如果没有正确配置,则进行正确配置,否则进行步骤4。
可以通过display acl命令检查ACL是否配置正确,如果不正确,则进行正确配置,否则进行步骤5。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
display acl resource |
显示ACL资源的使用情况 |
display qos policy interface |
显示指定端口或所有端口上QoS策略的配置信息和运行情况 |
display qos vlan-policy |
显示基于VLAN应用QoS策略的信息 |
display qos policy global |
显示基于全局应用QoS策略的信息 |
display traffic classifier user-defined |
显示配置的类信息 |
display traffic behavior user-defined |
显示配置的流行为信息 |
display packet-filter |
显示ACL在报文过滤中的应用情况 |
用户配置聚合后,发现聚合失败。
图2-1 聚合不成功故障诊断流程图
根据聚合规划进行线路检查,检查物理线路是否完全按照规划进行连接。
通过display interface命令查看聚合组中的成员端口是否处于UP状态。如果没有UP,可按照端口不UP故障流程处理,具体请参见3.1 端口不Link up故障处理。
在本设备上通过执行display current-configuration interface查看聚合接口及本端Unselected端口的属性类配置和第二类配置与参考端口是否相同。如果配置不同,则将其配置相同。
若不是动态聚合,则直接到步骤6,否则进行步骤5。
在与本端Unselected状态端口相连接设备上执行display current-configuration interface命令查看对端Unselected端口的属性类配置和第二类配置与参考端口的对端端口是否相同。如果配置不同,则将其配置相同。
通过display link-aggregation verbose命令查看聚合组中成员端口是否超过8个。如果成员端口超过8个,则编号较大的端口将成为Unselected状态。可以在以太网接口视图下使用undo port link-aggregation group命令将Selected端口中不适用的端口从聚合组中删除,以使必须使用的端口为Selected状态。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
display current-configuration interface |
显示接口当前生效的配置 |
display interface |
显示以太网接口的相关信息 |
display link-aggregation verbose |
显示系统上已有的二层聚合接口或三层聚合接口所对应的聚合组的详细信息 |
端口和对端连接,无法Link up。
图3-1 端口不Link up故障诊断流程图
重新插拔网线,看端口是否UP。
执行display interface brief命令,查看对应接口显示信息的第二列是否显示为ADM。若为ADM,请通过undo shutdown命令激活端口。
执行display interface brief命令,查看端口显示信息的速率与双工是否与对端一致。若不一致,请通过speed命令和duplex命令配置端口的速率和双工模式。
检查端口与对端的MDI配置,如果两端类型均不为auto,且不一致使用交叉线可以up,使用平行线不能up。如果两端类型均不为auto,且一致使用交叉线不能up,使用平行线可以up。
保证本端光模块的发送口连接对端光模块的接收口,本端光模块的接收口连接对端光模块的发送口。
检查网线、光纤的时候,将网线/光纤插到其他能够正常up的端口,如果不能up,说明网线有问题。
检查光模块的方法与检查网线的方式类似,同时也看一下光口的光模块类型及其波长是否匹配。
如果是光口,检查光模块的类型和波长是否匹配。光模块标签上没标明的可以通过display transceiver interface命令查看。
<Sysname> display transceiver interface gigabitethernet 1/0/25
GigabitEthernet1/0/25 transceiver information:
Transceiver Type : 1000_BASE_SX_SFP
Connector Type : LC
Wavelength(nm) : 1310
Transfer Distance(km) : 2000(50um),2000(62.5um)
Digital Diagnostic Monitoring : YES
Vendor Name : FINISAR CORP.
Part Number : FTLF1217P2BTL
Serial Number : PK433HA
[Sysname-GigabitEthernet1/0/2] loopback internal
%Apr 26 12:40:25:309 2000 60CPWR IFNET/4/LINK UPDOWN:
GigabitEthernet1/0/2: link status is UP
%Apr 26 12:40:25:531 2000 60CPWR IFNET/4/LINK UPDOWN:
GigabitEthernet1/0/2: link status is DOWN
Loop internal succeeded!
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
display device |
显示设备信息 |
display interface brief |
显示所有端口的概要信息 |
display transceiver interface |
显示接口上插入的可插拔接口模块的主要特征参数 |
loopback internal |
开启以太网端口的内部环回测试功能 |
设备二层转发丢包,即源端和目的端在同一二层网络的同一VLAN内,通信过程中有丢包。
图4-1 二层流量转发丢包故障诊断流程图
使用display interface命令查看端口下是否有错包。如果有错包,请前往步骤2,如果没有错包,请前往步骤3进行后续步骤的检查。
<H3C> display interface GigabitEthernet1/0/36
GigabitEthernet1/0/36 current state: UP
IP Packet Frame Type: PKTFMT_ETHNT_2, Hardware Address: 000f-e200-002b
……
Last 300 seconds output: 0 packets/sec 10 bytes/sec -%
Input (total): 57 packets, 7838 bytes
0 unicasts, 50 broadcasts, 2 multicasts, 0 pauses
Input (normal): 52 packets, - bytes
0 unicasts, 50 broadcasts, 2 multicasts, 0 pauses
Input: 5 input errors, 0 runts, - giants, - throttles
5 CRC, - frame, 0 overruns, 0 aborts
- ignored, - parity errors
端口下有错包有以下几种可能的故障原因,可使用排除法定位:
· 端口本身硬件故障:通过将连接端口的线缆连接到配置相同且可正常工作的端口查看是否端口本身硬件故障。如果是端口本身硬件故障,请将线缆连接到可正常工作的端口。
· 链路上光模块、光纤或以太网双绞线故障:通过更换完好的光模块、光纤或以太网双绞线定位是否光纤或以太网双绞线故障。如果是光模块、光纤或以太网双绞线故障,请更换完好的光模块、光纤或以太网双绞线。
· 对端配置问题,查看对端速率、双工模式的配置是否和本端一致。如果对端速率和双工模式的配置与本端不一致,请更新配置保证本端和对端速率和双工模式的配置一致。
如果通过上述方法仍然无法解决错包问题,请前往步骤7。
(1) 检查端口、VLAN以及全局下是否配置了ACL或QoS策略,如果配置了ACL或QoS策略,请检查端口进入的报文是否因匹配了ACL或QoS策略的流分类而被丢弃,包括端口下的packet-filter(使用display packet-filter查看)、qos policy(使用display qos policy查看),vlan policy(使用display qos vlan-policy查看)以及global policy(使用display qos policy global查看)。如果报文因匹配了ACL或QoS策略的流分类而被丢弃,请参考ACL或QoS的配置方法通过更新配置使报文不被丢弃。
(2) 检查是否因匹配一些特性自动创建的ACL而被过滤,在以太网接口视图下使用display this命令查看端口下是否配置了下面特性或使用特性相关的具体命令查看:
· 端口是否配置ip source binding或ip verify source,使用display ip source binding/ display ipv6 source binding可以查看绑定表项信息。如果端口配置了ip source guard且通过上述display命令发现没有匹配报文的表项,请根据您使用的绑定表项的生成方法进一步排查。
· 使用display stp brief命令查看端口是否被STP设置为Discarding状态。如果端口被STP设置为Discarding状态,请根据STP的相关配置进一步排查。H3C建议您将连接终端设备的端口配置为边缘端口或关闭该端口的STP功能。
· 如果端口属于某个聚合组,使用display link-aggregation verbose命令查看聚合口的详细信息,当该端口Status为Unselected状态时,该端口无法收发数据报文。请定位端口成为Unselected状态的原因,如聚合组内成员端口的属性类配置与参考端口不一致,进一步排查解决。
· 在以太网接口视图下使用display this命令查看端口是否在报文所属VLAN中。如果端口不在报文所属VLAN中,请将端口加入该VLAN。
· 使用display mac-address blackhole命令查看是否因为匹配了黑洞MAC地址表项被丢包。请根据实际情况确定是否可以取消该黑洞MAC。如果需要删除该黑洞MAC,请使用undo mac-address blackhole mac-address vlan vlan-id命令删除。
· 使用display qos lr interface查看是否有端口限速的配置。如果端口有限速的配置,请查看令牌生成速度的配置值是否合理,可以通过使用qos lr { inbound | outbound } cir committed-information-rate命令调整令牌生成速度的配置值定位解决。
· 在以太网接口视图下使用display this命令查看端口是否有风暴抑制相关配置,包括广播风暴抑制比(broadcast-suppression),组播风暴抑制比(multicast-suppression),未知单播风暴抑制比(unicast-suppression)。如果端口下配置了风暴抑制比,可以通过将风暴抑制比的数值调大定位解决。
通过display interface命令查看端口是否达到或者接近端口带宽上限。请参考拥塞管理的相关内容定位解决拥塞问题。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
display interface |
显示以太网端口的相关信息 |
display packet-filter |
显示ACL在报文过滤中的应用情况 |
显示用户定义策略的配置信息 |
|
display qos policy interface |
显示指定端口或所有端口上QoS策略的配置信息和运行情况 |
display qos vlan-policy |
显示基于VLAN应用QoS策略的信息 |
display qos policy global |
显示基于全局应用QoS策略的信息 |
display this |
在以太网接口视图下使用此命令查看接口的当前配置 |
display ip source binding/ display ipv6 source binding |
查看IP Source Guard绑定表项信息 |
display link-aggregation verbose |
查看聚合口的详细信息 |
display mac-address blackhole |
查看黑洞MAC地址表项信息 |
display qos lr interface |
显示端口限速配置情况 |
设备三层转发丢包,即发送端IP地址和目的端IP地址不在同一网段内,通信过程中有丢包。
图4-2 三层转发丢包故障诊断流程图
根据4.1 二层流量转发丢包一节的故障定位处理方法,定位是否是设备端口故障(包括端口硬件故障和端口配置故障):
· 如果是端口故障,请按照4.1 二层流量转发丢包一节的故障处理思路进行处理。
· 如果不是端口故障,则执行步骤2。
使用display arp命令查看设备上是否学习到网关设备的ARP表项、学习到的ARP表项是否正确:
· 如果设备上未学习到ARP表项或学习到的表项错误,通过打开debugging arp packet查看设备ARP表项学习情况,来定位ARP问题的原因。对于未学习到ARP表项,可以使用arp static命令手工添加静态ARP表项。
· ARP表项达到规格上限。这里分两种情况,一种是学习的ARP表项到达系统学习上限,此时ARP将不能学习,系统会返回相应的提示。一种是学习的ARP表项达到硬件转发资源上限。因为系统硬件资源有限,不能保证每个学习到的ARP都支持三层转发,超过硬件转发资源的ARP表项,不能进入三层转发(即使可以通过CPU转发,其效率也非常低下)。
· 如果设备上ARP表项学习正确,请执行步骤3。
使用display ip routing-table命令查看设备上学习的路由信息是否正确:
· 如果设备上学习到的路由信息不正确,请根据您使用的具体的路由协议进行进一步排查。
· 网段是否存在嵌套,例如192.168.1.0/24和192.168.1.32/27。规划良好的网络不应出现网段嵌套。正常情况下,路由遵循最长匹配原则转发,目的地址同时匹配上述两个网段的报文,选择掩码最长的路由转发。但是如果存在直连网段,且目的IP正好落在直连网段中并且已经学习到了ARP,则直连网络优先。
· 路由数量是否达到系统硬件资源上限。手工配置的静态路由和路由协议动态下发的路由都可以注入设备路由表,但硬件资源有限,不能保证所有的路由都能分配到硬件资源。超过硬件资源上限的部分路由,不能进入三层转发。
· 如果设备上的路由信息正确,请执行步骤4。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
debugging arp packet |
打开ARP的报文调试信息开关 |
display arp |
显示ARP表项 |
display ip routing-table |
显示路由表中当前激活路由的摘要信息 |
设备使用千兆SFP模块时,端口不UP。
图4-3 千兆SFP模块端口不UP故障诊断流程图
对接的两个光口插入的光模块和光纤必须匹配才可以UP。请使用排除法(例如更换光模块或者光纤)确定端口不UP问题是否和插入SFP端口的光模块或光纤相关。
若对接的SOHO设备光口为光电复合口,请进入物理端口视图,通过combo enable fiber命令来激活Combo接口的光口,使用光纤连接。
若上述步骤不能解决故障,请尝试反复插拔光模块,由于光模块产品的规格较多,可能会造成与设备千兆SFP模块端口的兼容性问题,致使不能UP。
若通过上述步骤(更换光模块及光纤无效,切换Combo接口模式无效,反复插拔无效,设备重新上电后故障仍然存在)端口仍未UP,请通过display diagnostic-information命令收集诊断信息,并转到步骤5。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
combo enable fiber |
表示该Combo接口的光口被激活,使用光纤连接 |
display diagnostic-information |
显示或保存系统当前多个功能模块运行的统计信息 |
PoE设备供电不正常。
图4-4 PoE供电异常故障诊断流程图
在任意视图中执行display poe device命令查看显示PSE的工作状态。如果State字段显示
faulty,则说明PSE故障。如下所示:
<Sysname> display poe device
PSE ID SlotNo SubSNo PortNum MaxPower(W) State Model
1 1 0 24 370 faulty LSW-BCM-POE
以上显示信息说明该PSE存在故障。此时,请使用poe update命令升级PSE软件。升级方法如下所示:
<Sysname> system-view
[Sysname] poe update full ver_3_9_0_release.bin
This command will fully update firmware on the specific PSE(s), Continue? [Y/N]:y
System is downloading firmware into the hardware. Please wait ..................
Update firmware on the specific PSE(s) successfully!
以上显示信息说明PSE软件升级成功。再次执行display poe device命令查看显示PSE的工作状态。如果工作状态显示为on或off,则说明PSE故障已修复。如下所示:
[Sysname] display poe device
PSE ID SlotNo SubSNo PortNum MaxPower(W) State Model
1 1 0 24 370 on LSW-BCM-POE
在任意视图中执行display poe pse命令查看显示PSE的信息。确认当前整机供电功率、平均功率、峰值功率是否正常、PSE检测非标准PD功能是否打开等。如下所示:
[Sysname] display poe pse
PSE ID : 1
PSE Slot No : 1
PSE SubSlot No : 0
PSE Model : LSW-BCM-POE
PSE Current Power : 0 W
PSE Average Power : 0 W
PSE Peak Power : 0 W
PSE Max Power : 370 W
PSE Remaining Guaranteed : 370 W
PSE CPLD Version : -
PSE Software Version : 130
PSE Hardware Version : 57617
PSE Legacy Detection : disabled
PSE Utilization-threshold : 80
· 如果当前整机供电功率、平均功率、峰值功率都达到或接近PSE最大供电功率,说明PoE电源模块供电不足,此时请选配更大供电功率的PoE电源模块。
· 如果PSE Legacy Detection 字段显示为disabled,请执行poe legacy enable命令,开启PSE检测非标准PD功能。
在任意视图中执行display poe interface interface-type interfece-number命令查看显示PoE端口的相关信息。确认当前端口供电功率、平均功率、峰值功率是否正常,端口的电流、电压是否正常。如下所示:
[Sysname] display poe interface Ethernet 1/0/1
Port Power Enabled : disabled
Port Power Priority : low
Port Operating Status : power-deny
Port IEEE Class : 0
Port Detection Status : disabled
Port Power Mode : signal
Port Current Power : 0 mW
Port Average Power : 0 mW
Port Peak Power : 0 mW
Port Max Power : 30000 mW
Port Current : 0 mA
Port Voltage : 0.0 V
Port PD Description :
如果当前端口供电功率、平均功率、峰值功率都达到或接近端口最大供电功率,说明PoE端口供电不足,此时请执行poe max-power命令重新配置PoE端口的最大供电功率。
如果上述检查完成后故障仍无法排除,请联系H3C的技术支持工程师。
命令 |
说明 |
display poe device |
查看显示PSE的工作状态 |
display poe pse |
查看显示PSE的信息 |
display poe interface interface-type interfece-number |
查看显示PoE端口的相关信息 |
poe legacy enable |
开启PSE检测非标准PD功能 |
poe max-power |
配置PoE端口的最大供电功率 |