整本手册
本章节下载 (680.53 KB)
H3C CR16000-X核心路由器
故障处理手册
Copyright © 2017 新华三技术有限公司 版权所有,保留一切权利。 非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部, 并不得以任何形式传播。本文档中的信息可能变动,恕不另行通知。 |
|
本文档介绍CR16000-X核心路由器产品常见故障的诊断及处理措施。
设备正常运行时,建议在完成重要功能的配置后,及时保存并备份当前配置,以免设备出现故障后配置丢失。建议定期将配置文件备份至远程服务器上,以便故障发生后能够迅速恢复配置。
在进行故障诊断和处理时,请注意以下事项:
· 设备出现故障时,请尽可能全面、详细地记录现场信息(包括但不限于以下内容),搜集信息越全面、越详细,越有利于故障的快速定位。
¡ 记录具体的故障现象、故障时间、配置信息。
¡ 记录完整的网络拓扑,包括组网图、接口连接关系、故障位置。
¡ 搜集设备的日志信息和诊断信息(搜集方法见1.2 如何搜集设备运行信息)。
¡ 记录设备故障时单板、电源、风扇指示灯的状态,或给现场设备拍照记录。
¡ 记录现场采取的故障处理措施(比如配置操作、插拔线缆、手工重启设备)及实施后的现象效果。
¡ 记录故障处理过程中配置的所有命令行显示信息。
· 更换和维护设备部件时,请佩戴防静电腕带,以确保您和设备的安全。
· 故障处理过程中如需更换硬件部件,请参考与软件版本对应的版本说明书,确保新硬件部件和软件版本的兼容性。
为方便故障快速定位,请使用命令info-center enable开启信息中心。缺省情况下信息中心处于开启状态。
设备运行过程中会产生logfile、diagfile日志信息及记录设备运行状态的诊断信息。这些信息存储在主控板的Flash中,可以通过FTP、TFTP、USB等方式导出。不同主控板中导出的logfile、diagfile、诊断信息文件请按照一定规则存放,避免不同主控板的运行信息相互混淆,以方便查询。
表1-1 设备运行信息介绍
分类 |
文件名 |
内容 |
logfile日志 |
logfileX.log |
命令行记录、设备运行中产生的记录信息 |
diagfile日志 |
diagfileX.log |
设备运行中产生的诊断日志信息,如系统运行到错误流程时的参数值、单板无法启动时的信息、主控板与接口板通信异常时的握手信息 |
诊断信息 |
XXX.gz |
系统当前多个功能模块运行的统计信息,包括设备状态、CPU状态、内存状态、配置情况、软件表项、硬件表项等 |
对于logfile日志和diagfile日志,当日志文件写满,产生新的日志文件时,设备会将旧的日志文件自动压缩成.gz文件。
(1) 系统视图下执行logfile save命令将设备缓存的logfile日志保存在Flash中。并将日志搜集完整,包括主用主控板、备用主控板的日志。
<Sysname> logfile save
The contents in the log file buffer have been saved to the file flash:/logfile/l
ogfile3.log
(2) 查看主用主控板、备用主控板的日志文件数目和名称。
· 主用主控板logfile日志
<Sysname> dir flash:/logfile/
Directory of flash:/logfile
0 -rw- 21863 May 11 2017 16:00:37 logfile1.log.gz
1 -rw- 21863 Jun 14 2017 15:39:30 logfile2.log.gz
2 -rw- 21863 Jun 24 2017 18:48:29 logfile3.log
1021104 KB total (421552 KB free)
· 备用主控板logfile日志
<Sysname> dir slot1#flash:/logfile/
Directory of slot1#flash:/logfile
0 -rw- 21863 Jul 11 2017 16:00:37 logfile1.log
1021104 KB total (421552 KB free)
(1) 系统视图下执行diagnostic-logfile save命令将设备缓存的diagfile日志文件保存在Flash中。并将日志搜集完整,包括主用主控板、备用主控板的日志。
<Sysname> diagnostic-logfile save
The contents in the diagnostic log file buffer have been saved to the file flash:/diagfile/diagfile1.log
(2) 查看主用主控板、备用主控板diagfile日志文件数目和名称
· 主用主控板diagfile日志
<Sysname> dir flash:/diagfile/
Directory of flash:/diagfile
0 -rw- 161321 Jul 11 2017 16:16:00 diagfile1.log
1021104 KB total (421416 KB free)
· 备用主控板diagfile日志:
<Sysname> dir slot1#flash:/diagfile/
Directory of slot1#flash:/diagfile
0 -rw- 161321 Jul 11 2017 16:16:00 diagfile1.log
1021104 KB total (421416 KB free)
诊断信息可以通过两种方式搜集:将诊断信息保存到文件,或者将诊断信息直接显示在屏幕上。为保证信息搜集的完整性,建议您使用将诊断信息保存到文件的方式搜集诊断信息。
需要注意的是,设备上单板越多,诊断信息搜集的时间越长,信息搜集期间不能输入命令,请耐心等待。
通过Console口搜集诊断信息所用的时间比通过业务网口搜集所用的时间要长。在有可用业务网口或管理口的情况下,建议通过业务网口或管理口登录和传输文件。
(1) 系统视图下执行screen-length disable命令,以避免屏幕输出显示信息被打断(如果是将诊断信息保存到文件中,则跳过此步骤)。
<Sysname> screen-length disable
(2) 系统视图下执行display diagnostic-information命令搜集诊断信息。
<Sysname> display diagnostic-information
Save or display diagnostic information (Y=save, N=display)? [Y/N] :
(3) 选择将诊断信息保存至文件中,还是直接在屏幕上显示
· 输入“Y”,以及保存诊断信息的路径和名称,将诊断信息保存至文件中。
Save or display diagnostic information (Y=save, N=display)? [Y/N] : Y
Please input the file name(*.tar.gz)[flash:/default.tar.gz] :20170624.tar.gz
Diagnostic information is outputting to flash:/20170624.tar.gz.
Please wait...
Save successfully.
<Sysname> dir flash:/
Directory of flash:
……
6 -rw- 898180 Jun 26 2017 09:23:51 20170624.tar.gz
1021808 KB total (259072 KB free)
· 输入“N”,将诊断信息直接显示在屏幕上。
Save or display diagnostic information (Y=save, N=display)? [Y/N] :N
===========================================================
===============display alarm===============
No alarm information.
=========================================================
===============display boot-loader===============
Software images on slot 0:
Current software images:
flash:/CR16000-X-CMW710-BOOT-A13011501-MPUC.bin
flash:/CR16000-X-CMW710-SYSTEM-A13011501-MPUC.bin
flash:/CR16000-X-CMW710-DEVKIT-A13011501-MPUC.bin
Main startup software images:
flash:/CR16000-X-CMW710-BOOT-A13011501-MPUC.bin
flash:/CR16000-X-CMW710-SYSTEM-A13011501-MPUC.bin
flash:/CR16000-X-CMW710-DEVKIT-A13011501-MPUC.bin
Backup startup software images:
flash:/CR16000-X-CMW710-BOOT-A13011201-MPUC.bin
flash:/CR16000-X-CMW710-SYSTEM-A13011201-MPUC.bin
flash:/CR16000-X-CMW710-DEVKIT-A13011201-MPUC.bin =========================================================
===============display counters inbound interface===============
Interface Total (pkts) Broadcast (pkts) Multicast (pkts) Err (pkts)
HGE3/3/1 0 0 0 0
HGE4/0/2 0 0 0 0
HGE8/0/1 0 0 0 0
HGE8/0/2 0 0 0 0
HGE8/0/3 0 0 0 0
HGE8/0/4 0 0 0 0
HGE9/0/1 0 0 0 0
……
单板状态包括:Normal、Master、Standby、Absent、Wait、Startup、Disable。
Master与Standby分别表示主、备主控板。Normal表示单板处于正常运行状态。
如果发现单板状态出现Wait、Startup、Disable,或该槽位存在单板但状态却显示Absent,说明单板可能出现故障,请参考2.1.2 故障处理步骤处理。
<System> display device
Slot No. Board type Status Primary SubSlots
0 CR-MPU-16C Normal Master 0
1 CR-MPU-16C Normal Standby 0
2 N/A Absent N/A N/A
3 CR-LPU-4004 Normal N/A 4
4 N/A Absent N/A N/A
5 N/A Absent N/A N/A
6 N/A Absent N/A N/A
7 N/A Absent N/A N/A
8 CR-LPU-CC08 Normal N/A 0
9 CR-LPU-CQ12 Normal N/A 0
10 N/A Absent N/A N/A
11 N/A Absent N/A N/A
12 CR-SFU-08C Normal N/A 0
13 CR-SFU-08C Normal N/A 0
14 CR-SFU-08C Normal N/A 0
15 CR-SFU-08C Normal N/A 0
(1) 确认单板是否插稳,如检查单板与机框之间是否有空隙,也可以将单板拔出后重插入。
(2) 将单板放到别的槽位,将框上别的正常的单板放到这个槽位,进一步确认是不是单板故障。
(3) 检查单板面板、内部的指示灯是否发光。
(4) 如果单板是主控板、网板,请连上串口线,查看配置终端上是否有单板正常启动的显示信息、或单板启动是否异常。
(5) 如确认为单板故障,请更换单板并将故障信息发送技术支持人员分析。
(1) 在用户视图下执行命令display power-supply查看当前电源状态是否正常,电源类型是否匹配,如果电源状态异常或电源类型不匹配,请更换电源。
(2) 在用户视图下执行命令display hardware power-management,查看当前系统功率是否充足。
(3) 如果系统功率充足,则确认为单板故障,请更换单板并将故障信息发送技术支持人员分析。
(1) 在用户视图下执行命令display logbuffer | include shutdown,查看是否有单板温度过高导致的下电,如果是温度过高导致的下电,请参考2.4 温度告警处理。
(1) 确认用户有无通过power-supply off命令对单板执行下电操作。如果是用户操作导致,请通过power-supply on命令对单板重新上电。
(2) 否则,单板存在电源故障,请更换单板并将故障信息发送技术支持人员分析。
当主控板上标识电源状态的OK指示灯灭、FAIL指示灯亮时,说明电源系统存在故障。您可以通过查看电源模块的状态指示灯,来确定电源模块是否故障。当电源模块的输入指示灯灭或输出指示灯为红色时,说明该电源模块存在故障。
只有当所有在位的电源模块都正常工作时,主控板上标识电源状态的OK指示灯才亮,FAIL指示灯灭。一旦有电源模块故障,那么OK指示灯灭,FAIL灯亮。
当电源模块发生故障时,请参考下列步骤进行电源故障处理:
(1) 检查电源模块的型号是否和主机型号匹配。CR16000-X核心路由器所用的电源模块型号为PSR2400-54A和PSR2400-54D。
(2) 检查电源线的连接:拔下再重新连接电源线,确认电源线是否松动。
(3) 更换电源线,然后查看电源模块指示灯是否恢复正常。
(4) 检查电源模块的安装:请重新安装电源模块,确保电源模块和机箱背板可靠连接。
(5) 检查路由器连接的供电系统:确认供电系统正常供电,电压正常。检查电源模块配置数量是否满足系统最大功耗要求。
(6) 请检查电源模块是否存在输出短路、输出过流、输出过压、输入欠压、温度过热等问题。
(7) 将电源模块安装至另一个电源槽位,查看其能否正常工作。如果能,说明原电源槽位可能损坏;如果不能,再进行下一步。
(8) 使用一块工作正常的电源模块安装在原电源槽位上,连接相同的电源输入端,查看电源模块能否正常工作。如果能正常工作,则原电源模块可能已损坏,请联系代理商或当地用服工程师进行更换。
主控板及风扇框本身提供有风扇框状态指示灯——OK指示灯和FAIL指示灯,用于故障定位。如果主控板和风扇框上的OK指示灯灭、FAIL指示灯亮时,表示风扇框有故障。
· 为保证设备散热,请确保FAN1和FAN2槽位风扇框均处于在位状态。如果其中一个风扇框故障,在准备好待更换的新风扇框前,请勿拆除该故障风扇框。在故障风扇框继续在位的情况下,一个风扇框可以维持设备正常散热。
· 风扇框支持热插拔,在设备运行状态下进行风扇框的更换时,请注意用电安全。只有在保证一个风扇框正常运行的情况下,才可以插拔另一个风扇框。请在3分钟之内完成风扇框的更换,否则设备会因为温度过高而自动断电。
· 设备严禁在无风扇框在位的情况下带电运行,请勿同时取下两个风扇框。
当风扇框发生故障时,请参考下列步骤进行故障处理:
(1) 如果所有风扇框的指示灯均处于熄灭状态,请确认电源模块是否正常工作,或整机开关连线是否开路,具体请参见2.2 电源故障。
(2) 任意视图下执行display fan命令查看风扇框的工作状态。通过该命令的显示信息可查看每个风扇框槽位的风扇框是否在位、风扇的风向、风扇框中风扇个数、每个风扇的工作状态和转速等信息。
(3) 检查机箱出风口、入风口是否被异物堵塞。如果有异物,请将其清理。
(4) 检查风扇框是否安装到位。可以拉出风扇框,将其重新插入,并拧紧固定螺钉,查看风扇框上的指示灯是否恢复正常。
(5) 检查未安装单板和电源模块的槽位是否安装了假面板。如果未安装,请安装假面板,保证通风效果。
(6) 如果有条件,可尝试更换风扇框,查看更换后的风扇框是否能正常工作。如果能,说明原风扇框已损坏。
(7) 如果您在上述内容的帮助下仍旧无法定位问题,请联系代理商或当地用服工程师进行处理。
设备打印温度过低、过高等告警信息。
(1) 检查环境温度是否正常,如果环境温度较高,请确认原因,比如机房通风不畅、空调制冷故障等。
(2) 系统视图下执行display environment命令,查看当前系统温度是否超出告警温度门限。
<System> display environment
System temperature information (degree centigrade):
Slot Sensor Temperature Status LowerLimit WarningLimit AlarmLimit ShutdownLimit
0 Inflow 1 30 Normal 0 60 65 127
0 Hotspot 1 39 Normal 0 95 102 127
0 Hotspot 2 40 Normal 0 90 95 127
0 Hotspot 3 33 Normal 0 90 95 127
1 Inflow 1 30 Normal 0 60 65 127
1 Hotspot 1 41 Normal 0 95 102 127
1 Hotspot 2 40 Normal 0 90 95 127
……
(3) 如果温度过高,请参考2.3 风扇故障确认是否风扇故障导致。如果仍然无法确认故障原因,请搜集信息并发送给技术支持人员分析。
表2-1 硬件故障诊断命令
命令 |
说明 |
display device |
显示设备信息,检查各单板的状态是否正常 |
display environment |
显示设备的温度信息,检查环境温度是否正常 |
display fan |
显示风扇的工作状态 |
display power-supply |
显示设备上的电源系统信息。详细信息包括下列信息: 电源管理使能状态 电源类型、额定输入电压和额定输出功率 冗余电源模块数,各模块可用的、冗余的、已用的、剩余的功率 在位电源模块的状态 接口板的供电状态 |
display version |
显示系统版本信息、单板的运行时间 |
display logbuffer |
显示系统log信息 |
display hardware power-management |
显示设备功率使用信息 |
在任意视图下执行display interface命令查询接口的入、出方向流量统计信息,发现错包统计计数不为0。
<Sysname> display interface HundredGigE3/3/1
Current state: UP
Line protocol state: UP
Description: HundredGigE3/3/1 Interface
Bandwidth: 100000000 kbps
Maximum transmission unit: 9600
Allow jumbo frames to pass
Broadcast max-ratio: 100%
Multicast max-ratio: 100%
Unicast max-ratio: 100%
Internet address: 12.0.0.1/24 (primary)
IP packet frame type: Ethernet II, hardware address: 000e-e542-cdc0
IPv6 packet frame type: Ethernet II, hardware address: 000e-e542-cdc0
Media type is optical fiber, loopback not set, promiscuous mode not set
100Gbps, Full, link type is force link
Output flow-control is disabled, input flow-control is disabled
CFP2 Transceiver Info:
Vendor name: FINISAR CORP. Port hardware type: 100G_BASE_SR10_CFP2
Ordering Name:
Ethernet port mode: LAN
Port priority: 2
Last link flapping: 1 days 2 hours 30 minutes
Last clearing of counters: 14:22:20 Thu 05/25/2017
Peak input rate: 168385 bytes/sec, at 2017-05-25 14:29:59
Peak output rate: 380280160 bytes/sec, at 2017-05-25 16:10:33
Last 5 second input: 1800 packets/sec 151275 bytes/sec 0%
Last 5 second output: 900658 packets/sec 346763008 bytes/sec 2%
Input (total): 15957121 packets, 1340483912 bytes
15957098 unicasts, 6 broadcasts, 17 multicasts, 0 pauses
Input (normal): 15957121 packets, 1340483912 bytes
15957098 unicasts, 6 broadcasts, 17 multicasts, 0 pauses
Input: 0 input errors, 0 runts, 0 giants, 0 throttles
0 CRC, - frame, - overruns, - aborts
- ignored, - parity errors
Output (total): 6945104273 packets, 2673334145921 bytes
6945103851 unicasts, 0 broadcasts, 444 multicasts, 0 pauses
Output (normal): 6945104273 packets, 2673334145921 bytes
6945103851 unicasts, 0 broadcasts, 444 multicasts, 0 pauses
Output: 0 output errors, - underruns, - buffer failures
- aborts, - deferred, - collisions, - late collisions
- lost carrier, - no carrier
表3-1 接口入方向报文计数错误字段解释
参数 |
说明 |
input errors |
各种输入错误的总数。 |
runts |
表示接收到的超小帧个数。超小帧即接收到的报文小于64字节,且包括有效的CRC 字段,报文格式正确。 |
giants |
是超过接口设置的Maximum Frame Length的报文个数。 |
CRC |
表示接收到的CRC校验错误报文个数。 |
frame |
接口接收时出错的报文。 |
表3-2 接口出方向报文技术错误字段解释
参数 |
说明 |
output errors |
各种输出错误的总数。 |
aborts |
表示发送失败的报文总数。 |
deferred |
表示延迟报文的总数。报文延迟是指因延迟过长的周期而导致发送失败的报文,而这些报文由于发送媒质繁忙而等待了超过2倍的最大报文发送时间。 |
collisions |
表示冲突帧总数,即在发送过程中发生冲突的报文。 |
late collisions |
表示延迟冲突帧,即发送过程中发生延迟冲突超过512bit时间的帧。 |
(1) 使用仪器测试链路,链路质量差或者线路光信号衰减过大会导致报文在传输过程中出错。如链路故障请更换网线或光纤。
(2) 如接口使用光模块,请先确认是否光模块故障导致。
(3) 检查本端和对端设备的默认CRC/FCS配置是否统一,若不统一,修改成统一的32位或16位。
(4) 与别的正常的端口更换网线或光纤光模块,如端口更换后错包消失,端口更换回来错包又再次出现端口相关,应为单板端口故障,请更换端口并将故障信息发送技术支持人员分析;如更换
到其他正常端口仍会出现错包,则对端设备、中间传输链路故障的可能性较大,请排查。
(5) 如故障无法确认,请搜集故障信息并联系技术支持人员分析。
Overrun计数是由于接口输入速率超过接口处理能力,导致丢包。
(1) 如果只有某一个接口收发包异常,或者某一个接口下挂设备的业务不通,同时这个单板上的其他接口都是正常的,可以多次查询display interface命令:
¡ 如果input errors有增加,且overruns没有增加,请排查光纤/光模块/对端设备;
¡ 如果input errors有增加,且等于overruns的增加,那么可以怀疑是单板内部拥塞;
¡ 如果overrun计数有增加,且Input (normal)计数没有增加,表明所有入报文都overrun,证明接口拥塞,请搜集故障信息并联系技术支持人员分析。
¡ 如果overruns计数有增加,且Input (normal)计数有增加,表明部分入报文overrun,证明接口拥塞,请搜集故障信息并联系技术支持人员分析。
(2) 如果仍然无法确认,请搜集故障信息并联系技术支持人员分析。
(1) 检查两端的jumbo配置是否一致,例如jumbo是否使能,接口默认的最大报文长度是否一致,允许最大报文长度是否一致。
(2) 如果仍然无法确认,请搜集故障信息并联系技术支持人员分析。
(1) 检查接口是否配置为半双工模式,如为半双工,请更改为全双工模式。
(2) 如果仍然无法确认,请搜集故障信息并联系技术支持人员分析。
接口无法正常Up
(1) 测试接口之间网线、光纤链路是否正常,光纤两端的发送/接收端是否错连,如果网线或光纤故障,请更换网线或光纤,如果错连,请调整收发端连接再查看接口状态。
(2) 通过远端打环测试,排除中间传输故障,再查看接口状态。
(3) 检查本端、对端接口配置是否正确,例如接口是否shutdown,速率、双工、协商模式、MDI是否配置正确,如果不正确,请修改后再查看接口状态。
<Sysname> display current-configuration interface HundredGigE 3/3/1
#
interface HundredGigE3/3/1
otn-mode enable
mtu 9600
ip address 12.0.0.1 255.255.255.0
ip netstream inbound
ip netstream outbound
ip netstream inbound sampler zhw1
ip netstream outbound sampler zhw2
ipv6 netstream inbound
ipv6 netstream outbound
#
return
(4) 在Probe视图下通过可维护命令查看光模块在位状态是否正确。
[System-probe] display hardware internal module interface HundredGigE 3/3/1 re
gister ?
0 CPLD register
1 FPGA register
2 MAC register
3 PHY register
4 HDLC register
5 SPI-4 register
6 OPTMOD register
7 REGMEMORY register
8 CDR register
11 PHY_SYS register
(5) 如果光模块在位,请检查接口两端光模块类型是否一致,如速率、波长、单模多模状态等;与正常的光模块交叉更换,排查是否为光模块故障导致。
(6) 在任意视图下执行命令display transceiver information interface,查看两端的光模块类型是否匹配,光模块类型是否与接口类型匹配,如果不匹配请更换相同类型光模块。
[Sysname] display transceiver interface ten-gigabitethernet 3/3/1
Ten-gigabitethernet 3/3/1 transceiver information:
Transceiver Type : 100G_BASE_SR10_CFP2
Connector Type : MPO
Wavelength(nm) : 850
Transfer Distance(m) : 100(OM3),150(OM4)
Digital Diagnostic Monitoring : YES
Vendor Name : FINISAR CORP.
(7) 如果问题仍无法解决,请搜集故障信息并联系技术支持人员。
无法ping通直连设备的接口IP。
(1) 在任意视图下执行display interface命令搜集故障接口信息,查看接口物理及协议状态:
¡ 如果状态为up,则继续执行步骤(2)。
(2) 检查设备接口收发光是否在正常范围内:
¡ 如果收发光异常则调整收发光到正常范围,再通过命令display interface检查接口是否收发有错包;
¡ 如果有错包参考3.1 接口错包,否则继续执行步骤(3)。
(3) 在任意视图下执行display current-configuration interface命令,检查故障接口下配置是否有错误:
¡ 如果配置错误则更改接口配置;
¡ 如果问题仍无法解决,请参考步骤(4),搜集状态信息并联系技术支持人员。
(4) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display counters rate inbound interface { interface-name | interface-type interface-number }(命令用来显示接口入方向数据包统计,确认设备内部转发是否丢包)
¡ display counters rate outbound interface { interface-name | interface-type interface-number }(命令用来显示接口入方向数据包统计,确认设备内部转发是否丢包)
· Probe视图下:
¡ display hardware np pktcnt forward slot slot-number [ chip chip-id ] [ verbose ](命令用来显示NP转发平面转发以及丢弃报文信息)
¡ display np interface link statistic slot slot-number chip chip-id(命令用来显示接口信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } status(命令用来显示固定接口的Phy芯片分析信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } register(命令用来显示固定接口的寄存器信息)
接口流量有丢包。
(1) 在任意视图下执行display counters inbound interface和display counters outbound interface查看接口出和入方向的数据包统计,查看设备内部转发是否有丢包:
¡ 如果本端设备内部转发无丢包则检查中间设备及中间链路;
¡ 如果本端设备内部转发有丢包则继续执行执行步骤(2)。
(2) 在任意视图下执行display interface查看出接口流量统计,查看qos队列是否有入队,是否有丢包:
¡ 如果为qos队列问题,则查看qos配置及接口下配置,确认qos生效;
¡ 如果qos队列没有问题,则继续执行执行步骤(3)。
(3) 确认业务流量转发方向,查看流量转发在本设备上是否跨板并记录。
(4) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display counters rate inbound interface { interface-name | interface-type interface-number }(命令用来显示接口入方向数据包统计,确认设备内部转发是否丢包)
¡ display counters rate outbound interface { interface-name | interface-type interface-number }(命令用来显示接口入方向数据包统计,确认设备内部转发是否丢包)
· Probe视图下:
¡ display hardware np pktcnt forward slot slot-number [ chip chip-id ] [ verbose ](命令用来显示NP转发平面转发以及丢弃报文信息)
¡ display np interface link statistic slot slot-number chip chip-id(命令用来显示接口信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } status(命令用来显示固定接口的Phy芯片分析信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } register(命令用来显示固定接口的寄存器信息)
接口下出现的CRC(Cyclic Redundancy Check,循环冗余校验)错包持续增长。
l 光模块、光纤污染,线缆未连接紧固。
l PHY接收的信号质量差,眼图差,没有lock。
l NP接收到的信号质量差。
(1) 出现CRC时,首先排查一下光纤、光模块的物理连接,检查是否有虚插,光纤未插紧的问题。排查后若无物理连接问题,请执行步骤(2)。
(2) 查看光模块是否有Rx_Los或Tx_Fault的告警信息,若有告警信息,需要更换和清洁光模块或光纤,查看命令如下,若没有告警信息,请执行步骤(3)。
[System-probe] display transceiver alarm interface HundredGigE 2/0/1——查看告警
HundredGigE2/0/1 transceiver current alarm information:
None
(3) 通过查看光模块的诊断信息,确定光模块的接收功率和发送功率是否在规定的最大值和最小值的范围内,若有接收或发送的功率超出范围,或者几个channel中有一个或几个channel的值虽然没有超出范围,但明显与其他channel的值差别较大,需要更换和清洁光模块或者光纤。如果未发现光模块功率异常,请执行步骤(4)
[System-probe] display transceiver diagnosis interface HundredGigE 2/0/1
HundredGigE2/0/1 transceiver diagnostic information:
Current diagnostic parameters:
[module] Temp.(°C) Voltage(V)
32 3.58
[channel] Bias(mA) RX power(dBm) TX power(dBm)
1 83.94 0.49 -0.97
2 72.75 1.52 0.76
3 72.24 1.01 0.44
4 74.79 1.40 0.69
Alarm thresholds:
Temp.(°C) Voltage(V) Bias(mA) RX power(dBm) TX power(dBm)
High 78 3.70 115.00 5.00 5.00 ——功率范围
Low -10 2.90 40.00 -20.00 -6.00 ——功率范围
(4) 查看接口PHY的眼图,查看PHY的line侧眼图,若发现眼图小,个别眼图为0,或信号没有lock,说明是信号质量问题,按照步骤(1)中所述方法,重新排查光模块和光纤问题,更换光模块光纤。若PHY眼图无问题,请执行步骤(5)。
· CQ12眼图的查看方法:CQ12的信息如下,其中line侧眼图如阴影部分所示,左右眼图一般不小于250,上下眼图不小于100。如果太小则应考虑更换或清洁光模块或光纤,如果有个别lane的眼图为0或者没有lock,也会造成接口出现CRC,处理方法同上。
[System] display hardware module interface HundredGigE 3/0/1 status
===================================System Lane=====================================
0 1 2 3 4 5 6 7 8 9
-----------------------------------Diag Info--------------------------------------
signal_detect: 1 1 1 1 1 1 1 1 1 1
vga_bias_reduced: 0 0 0 0 0 0 0 0 0 0
postc_metric: 0 0 0 0 0 0 0 0 0 0
osr_mode: 0 0 0 0 0 0 0 0 0 0
pmd_mode: 0 0 0 0 0 0 0 0 0 0
rx_lock: 1 1 1 1 1 1 1 1 1 1
rx_ppm: 0 0 0 0 0 0 0 0 0 0
tx_ppm: 1 1 1 1 0 2 1 1 1 1
clk90_offset: 36 36 36 36 36 36 36 36 36 36
clkp1_offset: 2 2 2 2 2 2 2 2 2 2
p1_lvl: 256 256 256 256 240 256 240 240 256 256
m1_lvl: 0 0 0 0 0 0 0 0 0 0
dfe1_dcd: 0 0 0 0 0 0 0 0 0 0
dfe2_dcd: 0 0 0 0 0 0 0 0 0 0
slicer_target: 0 0 0 0 0 0 0 0 0 0
offset_pe: 7 8 9 6 7 3 3 8 9 8
offset_ze: 11 8 9 9 6 4 8 9 6 9
offset_me: 6 3 7 3 7 6 9 10 7 5
offset_po: 5 5 10 4 9 8 8 7 8 9
offset_zo: 5 11 7 6 5 7 8 9 7 8
offset_mo: 7 9 6 7 6 6 7 6 7 7
heye_left: 365 341 339 394 361 343 373 376 355 359
heye_right: 406 375 357 392 390 390 439 408 390 359
veye_upper: 234 236 234 238 236 230 232 234 234 232
veye_lower: 236 236 206 244 208 234 222 238 218 226
machine_status: 0 0 0 0 0 0 0 0 0 0
link_time: 520 612 463 618 547 542 522 542 500 634
pf_main: 0 0 0 0 0 0 0 0 0 0
pf_hiz: 0 0 0 0 0 0 0 0 0 0
pf_bst: 0 0 0 0 0 0 0 0 0 0
pf_low: 1 2 1 1 1 1 1 1 1 2
pf2_ctrl: 0 0 0 0 0 0 0 0 0 0
vga: 0 0 0 0 0 0 0 0 0 0
dc_offset: 0 0 0 0 0 0 0 0 0 0
p1_lvl_ctrl: 0 0 0 0 0 0 0 0 0 0
dfe1: 0 0 0 0 0 0 0 0 0 0
dfe2: 0 0 0 0 0 0 0 0 0 0
dfe3: 0 0 0 0 0 0 0 0 0 0
dfe4: 2 2 2 2 2 2 2 2 2 2
dfe5: 0 0 0 0 0 0 0 0 0 0
dfe6: 0 0 0 0 0 0 0 0 0 0
txfir_pre: 0 0 0 0 0 0 0 0 0 0
txfir_main: 0 0 0 0 0 0 0 0 0 0
txfir_post1: 0 0 0 0 0 0 0 0 0 0
txfir_post2: 0 0 0 0 0 0 0 0 0 0
txfir_post3: 0 0 0 0 0 0 0 0 0 0
tx_amp_ctrl: 1 1 1 1 1 1 1 1 1 1
br_pd_en: 0 0 0 0 0 0 0 0 0 0
-------------------------------------Tx Set---------------------------------------
pre: 0 0 0 0 0 0 0 0 0 0
main: 22 22 22 22 22 22 22 22 22 22
post: 0 0 0 0 0 0 0 0 0 0
post2: 0 0 0 0 0 0 0 0 0 0
post3: -1 -1 -1 -1 -1 -1 -1 -1 -1 -1
amp: -1 -1 -1 -1 -1 -1 -1 -1 -1 -1
===================================Line Lane=====================================
0 1 2 3
--------------------------------------Diag Info--------------------------------------
signal_detect: 1 1 1 1
vga_bias_reduced: 0 0 0 0
postc_metric: 0 0 0 0
osr_mode: 0 0 0 0
pmd_mode: 0 0 0 0
rx_lock: 1 1 1 1
rx_ppm: 0 0 0 0
tx_ppm: 1 -1 1 3
clk90_offset: 45 46 45 45
clkp1_offset: 1 -1 0 0
p1_lvl: 193 191 198 184
m1_lvl: 0 0 0 0
dfe1_dcd: 0 0 0 0
dfe2_dcd: 0 0 0 0
slicer_target: 0 0 0 0
offset_pe: 0 0 0 0
offset_ze: 0 0 0 0
offset_me: 0 0 0 0
offset_po: 0 0 0 0
offset_zo: 0 0 0 0
offset_mo: 0 0 0 0
heye_left: 296 296 281 296
heye_right: 343 359 373 386
veye_upper: 120 127 132 125
veye_lower: 132 125 127 122
machine_status: 0 0 0 0
link_time: 1714 2168 1724 1762
pf_main: 0 0 0 0
pf_hiz: 0 0 0 0
pf_bst: 0 0 0 0
pf_low: 2 2 2 2
pf2_ctrl: 0 0 0 0
vga: 0 0 0 0
dc_offset: 0 0 0 0
p1_lvl_ctrl: 0 0 0 0
dfe1: 0 0 0 0
dfe2: 0 0 0 0
dfe3: 0 0 0 0
dfe4: 0 0 0 0
dfe5: 0 0 0 0
dfe6: 0 0 0 0
txfir_pre: 0 0 0 0
txfir_main: 0 0 0 0
txfir_post1: 0 0 0 0
txfir_post2: 0 0 0 0
txfir_post3: 0 0 0 0
tx_amp_ctrl: 3 3 3 3
br_pd_en: 0 0 0 0
-----------------------------------------Tx Set---------------------------------------
pre: 8 8 8 8
main: 60 60 60 60
post: 0 4 0 0
post2: 8 8 8 8
post3: 4 4 4 4
amp: 15 15 15 15
=====================================Polarity=====================================
System Side: 0x008c-0x0000 Line Side: 0x0000-0x0000
Status dump success
· CC08眼图查看方法:CC08的信息如下:其中line侧眼图如阴影部分所示,眼高一般不小于200太多,眼宽不小于100太多,如果太小则应考虑更换或清洁光模块或光纤,如果有个别lane的眼图为0或者ingress_status有不为0的位,也会造成接口出现CRC,处理方法同上。
[System] display hardware module interface HundredGigE 1/0/1 status
===========Main===============
Port Address: 0
ingress_status(30.64): 0x0000
egress_status(30.72): 0x0000
EFUSE Done(30.3840[13]): 1
Device Id(30.3): 0x7450
Part Id(30.3968[15:1]): 26102
pma_type(8.7[2]): 1
standard(30.0[14]): 0
fec_mode(30.0[3]): 0
protocol(8.0[3:2]): 3
reg_div(30.180): 6
PLL194: 1(305)
PLL197: 1(150)
PLL200: 1(149)
PLL203: 1(308)
reg_trim1(30.181): 0x7070
reg_trim1(30.182): 0x6262
Device Control1(30.0): 0x561
lane_pdown(30.62): 0x0000
iFIFO_status(30.80): 0x4000
eFIFO_status(30.88): 0x4000
===========FEC encode===============
PSC block lock on 20 virtual lanes [19:0] 0x00000000
PSC lane align on 20 virtual lanes [19:0] 0x00000000
PCS Egress lane 0 maps to 31
PCS Egress lane 1 maps to 31
PCS Egress lane 2 maps to 31
PCS Egress lane 3 maps to 31
PCS Egress lane 4 maps to 31
PCS Egress lane 5 maps to 31
PCS Egress lane 6 maps to 31
PCS Egress lane 7 maps to 31
PCS Egress lane 8 maps to 31
PCS Egress lane 9 maps to 31
PCS Egress lane 10 maps to 31
PCS Egress lane 11 maps to 31
PCS Egress lane 12 maps to 31
PCS Egress lane 13 maps to 31
PCS Egress lane 14 maps to 31
PCS Egress lane 15 maps to 31
PCS Egress lane 16 maps to 31
PCS Egress lane 17 maps to 31
PCS Egress lane 18 maps to 31
PCS Egress lane 19 maps to 31
PCS align status is 0
BIP errors for PCS lane 0 are 0
BIP errors for PCS lane 1 are 0
BIP errors for PCS lane 2 are 0
BIP errors for PCS lane 3 are 0
BIP errors for PCS lane 4 are 0
BIP errors for PCS lane 5 are 0
BIP errors for PCS lane 6 are 0
BIP errors for PCS lane 7 are 0
BIP errors for PCS lane 8 are 0
BIP errors for PCS lane 9 are 0
BIP errors for PCS lane 10 are 0
BIP errors for PCS lane 11 are 0
BIP errors for PCS lane 12 are 0
BIP errors for PCS lane 13 are 0
BIP errors for PCS lane 14 are 0
BIP errors for PCS lane 15 are 0
BIP errors for PCS lane 16 are 0
BIP errors for PCS lane 17 are 0
BIP errors for PCS lane 18 are 0
BIP errors for PCS lane 19 are 0
===========FEC decode===============
AM lock0-3 = 0, fec align status = 0
Corrected Codewords 0, Uncorrected Codewords 0
FEC Symbol error for lane 0 are 0
FEC Symbol error for lane 1 are 0
FEC Symbol error for lane 2 are 0
FEC Symbol error for lane 3 are 0
RS_FEC_lane_mapping = 0x0
===========Eom===============
Host: Lane:0, EyeScore - height:255, width:110
Host: Lane:1, EyeScore - height:255, width:110
Host: Lane:2, EyeScore - height:255, width:108
Host: Lane:3, EyeScore - height:255, width:112
Host: Lane:4, EyeScore - height:255, width:108
Host: Lane:5, EyeScore - height:255, width:102
Host: Lane:6, EyeScore - height:255, width:108
Host: Lane:7, EyeScore - height:255, width:110
Host: Lane:8, EyeScore - height:255, width:108
Host: Lane:9, EyeScore - height:255, width:112
Line: Lane:0, EyeScore - height:255, width:102
Line: Lane:1, EyeScore - height:255, width:112
Line: Lane:2, EyeScore - height:247, width:104
Line: Lane:3, EyeScore - height:255, width:102
· CC01查看眼图方法:查看CC01眼图时,注意根据提示选择line侧,并根据提示,不同光模块类型选择相应的lane查看眼图,可根据眼睛形状初步判断信号质量,若眼睛睁不开,太小,或数值为0,考虑更换或清洁光模块或光纤。查看CC01眼图用时较长,属于正常现象。
眼图值大致参考范围,不代表标准值:
¡ LR4光模块,left/right不小于200,up/down不小于80;
¡ SR10光模块,left/right不小于200,up/down不小于250
[System-probe] display hardware internal module interface HundredGigE 3/1/1 eyescan
0 1
Current Optic Module Number: 118
complete of serdes eye diag retrieving: reiterate time=41
Current Selection Intf: LINE Lane Number: 01
LINE_01
-16-15-14-13-12-11-10-9-8-7-6-5-4-3-2-1 0 1 2 3 4 5 6 7 8 9101112131415
0 11111111111111111111111111111111
1 11111111111111111111111111111111
2 11111111111111111111111111111111
3 11111111111111111111111111111111
4 11111111111111111111111111111111
5 11111111111111111111111111111111
6 11111111111111111111111111111111
7 11111111111111111111111111111111
8 11111111111111111111111111111111
9 11111111111111111111111111111111
10 11111111111111111111111111111111
11 11111111111111111111111111111111
12 11111111111111111111111111111111
13 11111111111111111111111111111111
14 111111111111 111111111111111111
15 111111111111 11111111111111111
16 11111111111 1111111111111111
17 11111111111 111111111111111
18 1111111111 11111111111111
19 111111111 1111111111111
20 111111111 1111111111111
21 111111111 111111111111
22 111111111 111111111111
23 11111111 11111111111
24 11111111 11111111111
25 1111111 11111111111
26 1111111 1111111111
27 1111111 1111111111
28 1111111 111111111
29 111111 111111111
30 111111 11111111
31 11111 11111111
32 111111 11111111
33 111111 111111111
34 1111111 111111111
35 1111111 111111111
36 1111111 1111111111
37 11111111 1111111111
38 11111111 1111111111
39 11111111 11111111111
40 111111111 11111111111
41 111111111 111111111111
42 111111111 111111111111
43 1111111111 1111111111111
44 1111111111 1111111111111
45 11111111111 1111111111111
46 111111111111 111111111111111
47 111111111111 111111111111111
48 1111111111111 1111111111111111
49 1111111111111 1111111111111111
50 11111111111111 11111111111111111
51 11111111111111111111111111111111
52 11111111111111111111111111111111
53 11111111111111111111111111111111
54 11111111111111111111111111111111
55 11111111111111111111111111111111
56 11111111111111111111111111111111
57 11111111111111111111111111111111
58 11111111111111111111111111111111
59 11111111111111111111111111111111
60 11111111111111111111111111111111
61 11111111111111111111111111111111
62 11111111111111111111111111111111
63 11111111111111111111111111111111
eye_status (port index = 1) - left:313, right:250, up:139, down:149
· QQ03子卡眼图查看方法:查看QQ03眼图时,可根据提示选择查看line侧眼图,QQ03子卡Line侧lane范围为0-3,根据眼图中眼睛图像可初步判断信号质量,若眼睛睁不开,太小或数值为0,考虑清洁更换光模块或光纤。查看QQ03眼图用时较长,属正常现象。
眼图值大致参考范围,不代表标准值,HorizontalEye不小于30,VerticalEye不小于50
[System-probe] display hardware internal module interface FortyGigE 2/3/1 eyescan 0
0
Eyemap Side:0 , lane:0
Phy82328: Fast eyescan under Processing
...............................................................
-30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30
-|----|----|----|----|----|----|----|----|----|----|----|----|-
111111111111111111111111222223334444433322222211111111111111111
111111111111111111111122222334455777655433322222111111111111111
11111111111111111111122223344566 :76654333222221111111111111
111111111111111111122222334567 : : 65543322222111111111111
11111111111111111122223344567 : : 7654433222211111111111
111111111111111122222334567 : : :765443322221111111111
11111111111111122222334567+----+----+----+-76554332222211111111
1111111111111122222334567 : : : : 755433222221111111
111111111111112222334456 : : : : 765443222221111111
111111111111122222334567 : : : : 7765443322221111111
111111111111122223344567 : : : : 76543322222111111
11111111111122222334557---+----+----+----+----76544332222111111
11111111111122223334567 : : : : :7554332222111111
1111111111112222334456 : : : : :7654332222211111
1111111111122222334567 : : : : :7654433222211111
1111111111122223344567 : : : : :7765433222221111
1111111111222223345577----+----+----+----+----+-665443222221111
111111111122222334567: : : : : : 765443322221111
111111111222223344567: : : : : : 66543322222111
11111111122222334567 : : : : : : 76544322222111
11111111122223344567 : : : : : : 6544332222111
1111111122222334556--+----+----+----+----+----+---7654332222211
1111111122222334567 : : : : : : 7654433222211
1111111122223344567 : : : : : : 7655433222211
111111112222334566 : : : : : : 765433222211
111111112222334567 : : : : : : 765443322221
111111112223344567---+----+----+----+----+----+----+75543322221
11111111222334567 : : : : : : :76543322221
11111111222334567 : : : : : : :76544332221
11111111222334567 : : : : : : : 7554332221
11111111222334567 : : : : : : : 7654332221
11111111222334567----+----+----+----+----+----+----+-7654332221
11111111222334567 : : : : : : : 7654332221
11111111222334456 : : : : : : : 6544332221
111111112222334567 : : : : : : :76543322221
111111112222334567 : : : : : : 776543322221
1111111122223344567--+----+----+----+----+----+----765443322221
1111111122222334567 : : : : : : 765433222211
1111111122222334556 : : : : : : 655433222211
11111111122223344567 : : : : : : 7654433222211
11111111122222334566 : : : : : : 7654332222211
11111111122222334456-+----+----+----+----+----+--76554332222111
11111111112222334456 : : : : : : 76544332222111
111111111122222334566: : : : : : 76543322222111
111111111122222334456: : : : : : 65443322221111
1111111111122223344567 : : : : : 765443222221111
1111111111122222334566----+----+----+----+----+7765433222221111
11111111111222223344567 : : : : :7654433222211111
11111111111122222334566 : : : : :7654332222211111
11111111111122222334456 : : : : 77554332222111111
111111111111122223344567 : : : : 76544332222111111
111111111111122222334557--+----+----+----+----76543322222111111
1111111111111122223344567 : : : : 765443322221111111
1111111111111122222334567 : : : : 765443222221111111
1111111111111122222334456 : : : : 765433222221111111
11111111111111122222334567: : : : 7654433222211111111
111111111111111122222334567----+----+----+-76544332222111111111
1111111111111111122222334567 : : :765433222221111111111
111111111111111111222223344567 : : 76554332222211111111111
11111111111111111111222223345567 : 7765443322221111111111111
1111111111111111111111222233445567 766544332222211111111111111
111111111111111111111112222233345566544333222221111111111111111
111111111111111111111111122222333333332222221111111111111111111
-|----|----|----|----|----|----|----|----|----|----|----|----|-
-30 -25 -20 -15 -10 -5 0 5 10 15 20 25 30
Side: Line ,Lane:0 ,HorizontalEye: 36 ,VerticalEye: 59
· Xp12子卡及pos卡不支持眼图功能
(5) 如果NP接收到的信号质量不好,也会导致接口CRC。本文以CQ12举例介绍如何查看NP眼图。排查NP眼图后,若眼图不好,可以手动进行autotune调整。
· 在Probe视图下执行命令display hardware internal intf port-info slot slot number查找接口对应的芯片号
[System-probe] display hardware internal intf port-info slot 3
IfName IfIndex LogicPort LocalPort PhyPort Chl ChpNo ModNo ModPort NpPort
HGE3/0/1 961 960 0 2 1 2 20 2 117
HGE3/0/2 962 961 1 1 0 0 18 1 116
HGE3/0/3 963 962 2 1 0 2 20 1 116
HGE3/0/4 964 963 3 2 1 0 18 2 117
HGE3/0/5 965 964 4 2 1 3 21 2 117
HGE3/0/6 966 965 5 1 0 3 21 1 116
HGE3/0/7 967 966 6 2 1 4 22 2 117
HGE3/0/8 968 967 7 1 0 4 22 1 116
HGE3/0/9 969 968 8 2 1 5 23 2 117
HGE3/0/10 970 969 9 1 0 1 19 1 116
HGE3/0/11 971 970 10 1 0 5 23 1 116
HGE3/0/12 972 971 11 2 1 1 19 2 117
· 在Probe视图下执行命令display hardware internal np serdes link status slot slot number chip phy FWD chip ID查看接口对应的lane号:需要注意的是此处显示的端口号USERPORT需要加1,才对应端口号3/0/1和3/0/3,。对应的lane号如第一列所示:58、59、64-71。如果此时发现有lane为down,则需要定位下NP和PHY之间的链接问题,需要硬件介入,也可以通过在Probe视图下执行命令set hardware internal np interface autotunning serdes serdes ID slot slot number chip phy FWD chip ID尝试手动autotunning。
[System-probe] display hardware internal np serdes link status slot 3 chip 2
SERDES STATUS IF_NUM NP_PORT SUBSLOT/USERPORT IF_TYPE
58 UP 1 117 0/0 100GE(UP)
59 UP 1 117 0/0 100GE(UP)
64 UP 1 117 0/0 100GE(UP)
65 UP 1 117 0/0 100GE(UP)
66 UP 1 117 0/0 100GE(UP)
67 UP 1 117 0/0 100GE(UP)
68 UP 1 117 0/0 100GE(UP)
69 UP 1 117 0/0 100GE(UP)
70 UP 1 117 0/0 100GE(UP)
71 UP 1 117 0/0 100GE(UP)
48 UP 0 116 0/2 100GE(UP)
49 UP 0 116 0/2 100GE(UP)
50 UP 0 116 0/2 100GE(UP)
51 UP 0 116 0/2 100GE(UP)
52 UP 0 116 0/2 100GE(UP)
53 UP 0 116 0/2 100GE(UP)
54 UP 0 116 0/2 100GE(UP)
55 UP 0 116 0/2 100GE(UP)
56 UP 0 116 0/2 100GE(UP)
57 UP 0 116 0/2 100GE(UP)
查看眼图时,务必要严格通过端口对应的lane号来查看NP眼图,lane号有时并不连续;
· 在Probe视图下执行命令display hardware internal np eom slot slot number chip phy NP chip ID serdesid serdes ID timeout timeout逐根lane查看NP的眼图,如果眼图的值小于50,则有可能存在问题,可以尝试手动autotunning一下再看下眼图。具体的serdesid和chip需要参考前面的信息。
[System-probe] display hardware internal np eom slot 3 chip 2 serdesid 58 timeout 30
Eye scan test beging...
------------------------------------------------
---------- NP(2) RX, eye scan result: ---------
------------------------------------------------
================================================================
Serdes: 58, Row: 43, Col: 128, HorizontalEye: 65, VerticalEye, 180.
================================================================
#############+++++****+++++##############################################################
############++++********+++++############################################################
###########++++********+++++#############################################################
##########+++++** ***+++++############################################################
##########++++*** ****+++##########################################################
#########++++** ***+++#########################################################
########++++** * **+++########################################################
#######++++*** *++++#######################################################
######++++*** **++++######################################################
######++++** **+++######################################################
#####++++*** **+++#####################################################
#####++++** **++++####################################################
####++++** **+++####################################################
###++++*** **++++###################################################
##++++*** ***+++###################################################
##++++** **+++##################################################
#++++*** **++++#################################################
#+++*** **+++#################################################
++++** **++++################################################
+++** **++++###############################################
+++* ***+++###############################################
++** **++++##############################################
+** **+++##############################################
+** **+++##############################################
** ****++##############################################
* **+##############################################
* **+##############################################
* **+############################################## **############################################# **############################################# ############################################## #############################################
** ##############################################
** *##############################################
** *##############################################
+** ***##############################################
+** **+##############################################
++* **+##############################################
++*** *++##############################################
+++** **++##############################################
++++* *+++##############################################
#+++** ***+++##############################################
#++++* * *++++##############################################
##+++** **++++###############################################
###+++* **++++###############################################
###+++*** **+++################################################
####+++* **++++################################################
####++++* *++++#################################################
#####+++** **+++##################################################
#####+++*** ***+++##################################################
######+++** **+++###################################################
#######+++* *+++####################################################
#######+++*** **+++####################################################
########+++* *+++#####################################################
########+++** **+++#####################################################
#########+++** *+++######################################################
#########++++* **+++######################################################
##########+++*** *+++#######################################################
##########++++*** **+++########################################################
###########++++** **+++########################################################
############+++**** **+++#########################################################
#############++++** ***++++#########################################################
#############++++**** **++++##########################################################
##############+++++*** ***++++###########################################################
线卡、子卡在位,启动完成后,接口不可见。
l 驱动接口初始化流程存在异常。
l 平台接口管理流程存在异常。
l 线卡异常,在不停rebooting。
(1) 收集接口所在线卡的diag和log驱动可维护记录文件,查看接口的初始化流程是否存在异常信息。很可能接口初始化过程中由于总线异常导致寄存器读写异常,从而导致初始化失败,此时需要更换硬件。如果初始化过程中没有异常,查看日志中powerup命令字是否下发,往往是powerup命令字没有下发导致接口不可见。
(2) 检查平台的接口链,在Probe视图下执行命令display system internal ifmgr list [ [ para ] [ slot slot-number ] | help ]查看平台的接口链表,查看丢失的接口是否在接口链中出现,如果没有出现,需要检查驱动是否上报了平台不支持的接口类型,这种问题一般出现在新增接口项目调试阶段,不太可能出现在正常运行的环境中。
[System-probe] display system internal ifmgr list
|
FortyGigE0/2/1(index:129)
|
FortyGigE0/2/2(index:130)
|
FortyGigE0/2/3(index:131)
|
HundredGigE2/0/1(index:641)
|
HundredGigE2/0/2(index:642)
|
HundredGigE2/0/3(index:643)
|
HundredGigE2/0/4(index:644)
……
(3) 查看平台接口管理调试信息,导出平台接口管理的日志文件trace.log,看是否有FAILED或error,进一步分析,一般常见于驱动个别子接口激活失败,或者平台某些模块初始化失败导致。
<System>bash
$
$
$ su
# cp /var/log/trace.log /mnt/flash\:/
# exit
$ exit
<System>dir flash:/
Directory of flash:
0 -rw- 90966 Mar 27 2017 15:02:46 0327.mdb
1 -rw- 59610 Aug 26 2016 14:58:01 0826.mdb
2 -rw- 89467 May 27 2017 15:11:27 16-0527.cfg
3 -rw- 59241 May 31 2016 15:18:42 20160531_hdlc.mdb
4 -rw- 196995 Jul 28 2016 21:27:34 20160728_full_clean.mdb
5 -rw- 1022011 Aug 03 2016 16:16:40 20160803_1k_full.mdb
6 -rw- 508336 Jun 16 2017 15:49:27 trace.log
7 drw- - May 26 2016 18:59:06 versioninfo
8 -rw- 119976 Nov 16 2016 11:04:29 wz.mdb
9 -rw- 121768 Nov 08 2016 19:29:13 wz1.mdb
10 -rw- 120088 Dec 27 2016 18:08:33 wz2.mdb
11 -rw- 168775 May 10 2017 17:46:11 xzx.log
命令 |
说明 |
display transceiver alarm interface [ interface-type interface-number ] |
显示光模块告警信息(任意视图) |
display transceiver diagnosis interface [ interface-type interface-number ] |
显示可插拔光模块的数字诊断参数的当前测量值(任意视图) |
display transceiver information interface [ interface-type interface-number ] |
显示光模块信息(Probe视图) |
display hardware internal module interface { interface-name | interface-type interface-number } { statistics | message message-slice | status | register regtype | information | rxbd | txbd | eyescan side-number lane-number | interrupt | phystatistics | otn_message } |
显示固定口统计信息,message信息,Phy芯片分析信息,寄存器等信息(Probe视图) |
display hardware module interface { interface-name | interface-type interface-number } { statistics | message message-slice | status | register regtype | information | rxbd | txbd | eyescan side-number lane-number | interrupt | phystatistics | otn_message } |
显示固定口统计信息,message信息,Phy芯片分析信息,子卡眼图,寄存器等信息(任意视图) |
display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number } |
查看接口对应芯片号 |
接口配置IP地址后,通过协议或者流量发起ARP学习,但学不到对端MAC地址或无法形成ARP缓存表或ARP表项信息有误。
· 接口物理层down。
· 链路不稳定或光功率低。
· 直连接口的IP地址不在同一网段。
· 设备软件故障。
· NP或平台转发故障。
(1) 在任意视图下执行display interface { interface-name | interface-type interface-number }查看接口状态:
¡ 如果现实为up,则执行步骤(2)。
(2) 在任意视图下执行display interface { interface-name | interface-type interface-number }查看两端接口配置的IP地址:
¡ 如果两端IP地址在不同网段,请修改IP地址使其在同一网段;
¡ 如果两端IP地址在相同网段,请执行步骤(3)。
(3) 查看接口是否有错包:
¡ 如果有错包且不断增长,排查链路质量问题;
¡ 如果故障不能排除,则继续执行步骤(4)。
(4) 检查平台的FIB表项,确认本地配置路由生效:
¡ 如果平台FIB表项显示信息正常,则执行步骤(5);
¡ 如果平台FIB表项显示信息有误,则参考步骤(6)搜集故障信息并联系技术支持人员。
[System] display interface
#
interface Route-Aggregation1
ip address 1.1.1.2 255.255.255.0
link-aggregation mode dynamic
#
return
[System] display fib 1.1.1.2
Destination count: 1 FIB entry count: 1
Flag:
U:Useable G:Gateway H:Host B:Blackhole D:Dynamic S:Static
R:Relay F:FRR
Destination/Mask Nexthop Flag OutInterface/Token Label
1.1.1.2/32 127.0.0.1 UH InLoop0 Null
(5) 查看转发模块NP的FIB表,确认Th字段置位,主机路由可以正常上送CPU:
¡ 如果Th(tohost)字段置位,则参考步骤(6)搜集故障信息并联系技术支持人员;
¡ 如果Th(tohost)字段没有置位,参考步骤(6)搜集故障信息并联系技术支持人员。
[System-probe] display hardware internal l3 np fib 1.1.1.2 32 slot 3 chip 5
The FTN/FIB table Handle<0xbbc0> ECMPNum<0/1>!
ChipID is 5
FTN:
FTN KEY: VPNID = 0 IP_Prefix = 1.1.1.2/4294967295
FTN RESULT:
00030291 000001ff 0100004c 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 1
ECMP = 0 Th = 1 Normal = 0 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 0 OutlifID_ToHostID = 76
Es = 0 Ts = 0 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 0 Label = 0 Label_bak = 0
Rd = 1 Rq = 1 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
(6) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display counters rate { inbound | outbound } interface { interface-name | interface-type interface-number }(命令用来显示接口入出方向数据包统计,确认设备内部转发是否丢包)
¡ display hardware internal module interface { interface-name | interface-type interface-number } status(命令用来显示固定接口的Phy芯片分析信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } register(命令用来显示固定接口的寄存器信息)
· Probe视图下:
¡ display np interface link statistic slot slot-number chip chip-id(命令用来显示子卡侧相关计数器值)
¡ display hardware internal module interface { interface-name | interface-type interface-number } status(命令用来显示固定接口的Phy芯片分析信息)
¡ display hardware internal module interface { interface-name | interface-type interface-number } register(命令用来显示固定接口的寄存器信息)
正确组网后,各接口的IP地址及掩码配置完成,各路由器上路由协议配置完成,打入单播流量后,目的接口无流量统计,IP转发不通。
· 直连接口IP地址或掩码配置错误。
· 子接口配置VLAN ID错误。
· 没有单播路由。
· ARP学习失败。
· uRPF检查失败。
(1) 检查直连口IP地址及掩码是否正确,如果有子接口,检查子接口的VLAN id。
¡ 如果不正确,请修改配置;
¡ 如果正确,进行步骤(2)。
(2) 执行命令display ip routing-table x.x.x.x查看是否有路由表存在:
¡ 如果不存在,检查路由协议配置;
¡ 如果存在,执行步骤(3)。
(3) 执行命令display fib x.x.x.x查看是否有转发表存在:
¡ 如果不存在,请参考步骤(5)搜集故障信息并联系技术支持人员分析;
¡ 如果存在,执行步骤(4)。
(4) 查看arp缓存表是否存在:
¡ 如果存在,请参考步骤(5)搜集故障信息并联系技术支持人员分析。
(5) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display ip routing-table summary(显示路由表的概要信息)
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
· Probe视图下:
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(用来显示端口信息)
¡ display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id(命令用来显示路由及其对应的下一跳下发到硬件的信息)
¡ display hardware internal l3 record ipv4 [ clear | [ dip ip-address ] [ mdc mdc-id ] [ nexthop ip-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv4路由模块下发驱动的操作记录)
¡ display hardware internal l3 record ipv6 [ clear | [ dip ipv6-address ] [ mdc mdc-id ] [ nexthop ipv6-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv6路由模块下发驱动的操作记录)
¡ display hardware internal l3 record vn [ clear | [ mdc mdc-id ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台VN等模块下发驱动的操作记录)
¡ display hardware internal l3 np ecmp-info ecmpstack slot slot-number(命令用来显示指定单板上等价路由的ECMPID的使用情况,在非等价负载分担的情况下流量的在各出口上的分担比例)
¡ display hardware internal l3 np protocol slot slot-number global(命令用来显示指定单板NP相关协议信息)
¡ display hardware internal lif np inlif slot slot-number chip chip-id vlan vlanid port phyport(来根据单板槽位、芯片编号、VLAN号及端口号显示单板INLIF硬件表项)
¡ display hardware internal rxtx rate { rx | tx } { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
¡ display hardware internal rxtx packet statistic slot slot-number cpu cpu-number [ clear ](命令用来显示单板上收发的报文计数和报文信息)
正确组网,且单播路由配置完成,注入单播流量后,入接口统计流量与出接口统计流量不一致,转发丢包。
· uRPF检查失败。
· 多条链路,其中一部分转发不通。
(1) 转发出现丢包时,可以查看NP的drop统计,根据drop统计的信息来分析。
[System-probe] display hardware np pktcnt drop slot 1 chip 1
Current Mcode Type: SIRIUS_DEBUG
The NP 1 is Both NP
Drop packet statistics
645 10 in multicast, drop flag in MULTICAST table is setted
(2) 如果有大量drop信息,请搜集故障信息并联系技术支持人员。
(3) 如果NP没有丢包,则需要查看NP的转发数据流量是否都走了转发,正常情况下,上送CPU的报文应该比较少。如果有大量报文上送CPU,需要查看上送报文的类型,是否有走默认路由上送CPU被丢弃的。
[System-probe] display np pktcnt forward slot 1 chip 1
Current Mcode Type: SIRIUS_DEBUG
The NP 1 is Both NP
Tops forward packet statistics
3203 1423593819 TOPparse total input pkts
3204 1423593807 TOPparse total output pkts
3456 1423593808 TOPresolve total input pkts
3457 1426892560 TOPresolve total output pkts
348D 3313933 TOPresolve total multicast pkts
3970 1426892562 TOPmodify total input pkts
3971 1426892562 TOPmodify total output pkts
322E 2338020 TOPparse input pkts from Host
3230 706966013 TOPparse input pkts from Fabric
3232 714289800 TOPparse input pkts from Link
397E 5121479 TOPmodify output pkts to Host
正常情况不应该有大量报文上送cpu,如果大量的数据报文上送CPU,需要确认是否使能目的不可达报文上送。如果乜有使能不可达报文上送,则参考步骤(4)搜集故障信息。
(4) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display ip routing-table summary(显示路由表的概要信息)
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
· Probe视图下:
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(用来显示端口信息)
¡ display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id(显示路由及其对应的下一跳下发到硬件信息)
¡ display hardware internal l3 record ipv4 [ clear | [ dip ip-address ] [ mdc mdc-id ] [ nexthop ip-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv4路由模块下发驱动的操作记录)
¡ display hardware internal l3 record ipv6 [ clear | [ dip ipv6-address ] [ mdc mdc-id ] [ nexthop ipv6-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv6路由模块下发驱动的操作记录)
¡ display hardware internal l3 record vn [ clear | [ mdc mdc-id ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台VN等模块下发驱动的操作记录)
¡ display hardware internal l3 np ecmp-info ecmpstack slot slot-number(命令用来显示指定单板上等价路由的ECMPID的使用情况,在非等价负载分担的情况下流量的在各出口上的分担比例)
¡ display hardware internal l3 np protocol slot slot-number global(命令用来显示指定单板NP相关协议信息)
¡ display hardware internal lif np inlif slot slot-number chip chip-id vlan vlanid port phyport(来根据单板槽位、芯片编号、VLAN号及端口号显示单板INLIF硬件表项)
¡ display hardware internal rxtx rate { rx | tx } { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
¡ display hardware internal rxtx packet statistic slot slot-number cpu cpu-number [ clear ](命令用来显示单板上收发的报文计数和报文信息)
¡ display np interface { link | fabric | host } statistic slot slot-number chip chip-id(命令用来显示子卡侧、交换网侧、主机侧相关计数器值)
配置Tunnel接口,转发流量不正常。
Tunnel口配置有问题。
(1) 首先,NP不支持同源同目的的相同类型的Tunnel接口。Tunnel必须在UP的状态下才能转发,且转发流量必须通过配置或者学习的路由必须引到tunnel口上。
[System-probe] display hardware internal l3 np tunnel interface Tunnel 1 slot 3 chip 0
=================== Drv Tunnel Information Record ===================
ifIndex: <1989>
uiTunnelID: <1>
Tunnel Interface: <Tunnel1>
uiTunnelMode: IPV4 GRE
uiDstIp: <213.0.0.1>
uiSrcIp: <213.0.0.2>
ipv6 mtu: <1476> outlif<166658>
uiTunnelState: UP (Tunnel is up state)
Routing referenced count: <0>
ifIndexOut: <489>, usVlanID: <65535>, usSecondVlanID: <65535>
Tunnel-End table is adaptered .
=================== Tunnel End Table Record ===================
KEY:SIP = 213.0.0.1 DIP = 213.0.0.2 Payload Type=0 L3 Protocol=47
RESULT: DWORD0 = 0x31, DWORD1 = 0x0, DWORD2 = 0x0, DWORD3 = 0x0
V = 1, M = 1
IPv4 = 1, IPv6 = 0, Mpls = 0, MCv4 = 0
MCv6 = 0, L3VPN = 0, TH = 0
Drop_Rsv = 0, VpnID = 0, ToHost_LifID = 0
KEY:SIP = 213.0.0.1 DIP = 213.0.0.2 Payload Type=2 L3 Protocol=47
RESULT: DWORD0 = 0x51, DWORD1 = 0x0, DWORD2 = 0x0, DWORD3 = 0x0
V = 1, M = 1
IPv4 = 0, IPv6 = 1, Mpls = 0, MCv4 = 0
MCv6 = 0, L3VPN = 0, TH = 0
Drop_Rsv = 0, VpnID = 0, ToHost_LifID = 0
KEY:SIP = 213.0.0.1 DIP = 213.0.0.2 Payload Type=4 L3 Protocol=47
RESULT: DWORD0 = 0x91, DWORD1 = 0x0, DWORD2 = 0x0, DWORD3 = 0x0
V = 1, M = 1
IPv4 = 0, IPv6 = 0, Mpls = 1, MCv4 = 0
MCv6 = 0, L3VPN = 0, TH = 0
Drop_Rsv = 0, VpnID = 0, ToHost_LifID = 0
KEY:SIP = 213.0.0.1 DIP = 213.0.0.2 Payload Type=255 L3 Protocol=47
RESULT: DWORD0 = 0x1011, DWORD1 = 0x56, DWORD2 = 0x0, DWORD3 = 0x0
V = 1, M = 1
IPv4 = 0, IPv6 = 0, Mpls = 0, MCv4 = 0
MCv6 = 0, L3VPN = 0, TH = 1
Drop_Rsv = 0, VpnID = 0, ToHost_LifID = 86
KEY:SIP = 213.0.0.1 DIP = 213.0.0.2 Payload Type=7 L3 Protocol=47
RESULT: DWORD0 = 0x1011, DWORD1 = 0x9d, DWORD2 = 0x0, DWORD3 = 0x0
V = 1, M = 1
IPv4 = 0, IPv6 = 0, Mpls = 0, MCv4 = 0
MCv6 = 0, L3VPN = 0, TH = 1
Drop_Rsv = 0, VpnID = 0, ToHost_LifID = 157
(2) 如果路由和tunnel口的状态都是正常的,则参考步骤(3)搜集故障信息并联系技术支持人员。
(3) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
· Probe视图下:
¡ display hardware internal l3 record ipv4 [ clear | [ dip ip-address ] [ mdc mdc-id ] [ nexthop ip-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv4路由模块下发驱动的操作记录)
¡ display hardware internal l3 record ipv6 [ clear | [ dip ipv6-address ] [ mdc mdc-id ] [ nexthop ipv6-address ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台IPv6路由模块下发驱动的操作记录)
¡ display hardware internal l3 record tunnel [ clear | [ ifindex ifindex-num ] [ mdc mdc-id ] [ mode mode-value ] [ name tunnel-num ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台Tunnel模块下发驱动的操作记录)
¡ display hardware internal l3 record vn [ clear | [ mdc mdc-id ] [ operation { add | delete | modify } ] [ result { error | noresource | ok | unknow } ] ] slot slot-number(命令用来显示平台VN等模块下发驱动的操作记录)
¡ display hardware internal l3 np protocol slot slot-number global(命令用来显示指定单板NP相关协议信息)
¡ display hardware internal l3 np ecmp-info ecmpstack slot slot-number(命令用来显示指定单板上等价路由的ECMPID的使用情况)
¡ display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id(显示路由及其对应的下一跳下发到硬件信息)
RXTX模块作为NP与CPU之间的通道,NP上所有需要上送CPU的报文都必须经过RXTX模块,因此当协议不能建立或是出现震荡时,可以通过查看RXTX模块的统计信息,定位问题原因。协议报文由接口到CPU的整体流程如下:接口->NP->TM->RXTX->CPU。
配置协议后发现协议不能建立。
· 接口物理层Down。
· 使用子接口建立协议未配置Vlan。
· 协议限速导致丢包。
· 线卡与主控透传通道有问题。
(1) 无流量环境下进行IP单播双向Ping包处理单向Ping包过程,Ping包由主控CPU发起,向线卡透传,由线卡接口发出。接收到的回复报文从线卡接口接收,由线卡CPU处理完成Ping操作。
¡ 如果ping包ping不通,请先参考4 单播转发故障处理,如果单播转发正常,请参考步骤(6)搜集信息并联系技术支持人员。
¡ 如果Ping包能Ping通,请执行步骤(2)。
(2) 查看协议报文是否上送CPU,在Probe视图下执行display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number } [ verbose | clear ]命令可以查看线卡上协议上送情况。
¡ 如果能看到协议上报文有上送,则执行步骤(3)。
¡ 如果没有上送,请参考步骤(6)搜集信息并联系技术支持人员。
(3) 查看是否有丢包情况,在Probe视图下执行可维护命令display hardware internal intf port-info slot slot-number命令查询单板上接口对应的NP芯片号,继续执行可维护命令display hardware np pktcnt { drop | forward } slot slot-number chip chip-id查看接口对应的NP芯片的丢包和转发情况:
¡ 如果NP芯片有异常丢包,则参考步骤(6)搜集信息联系技术支持人员。
¡ 如果NP芯片没有丢包,则执行步骤(4)
(4) 在Probe试图下执行可维护命令display hardware np qacl tm-statcnt slot slot-number [ chip chip-id ],查看接口对应的NP芯片是否达到了TM限速而丢弃报文,如果出现WRED Drop计数,请参考步骤(6)搜集信息并联系技术支持人员。
(5) 最后检测协议配置是否正常,如果正常请参考步骤(6)搜集信息并联系技术支持人员。
(6) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
¡ display hardware np qacl tm-statcnt slot slot-number [ chip chip-id ](命令用来显示NP芯片TM的统计信息)
¡ display hardware np interface fabric { statistic | status } slot slot-number [ chip chip-id ](命令用来显示NP交换网络侧接口统计、状态)
· Probe视图下:
¡ display hardware internal rxtx packet statistic slot slot-number cpu cpu-number [ clear ](命令用来显示单板上收发的报文计数和报文信息)
¡ display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
协议配置后发生偶尔或不断发生震荡。
· 设备性能不足,CPU不能及时处理协议报文。
· 协议达到接口限速值被丢弃。
· 协议报文上送环节有部分丢包。
· NP性能达到瓶颈出现丢包。
(1) 确认出现震荡时的操作,是否额外的操作或配置影响协议状态。如果无相关特殊操作,则继续执行步骤(2)处理。
(2) 执行display hardware np status观察NP的使用率,在NP利用率达到100%的情况下,无法保证Pos类型接口的协议报文优先处理,有可能导致协议震荡。
¡ 如果NP利用率超高,请参考步骤(6)搜集信息,联系技术支持人员。
¡ 如果NP利用率正常,请参考步骤(3)处理。
(3) 执行可维护命令display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number }命令查看线卡上各协议上送速率:
¡ 如果有协议速率过高,请参考步骤(6)搜集信息并联系技术支持人员;
¡ 如果协议速率正常,则继续执行步骤(4)。
(4) 查看协议报文上送环节丢包情况,参照5.1 协议无法建立的查看丢包步骤。需要注意的是,有部分协议BFD、OSPF等允许少量丢包,只有连续几次丢包协议才会Down,这种协议在Probe视图下执行可维护命令display hardware internal rxtx packet statistic slot slot-number cpu cpu-number,在统计命令中,如有少量丢包属于正常情况。
(5) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意视图下:
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
¡ display hardware np qacl tm-statcnt slot slot-number [ chip chip-id ](命令用来显示NP芯片TM的统计信息)
· Probe视图下:
¡ display hardware internal rxtx packet statistic slot slot-number cpu cpu-number [ clear ](命令用来显示单板上收发的报文计数和报文信息)
¡ display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(用来显示端口信息)
系统视图下全局使能三层IPV4/IPV6组播,配置IGMP/MLD、PIM/IPV6 PIM等三层组播协议,打入组播流量,转发不通。
· 单播路由不通,组播路由没有学习到。
· RPF检查失败,报文丢弃。
(1) 单播双向ping处理:
¡ 如果能ping通,则继续执行步骤(2)。
(2) 在任意视图下执行命令display multicast routing-table查看组播路由是否正确,如果不正确,请检查单播是否能通,组播是否使能,是否配置完整有效,如果路由正确,则执行步骤(3)。
(3) 在任意视图下执行命令display multicast forwarding-table查看转发表是否正确
¡ 如果不正确,则执行步骤(4)。
¡ 如果组播时能标志置位,接口配置正确,则执行步骤(5)。
(4) 在Probe试图下执行可维护命令:
[System-probe] display hardware internal mc global chassis 1 slot 12
================ NPU: l3mc global info ================
IPv4 Hw Hash entry count: 0
IPv4 Hw Tcam entry count: 2
IPv4 Sw total entry count: 0
IPv4 Sw Dummy entry count: 0
IPv4 Sw Normal entry count: 0
g_bV4RPFFailToCPU : 0
abV4McEnable[0] : 1 --àIpv4组播使能标志
IPv6 Hw Hash entry count: 0
IPv6 Hw Tcam entry count: 1
IPv6 Sw total entry count: 0
IPv6 Sw Dummy entry count: 0
IPv6 Sw Normal entry count: 0
bV6RPFFailToCPU : 0
bV6McEnable : 1 àipv6组播使能标志
hIPv4McHandle : c0000002f5888480
hIPv6McHandle : c0000002f5888900
usRpfFailCpuCode : 10
--------------- NPU: Local CudPool info --------------
NP Count RefCount JFCount LJStatus
0 262063 0 0 0
查看接口配置,中间链路使能pim协议,边缘设备配置igmp/mld等组管理协议,如果配置有问题,请修改配置。否则请参考步骤(5)搜集故障信息并联系技术支持人员。
(5) 执行命令display multicast rpf-info查看组播RPF校验是否成功,如果RPF校验失败,请修改组播源入接口,如果以上处理无效,则参考步骤(5)搜集故障信息并联系技术支持人员。
(6) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意试图下:
¡ display multicast routing-table(命令用来显示组播路由表的信息)
¡ display multicast forwarding-table(命令用来显示组播转发表的信息)
¡ display ipv6 multicast routing-table(命令用来显示IPv6组播路由表的信息)
¡ display ipv6 multicast forwarding-table(命令用来显示IPv6组播转发表的信息)
¡ display multicast rpf-info source-address [ group-address ](命令用来显示组播源的RPF信息)
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
¡ display hardware np interface fabric { statistic | status } slot slot-number [ chip chip-id ](命令用来显示NP交换网络侧接口统计、状态)
¡ display hardware topology [ link { slot slot-number | interface-name | interface-type interface-number } ] { fabric | control-plane }(命令用来显示设备拓扑信息)
· Probe视图下:
¡ display hardware internal mc spec slot slot-number(命令用来显示MC规格信息,通过slot号可以解析出主控和线卡上不同的信息)
¡ display hardware internal mc global slot slot-number(命令用来显示MC全局信息,主要包括VPLS全局信息、IPV4全局信息、IPV6全局信息和CpuCode等)
¡ display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(用来显示端口信息)
¡ display hardware internal lif np inlif slot slot-number chip chip-id vlan vlanid port phyport(来根据单板槽位、芯片编号、VLAN号及端口号显示单板INLIF硬件表项)
¡ display hardware internal mc ipv4 vpn vpn-id sip ip-address gip ip-address slot slot-number chip chip-id [ hardware ](命令用来显示IPv4 MC软硬件表项信息。默认缺省显示IPv4 MC软件表项信息,输入选中hardware时显示IPv4 MC硬件表项信息)
¡ display hardware internal mc ipv6 vpn vpn-id sip ipv6-address gip ipv6-address slot slot-number chip chip-id [ hardware ](命令用来显示IPv6 MC软硬件表项信息。默认缺省显示IPV6 MC软件表项信息,输入选中hardware时显示IPv6 MC硬件表项信息)
¡ display hardware internal mc mid mid-id slot slot-number(命令用来显示组播组信息)
¡ display hardware internal mc mll mid mid-id slot slot-number chip chip-id [ hardware ](命令用来显示MC MLL软硬件表项信息。默认缺省显示MLL软件表项信息,输入选中hardware时显示MLL硬件表项信息)
¡ display hardware internal mc default-entry { ipv4 | ipv6 } slot slot-number(命令用来显示IPv4/IPv6组播申请的缺省组播表项信息)
¡ display hardware internal tcam stat-info table table-type slot slot-number chip chip-id(命令用来查看TCAM中指定表项统计信息)
组播流量通,但是有丢包问题。
· 交换FAP芯片复制性能。
· 组播硬件资源耗尽。
(1) 在任意视图下执行命令display hardware topology [ link { slot slot-number | interface-name | interface-type interface-number } ] { fabric | control-plane }查看Jericho/np接口的对应关系,如果报文长度固定长度为128字节,如果同一个Jericho上(S,G)出接口大于300,可能Jericho复制性能不够,会丢包,建议减少出接口个数,报文越大,复制性能越差。如果没有问题,则执行步骤(2)
(2) 在Probe视图下执行命令display hardware internal mc global slot slot-number
[System-probe] display hardware internal mc global chassis 1 slot 12
================ NPU: l3mc global info ================
IPv4 Hw Hash entry count: 0
IPv4 Hw Tcam entry count: 2
IPv4 Sw total entry count: 0
IPv4 Sw Dummy entry count: 0
IPv4 Sw Normal entry count: 0
g_bV4RPFFailToCPU : 0
abV4McEnable[0] : 1 --àIpv4组播使能标志
IPv6 Hw Hash entry count: 0
IPv6 Hw Tcam entry count: 1
IPv6 Sw total entry count: 0
IPv6 Sw Dummy entry count: 0
IPv6 Sw Normal entry count: 0
bV6RPFFailToCPU : 0
bV6McEnable : 1 àipv6组播使能标志
hIPv4McHandle : c0000002f5888480
hIPv6McHandle : c0000002f5888900
usRpfFailCpuCode : 10
--------------- NPU: Local CudPool info --------------
NP Count RefCount JFCount LJStatus
0 262063 0 0 0
如果出现RefCount使用超过262000,建议先降低本Np芯片的出接口个数;如果LJStatus=1,说明资源有耗尽,降低本Jericho上的出接口个数或者组播组个数。
(3) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 任意试图下:
¡ display multicast routing-table(命令用来显示组播路由表的信息)
¡ display multicast routing-table(命令用来显示组播转发表的信息)
¡ display ipv6 multicast routing-table(命令用来显示IPv6组播路由表的信息)
¡ display ipv6 multicast forwarding-table(命令用来显示IPv6组播转发表的信息)
¡ display multicast rpf-info(命令用来显示组播源的RPF信息)
¡ display hardware np pktcnt { drop | forward } slot slot-number [ chip chip-id ] [ verbose ]多次执行并搜集信息(用来显示NP转发平面转发以及丢弃报文信息)
¡ display hardware np interface fabric { statistic | status } slot slot-number [ chip chip-id ](命令用来显示NP交换网络侧接口统计、状态)
¡ display hardware topology [ link { slot slot-number | interface-name | interface-type interface-number } ] { fabric | control-plane }(命令用来显示设备拓扑信息)
· Probe视图下:
¡ display hardware internal mc spec slot slot-number(命令用来显示MC规格信息,通过slot号可以解析出主控和线卡上不同的信息)
¡ display hardware internal mc global slot slot-number(命令用来显示MC全局信息,主要包括VPLS全局信息、IPV4全局信息、IPV6全局信息和CpuCode等)
¡ display hardware internal rxtx rate rx { interface interface-type interface-number } | slot slot-number } [ verbose | clear ](命令用来显示单板上接收和发送的协议报文的速率)
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(用来显示端口信息)
¡ display hardware internal lif np inlif slot slot-number chip chip-id vlan vlanid port phyport(来根据单板槽位、芯片编号、VLAN号及端口号显示单板INLIF硬件表项)
¡ display hardware internal mc ipv4 vpn vpn-id sip ip-address gip ip-address slot slot-number chip chip-id [ hardware ](命令用来显示IPv4 MC软硬件表项信息。默认缺省显示IPv4 MC软件表项信息,输入选中hardware时显示IPv4 MC硬件表项信息)
¡ display hardware internal mc ipv6 vpn vpn-id sip ipv6-address gip ipv6-address slot slot-number chip chip-id [ hardware ](命令用来显示IPv6 MC软硬件表项信息。默认缺省显示IPV6 MC软件表项信息,输入选中hardware时显示IPv6 MC硬件表项信息)
¡ display hardware internal mc mid mid-id slot slot-number(命令用来显示组播组信息)
¡ display hardware internal mc mll mid mid-id slot slot-number chip chip-id [ hardware ](命令用来显示MC MLL软硬件表项信息。默认缺省显示MLL软件表项信息,输入选中hardware时显示MLL硬件表项信息)
¡ display hardware internal mc default-entry { ipv4 | ipv6 } slot slot-number(命令用来显示IPv4/IPv6组播申请的缺省组播表项信息)
¡ display hardware internal tcam stat-info table table-type slot slot-number chip chip-id(命令用来查看TCAM中指定表项统计信息)
正常配置vpls后,从AC(Attachment Circuit,接入电路)进入的二层报文未能转发到对应的PW(Pseudowire,伪线)中。
· 接口物理层down。
· VSI、AC、PW不UP。
· 单板Inlif硬件表项不正确。
· AC、PW侧表项不正确。
(1) 检查AC接口表中的vp索引是否有效、vp标记和LM标记是否置位,如果LM标记未置位,则不能进行mac学习;如果vp标记未置位,则无法进行vpls转发。出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal lif np inlif slot 7 Ten-GigabitEthernet 7/2/3.1
Inlif Table : KEY(vlan=1,port=194)
RESULT(80071011, 03fc0203, e0000200, 00000001, 00000082, 00000001, 00000000, 00037081)
RES:
un0.gen.uiSa:1 = 1
un0.gen.uiV4m:1 = 0
…….
un2.gen.uiVph:1 = 0
un2.gen.uiVp:1 = 0
un3.gen.uiZero1:1 = 0
……
un4.vll.uiSvp:16 = 0
un4.vll.uiDvp:16 = 130
un4.vxlan.uiLink:8 = 0
un4.vxlan.uiDvp:16 = 130
(2) 分别检查平台vsi软件信息、AC接口绑定vsi状态及PW口up状态,如果PW不up,或vsi为down,需检查vsi基本配置,使vsi及PW口处于up状态。
[System] display l2vpn vsi name yyw verbose
VSI Name: yyw
VSI Index : 101
VSI State : Up
MTU : 1500
……
VXLAN ID : -
LDP PWs:
Peer PW ID Link ID State
6.6.6.6 6666 64 Up
ACs:
AC Link ID State
XGE2/4/3.6 0 Up
(3) 根据步骤(2)中的显示的vsi index、Link ID信息,查找vsi软件表项信息,如果该表项不存在,表示vsi创建失败,导致转发不通,出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal mpls vpls vsiinfo vsi 101 slot 2
/================ VSI Infomation ================/
VPNID : 4197
------------------------------------------------
Is Source Mac Full : 0(0:FALSE 1:TRUE)
Is Source Mac Restrain : 0(0:FALSE 1:TRUE)
Is L2 Notify Mac Full : 0(0:FALSE 1:TRUE)
Is Need Loop : 0(0:FALSE 1:TRUE)
Mac Learn Mode : 1(0:FALSE 1:TRUE)
Broadcast Restrain : 655360 Bps
Multicast Restrain : 655360 Bps
Unknown Restrain : 655360 Bps
Speed Limit : 4294967295 Bps
TB Index BC : 65744
TB Index MC : 208
TB Index UnknownUC : 131280
TB Index UC : 101
TB CMD : 4
(4) 根据步骤(2)中的vsi index、LinkID信息检查AC和PW侧软件表项,如果表项不存在,会导致关联的Mll、VP等表项下发失败,导致转发不通,出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal mpls vpls linkinfo vsi 101 linkid 64 slot 2
/================ PW Infomation ================/
VPNID : 4197
LinkIndex : 0
-----------------------------------------------
Is Tag : 1(0:FALSE 1:TRUE)
……
Inlabel : 4123
Outlabel : 4123
InCarId : 0
OutCarId : 0
VP : 1126
Lsp Index : 0
Is Ecmp Lsp : 0(0:FALSE 1:TRUE)
Tunnel Index : 0
Outlif ID : 123696
Slot ID : 2
Chip ID : 1
Phy Port : 255
Nhlfe ID : 268444256
DrvVn ID : 0
VnHandle : 0xc000000296cd6260
Ecmp Lsp Point : 0
Ecmp Num : 1
Load Share Weight : 0
[System-probe] display hardware internal mpls vpls linkinfo vsi 101 linkid 0 slot 2
/================ AC Infomation ================/
VPNID : 4197
PathIndex : 0
-----------------------------------------------
Is Hub AC : 0(0:FALSE 1:TRUE)
……
IfIndex : 4200
Lif ID : 8199
Outlif ID : 123706
Vlan ID : 6
Chip ID : 1
Slot ID : 2
Trunk ID : 0
Dev : 13
Dport : 19
LogicPort : 0
VP : 1125
bIsVxlan : 0
uiVxlanID : 0
uiOutlifId : 123706
usIpctLifId : 0
(5) 查看对应出接口Mll表项信息,PW侧Mll表项需要置位OV标记和私网标签,当前不支持等价;如果表项不存在,导致转发不通,请联系技术支持人员处理。
[System-probe] display hardware internal mc mll mid 81709 slot 2
All normal outItf list :mid :81709 !
*******ifindex :4357, Ten-GigabitEthernet2/4/2.6 ******!
CUD[0]:0 ,CUD[1]:262085 ,CUD[2]:0 ,CUD[3]:0 ,CUD[4]:0 ,CUD[5]:0 ,
*******ifindex :902, Ten-GigabitEthernet2/4/6 ******!
CUD[0]:262140 ,CUD[1]:262045 ,CUD[2]:0 ,CUD[3]:0 ,CUD[4]:0 ,CUD[5]:0 ,
Exceed outItf list is Null !
(6) 根据步骤(4)中的Nhlfe ID,检查软件Nhlfe中的OutLifId,如果与(4)中的OutLifId不一致,会导致找不到出接口从而转发不通,出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal mpls soft-nhlfe nhlfeid 268444256 slot 7
/============== SOFT NHLFE ENTRY ==============/
EcmpNum : 1
=== BEGIN : NHLFE[0] ===
IsTeNhlfe : 1(0:FALSE 1:TRUE)
IsActive : 1(0:FALSE 1:TRUE)
TeFlowId : 16383
NhlfeID : 268444256
Trunk Node Addr : 4294967295
TrunkId : 0
TunnelIdx : 4294967295
IsNeedStat : 0(0:FALSE 1:TRUE)
LspStatIndex : 131071
bIsSrLsp : 0(0:FALSE 1:TRUE)
bIsPreSrNhlfe : 1(0:FALSE 1:TRUE)
OutLifId[LSP ] : 123706
OutLifId[TP ] : 0
OutLifId[BFD ] : 0
OutLifId[BFD_PW] : 0
OutLifId[BAK ] : 0
OutLifId[VLL ] : 0
(7) 检查硬件OutLif表项有效性,出口可能为gre隧道、聚合口、普通物理口等,如果该表项不存在,则会出现OutLif表项不命中丢弃,请联系技术支持人员处理。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 123706 slot 7 chip
0
=================== Hardware Table Info(HEX) =================
WORD0: 00000251
WORD1: 11073D1B
WORD2: 00000080
WORD3: 000000FF
WORD4: 0000003F
WORD5: 000000FF
WORD6: 05DC0000
WORD7: FFF03D8A
HW OUTLIF STRUCT INFO
Bak : 0
Bcm : 0
L3Port : 0
P2mp : 0
Drop : 0
Th : 0
Trunk : 0
Arp : 1
V4Tun : 0
V6Tun : 0
ApsTp : 0
Lspt : 1
Match : 1
V : 1
}tunnel
DvlanDlci : 4095
iOutlifId : 15754
}gen
{
DvlanDlci : 4095
OutlifId : 123706
}lspt
(8) 如果故障仍未解决,请搜集故障信息并联系技术支持人员。
正常配置vpls后,报文已进入下行PE(Provider Edge,服务提供商网络边缘)设备,从PW(Pseudowire,伪线)口接收的广播或未知单播报文没有转发到AC(Attachment Circuit,接入电路)出接口。
· 接口物理层down。
· VSI、AC、PW等不UP。
· 单板inlif硬件表项不正确。
· AC、PW侧表项不正确。
(1) 参考7.1.1 VPLS泛洪、未知单播流量AC到PW方向转发不通中的操作方法,分别检查平台vsi软件信息、AC接口绑定vsi状态及PW口up状态,如果PW不up,或vsi为down,需检查vsi基本配置,使vsi和PW处于up状态。
(2) 检查接口表项是否使能MPLS标记,如果未使能MPLS,则导致转发不通,需先使能MPLS。
[System-probe] display hardware internal lif np inlif slot 7 Ten-GigabitEthernet 7/2/3.1
Inlif Table : KEY(vlan=1,port=194)
RESULT(80071011, 03fc0203, e0000200, 00000001, 00000082, 00000001, 00000000, 00037081)
RES:
un0.gen.uiSa:1 = 1
……
un0.gen.uiRsvp:1 = 0
un0.gen.uiMpls:1 = 0
un0.gen.uiIpv4:1 = 1
un0.gen.uiL3:1 = 1
un0.gen.uiL3Vpn:1 = 1
un0.gen.uiPppoe:1 = 0
un0.gen.uiCon:1 = 1
(3) 查找ILM表项,检查VP标记和Vpn Id有效性,如果该表项不存在,则会出现ILM表项不命中丢弃,请联系技术支持人员处理。
[System-probe] display hardware internal mpls hw-ilm inlabel 4941 slot 2 chip 0
=================== Hardware Table Info(HEX) =================
WORD0: F0000811
WORD1: 00001000
WORD2: 00000000
WORD3: 00000006
WORD4: 00000000
WORD5: 00000000
WORD6: 00000000
WORD7: 00000000
HW ILM STRUCT INFO
{
Tag : 1
Net_CW : 1
MacLearnMode : 3
Sade : 0
Es : 0
Ts : 0
Oam : 0
Pwcar : 0
Ls : 0
Red : 0
P2mp : 0
Context : 0
6Vpe : 0
Th : 0
L3vpn : 0
Vll : 0
Vph : 0
Vp : 1
Chkmac : 0
Block : 0
Pop : 0
EcmpLsp : 0
Swap : 0
Php : 0
M : 1
Reserve : 0
V : 1
}WORD0
{
{
DVlanOrRPtag : 0
VpnId : 4096
}gen_S
{
Reserve : 0
Bak_Outlifid : 4096
}bak_S
}WORD1
{
{
Reserve : 0
OutlifId : 0
}gen_S
{
Reserve : 0
Enum : 0
Ecmplsp_Pointer: 0
}ecmp_S
}WORD2
{
{
SwapLabel : 0
Exp : 0
Zero : 0
Ttl : 6
}gen_S
{
Reserve : 0
P2mpId : 6
}p2mp_S
{
Dvp : 0
Svp : 6
}vll_S
}WORD3
{
{
TbIdx : 0
Reserve : 0
}gen_S
{
LifId : 0
Reserve : 0
}lif_S
}WORD4
{
PopNum : 0
LspStatIdx : 0
}WORD5
{
{
FecMask : 0
LblType : 0
BakLabel : 0
}gen_S
{
FecMask : 0
LblType : 0
SecLabel : 0
}ecmp_S
}WORD6
{
Fec : 0
}WORD7
(4) 根据vsi index、LinkId信息,检查AC和PW侧软件表项信息,如果AC侧软件表项不存在,则Mll表项下发失败,导致转发不通,出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal mpls vpls linkinfo vsi 101 linkid 64 slot 2
/================ PW Infomation ================/
VPNID : 4197
LinkIndex : 0
-----------------------------------------------
Is Tag : 1(0:FALSE 1:TRUE)
……
Inlabel : 4123
Outlabel : 4123
InCarId : 0
OutCarId : 0
VP : 1126
Lsp Index : 0
Is Ecmp Lsp : 0(0:FALSE 1:TRUE)
Tunnel Index : 0
Outlif ID : 123696
Slot ID : 2
Chip ID : 1
Phy Port : 255
Nhlfe ID : 268444256
DrvVn ID : 0
VnHandle : 0xc000000296cd6260
Ecmp Lsp Point : 0
Ecmp Num : 1
Load Share Weight : 0
[Sysname-probe] display hardware internal mpls vpls linkinfo vsi 101 linkid 0 slot 2
/================ AC Infomation ================/
VPNID : 4197
PathIndex : 0
-----------------------------------------------
……
ComVlanNum : 1
IfIndex : 4200
Lif ID : 8199
Outlif ID : 123706
Vlan ID : 6
Chip ID : 1
Slot ID : 2
Trunk ID : 0
Dev : 13
Dport : 19
LogicPort : 0
VP : 1125
bIsVxlan : 0
uiVxlanID : 0
uiOutlifId : 123706
usIpctLifId : 0
(5) 查找Mll表项,检查Mll软硬件表项信息,如果该表项异常,jericho无法复制报文,则导致转发不通,出现该问题请联系技术支持人员处理。
[System-probe] display hardware internal mc mll mid 81709 slot 2
All normal outItf list :mid :81709 !
*******ifindex :4357, Ten-GigabitEthernet2/4/2.6 ******!
CUD[0]:0 ,CUD[1]:262085 ,CUD[2]:0 ,CUD[3]:0 ,CUD[4]:0 ,CUD[5]:0 ,
*******ifindex :902, Ten-GigabitEthernet2/4/6 ******!
CUD[0]:262140 ,CUD[1]:262045 ,CUD[2]:0 ,CUD[3]:0 ,CUD[4]:0 ,CUD[5]:0 ,
Exceed outItf list is Null !
(6) 如果问题仍未解决,请搜集故障信息并联系技术支持人员。
正常配置vpls后,vpls未知单播转发正常,已经学习到MAC地址。但是从AC口进入的报文没有转发到对应的PW口。
· 接口物理层down。
· VSI、AC、PW等不UP。
· 单板inlif硬件表项不正确。
· AC、PW侧表项不正确。
(1) 分别检查平台vsi软件信息、AC接口绑定vsi状态及PW口up状态,如果PW不up,或vsi为down,需参考配置手册检查vsi基本配置,使vsi和PW处于up状态。
(2) 检查AC接口表中的vp索引是否有效、vp标记和LM标记是否置位,如果LM标记未置位,则不能进行mac学习;如果vp标记未置位,则无法进行vpls转发。出现该问题请联系技术支持人员处理。
[Sysname-probe] display hardware internal lif np inlif slot 7 Ten-GigabitEthernet 7/2/3.1
Inlif Table : KEY(vlan=1,port=194)
RESULT(80071011, 03fc0203, e0000200, 00000001, 00000082, 00000001, 00000000, 00037081)
RES:
un0.gen.uiSa:1 = 1
un0.gen.uiV4m:1 = 0
…….
un2.gen.uiVph:1 = 0
un2.gen.uiVp:1 = 0
un3.gen.uiZero1:1 = 0
……
un4.vll.uiSvp:16 = 0
un4.vll.uiDvp:16 = 130
un4.vxlan.uiLink:8 = 0
un4.vxlan.uiDvp:16 = 130
(3) 查找VP表项是否做私网标签封装,如果vp表项不存在或者私网标签无效则会导致转发异常,出现该问题请联系技术支持人员处理。
[Sysname-probe] display hardware internal mpls hw-vp 6 slot 2 chip 0
=================== The table belong to mdc: 65535 =================
=================== Hardware Table Info(HEX) =================
WORD0: 0000A351
WORD1: 00000000
WORD2: 00000001
WORD3: 010FE100
HW VP STRUCT INFO
……
{
CTag_bkrPTag : 0
LabelBak : 0
Exp : 0
S : 1
}WORD2
{
Label : 4350
Exp : 0
S : 1
CTag_bkrPTag : 0
}WORD3
(4) 检查PW侧软件表项是否存在,如果PW侧软件表项不存在,则无法进行vpls转发及mac同步。
[Sysname-probe] display hardware internal mpls vpls linkinfo vsi 0 linkid 65 slot 2
/================ PW Infomation ================/
VPNID : 4096
LinkIndex : 1
-----------------------------------------------
Is Tag : 1(0:FALSE 1:TRUE)
Is NPW : 1(0:FALSE 1:TRUE)
Is Hub PW : 0(0:FALSE 1:TRUE)
Is Spoke PW : 0(0:FALSE 1:TRUE)
Is Use Backup PW : 0(0:FALSE 1:TRUE)
Is OnePlusOne : 0(0:FALSE 1:TRUE)
Is Gre : 0(0:FALSE 1:TRUE)
rPtag : 0
Mtu : 65535
ServiceFlag : 0
Inlabel : 4941
Outlabel : 4350
InCarId : 0
OutCarId : 0
VP : 6
Lsp Index : 0
Is Ecmp Lsp : 0(0:FALSE 1:TRUE)
Tunnel Index : 0
Outlif ID : 122428
Slot ID : 2
Chip ID : 1
Phy Port : 255
Nhlfe ID : 35
DrvVn ID : 0
VnHandle : 0xc00000023363c7d0
Ecmp Lsp Point : 0
Ecmp Num : 1
Load Share Weight : 0
(5) 检查硬件Outlif表项内容,出接口可能为Gre隧道、TE隧道、聚合口、普通物理口,如果该表项不存在,则导致转发不通,出现该问题请联系技术支持人员。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 123706 slot 7 chip 0
=================== Hardware Table Info(HEX) =================
WORD0: 00000251
WORD1: 11073D1B
WORD2: 00000080
WORD3: 000000FF
WORD4: 0000003F
WORD5: 000000FF
WORD6: 05DC0000
WORD7: FFF03D8A
HW OUTLIF STRUCT INFO
{
{
Bak : 0
Bcm : 0
……
L3Port : 0
P2mp : 0
Drop : 0
Th : 0
Trunk : 0
Arp : 1
V4Tun : 0
V6Tun : 0
ApsTp : 0
Lspt : 1
Match : 1
V : 1
}tunnel
……
{
{
DvlanDlci : 4095
iOutlifId : 15754
}gen
{
DvlanDlci : 4095
OutlifId : 123706
}lspt
(6) 如果问题仍未解决,请搜集故障信息并联系技术支持人员定位。
正常配置vpls后,vpls未知单播转发正常,已经学习到MAC地址。报文已经进入下行PE设备,但是从PW口入的报文没有转发到对应的AC口。
· 接口物理层down。
· VSI、AC、PW等不UP。
· 单板inlif硬件表项不正确。
· AC、PW侧表项不正确。
(1) 分别检查平台vsi软件信息、AC接口绑定vsi状态及PW口up状态,如果PW不up,或vsi为down,需参考配置手册检查vsi基本配置,使vsi和PW处于up状态。如果PW不up,或vsi为down,需检查vsi基本配置。
(2) 检查接口表项是否使能MPLS标记,如果未使能MPLS,会导致转发不通,请先使能MPLS。
[Sysname-probe] display hardware internal lif np inlif slot 7 Ten-GigabitEthernet 7/2/3.1
Inlif Table : KEY(vlan=1,port=194)
RESULT(80071011, 03fc0203, e0000200, 00000001, 00000082, 00000001, 00000000, 00037081)
RES:
un0.gen.uiSa:1 = 1
……
un0.gen.uiRsvp:1 = 0
un0.gen.uiMpls:1 = 0
un0.gen.uiIpv4:1 = 1
un0.gen.uiL3:1 = 1
un0.gen.uiL3Vpn:1 = 1
un0.gen.uiPppoe:1 = 0
un0.gen.uiCon:1 = 1
(3) 检查ILM表项Vpn Id有效性、vp标记和使能mac学习能力,如果VP标记未置位,不能进行vpls转发。如果未使能MAC学习,则不会进行MAC学习,报文走广播流程转发,可能会被广播抑制丢包。如果该表项不存在,则会出现ILM表项不命中丢包,出现该问题请联系技术支持人员。
[Sysname-probe] display hardware internal mpls hw-ilm inlabel 4941 slot 2 chip 0
======== The table belong to mdc: 2 ==========
=================== Hardware Table Info(HEX) =================
……
HW ILM STRUCT INFO
{
Tag : 1
Net_CW : 1
MacLearnMode : 3
Sade : 0
……
Vph : 0
Vp : 1
Chkmac : 0
Block : 0
Pop : 0
EcmpLsp : 0
Swap : 0
Php : 0
M : 1
Reserve : 0
V : 1
}WORD0
{
{
DVlanOrRPtag : 0
VpnId : 4096
}gen_S
{
Reserve : 0
Bak_Outlifid : 4096
}bak_S
}WORD1
{
{
Reserve : 0
OutlifId : 0
}gen_S
{
Reserve : 0
Enum : 0
Ecmplsp_Pointer: 0
}ecmp_S
}WORD2
{
{
SwapLabel : 0
Exp : 0
Zero : 0
Ttl : 6
}gen_S
{
Reserve : 0
P2mpId : 6
}p2mp_S
{
Dvp : 0
Svp : 6
}vll_S
}WORD3
……
{
Fec : 0
}WORD7
(4) 在Probe视图下执行命令display hardware internal fdb sw-table vpls-type slot slot-number找到element,再执行display hardware internal fdb element-info element element slot slot-number。检查软件mac表项信息,检查表项vp索引,Dev和PhyPort的有效性。如果该表项不存在则无法命中mac做转发,出现该问题请联系技术支持人员。
(5) 查找VP表项有效性,此时私网标签无效,走AC转发。如果vp表项不存在,则不命中vp表项,转发失败。出现该问题请联系技术支持人员。
[Sysname-probe] display hardware internal mpls hw-vp 6 slot 2 chip 0
=================== The table belong to mdc: 65535 =================
=================== Hardware Table Info(HEX) =================
WORD0: 0000A351
WORD1: 00000000
WORD2: 00000001
WORD3: 010FE100
HW VP STRUCT INFO
……
{
CTag_bkrPTag : 0
LabelBak : 0
Exp : 0
S : 1
}WORD2
{
Label : 4350
Exp : 0
S : 1
CTag_bkrPTag : 0
}WORD3
(6) 如果问题仍未解决,请搜集故障信息并联系技术支持人员。
正常配置vll后,AC到PW方向转发异常或PW到AC方向转发异常。
· 接口物理层down。
· AC、PW等不UP。
· 单板inlif硬件表项不正确。
· AC、PW侧表项不正确。
(1) 分别检查平台vsi软件信息、AC接口绑定vsi状态及PW口up状态,如果PW不up,或vsi为down,需参考配置手册检查vsi基本配置,使vsi和PE处于up状态。
(2) 检查AC接口信息表中的vll标记是否置位,如果vll标记未置位,不能进行vll转发。
[Sysname-probe] display hardware internal lif np inlif slot 7 Ten-GigabitEthernet 7/2/3.1
Inlif Table : KEY(vlan=1,port=194)
RESULT(80071011, 03fc0203, e0000200, 00000001, 00000082, 00000001, 00000000, 00037081)
RES:
un0.gen.uiSa:1 = 1
un0.gen.uiV4m:1 = 0
…….
un2.gen.uiVxlan:1 = 0
un2.gen.uiVll:1 = 0
un2.gen.uiVph:1 = 0
un2.gen.uiVp:1 = 0
un3.gen.uiZero1:1 = 0
……
un4.vll.uiSvp:16 = 0
un4.vll.uiDvp:16 = 130
un4.vxlan.uiLink:8 = 0
un4.vxlan.uiDvp:16 = 130
(3) 查看AC侧软件表项信息,如果AC侧软件表项不存在,则添加ac失败,导致转发不通;
[Sysname-probe] display hardware internal mpls vpws ac-info slot 2 interface Ten-Gigabi
tEthernet 2/4/3.7
/============= VLL AC INFO =============/
ifInIndex : 4201
……
Lif Id : 8200
OutLifId : 123708
VP : 1116
VsiIndex : 2147483648
OutLinkId : 65535
Slot ID : 2
Frame ID : 0
Dev Num : 13
Phy Port : 19
LogicPort : 0
(4) 根据输入私网 标签查看PW侧软件表项是否存在,如果该表项不存在,则无法命中ILM表,造成转发不通。
[Sysname-probe] display hardware internal mpls vpws soft-info inlabel 4940 slot 2
/============= VLL SOFT-INFO of LABEL 4940 =============/
IsInterworking : 0
VLL PW INFO :
VN Handle : 0xc00000023363c7d0
Encapsulation Type: VLAN
VN ID : 0
IsMspw : 0(0:FALSE 1:TRUE)
In Label : 4940
Out Label : 4349
MSPW Label : 0
Remote Ptag : 65535
VP : 10
……
VLL AC INFO :
Board Type : 0
VLL Entry Type : PW
IsTrunk : 0
……
Lif Id : 9678
VP : 10
OutLifId : 122433
IsMicPWE3 : 0
IsSelfBrd : 1
RsvLabel : 0
Adj DrvContext :
0x00000000 0x00000000 0x00000000 0x00000000 0x00000000 0x00000000
(5) 查看VP表项是否存在,如果表项不存在,会导致转发不通。
[Sysname-probe] display hardware internal mpls hw-vp 10 slot 2 chip 0
=================== The table belong to mdc: 65535 =================
=================== Hardware Table Info(HEX) =================
WORD0: 00020451
WORD1: 00000000
WORD2: 00000000
WORD3: 00000000
HW VP STRUCT INFO
{
Reserver1 : 0
Sa : 0
IsRed : 0
Zero : 0
Rptag : 2
IsVp : 0
Int : 0
L : 0
Cw : 0
TunV : 0
Vll : 1
N : 0
Tag : 0
Pwcar : 0
TagMode : 1
Pwe3 : 0
M : 1
Reserve2 : 0
V : 1
}WORD0
……
{
Label : 0
Exp : 0
S : 0
CTag_bkrPTag : 0
}WORD3
(6) 根据Nid,在Probe视图下执行命令display hardware internal mpls soft-nhlfe nhlfeid NHLFE-id slot slot-number查找Nhlfe表项信息,如果软件Nhlfe表项不存在,则对应的Outlif表项也不存在,导致无法转发。
(7) 根据OutLifId查Outlif表项,出口可能为gre隧道、te隧道、聚合口、普通物理口等;如果该表项不存在,则会导致转发不通,出现该问题请联系技术支持人员。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 123706 slot 7 chip
0
=================== Hardware Table Info(HEX) =================
WORD0: 00000251
……
HW OUTLIF STRUCT INFO
{
{
Bak : 0
Bcm : 0
……
L3Port : 0
P2mp : 0
Drop : 0
Th : 0
Trunk : 0
Arp : 1
V4Tun : 0
V6Tun : 0
ApsTp : 0
Lspt : 1
Match : 1
V : 1
}tunnel
……
{
{
DvlanDlci : 4095
iOutlifId : 15754
}gen
{
DvlanDlci : 4095
OutlifId : 123706
}lspt
……
(8) 如果问题仍未解决,请搜集故障信息并联系技术支持人员。
公网IP报文入MPLS报文出的组网配置,IP入报文进MPLS公网转发异常。
· 接口物理层down、IP地址不正确。
· OSPF、ISIS、LDP等协议配置不正确。
· FTN表项不正确。
· Outlif表项不正确。
· Ftnecmp表项不正确。
(1) 检查平台路由信息及标签信息,如果上述平台表项信息不存在或有错误,需检查基本组网配置并修改,使平台路由信息及标签信息正常。
(2) 查找驱动维护的FTN表项(等价的情况),如果该表项不存在,则会出现FTN表项不命中丢弃,其中Mask一定要准确,否则可能查不到驱动FTN表项,避免进入误区。注意查看ECMP标志位是否置位,E_Num值是否正确。查看Label值是否正确,两个出标签时,查看Sec_Lbl_V置位是否正确。
[Sysname-probe] display hardware internal l3 np fib 5.5.5.5 32 slot 7 chip 0
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0xcd4c> ECMPNum<0/2>!
ChipID is 0
ECMP_NUM:
E_Num = 2
FTN:
FTN KEY: VPNID = 0 IP_Prefix = 5.5.5.5/32
FTN RESULT:
00000811 000001ff 01020036 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 1 Th = 0 Normal = 0 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 0 EcmpNum = 2 ECMPID = 216
MainEcmpID = 54 SubEcmpID = 0
Es = 0 Ts = 0 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 0 Label = 0 Label_bak = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 0
VNI = 1
ECMP:
KEY: BASE_POINTER = 216
InlifID[0] = 261135, ChipNum = 1
InlifID[1] = 127575, ChipNum = 255(Global)
FTNECMP:
KEY: BASE_POINTER = 54, SUBID = 0, MODULEVALUE = 0
RESULT:
00000411 000000ff 00064bc6 00000000
ECMP = 0 Th = 0 Normal = 1 Drop = 0
OutlifId/ToHostId = 412614
Dft_User = 0 Dft_Sys = 0
Es = 0 Ts = 0 DhcpH = 0
Local = 0 M = 1 V = 1 TTL = 255
StackEnd = 0 Label_v = 0 Label = 0 Label_bak = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0 Sec_Lbl_V = 0
Outlif Table : KEY(outlifid = 412614) RESULT(00008211, 10032b07, 00000000, 00000000, 00000000, 00000000, 05e00000, 00164bc6)
RES:
un0.tunnel.uiBak:1 = 0
un0.tunnel.uiBcm:1 = 0
(3) 查找驱动维护的FTN表项(非等价的情况)
[Sysname-probe] display hardware internal l3 np fib 177.0.0.1 32 slot 2 chip 0
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0x43f6d> ECMPNum<0/1> MDC<2>!
ChipID is 0
FTN:
FTN KEY: VPNID = 0 MdcIdx = 1 IP_Prefix = 177.0.0.1/32
FTN RESULT:
00004451 0116e1ff 3101e330 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 0 Th = 0 Normal = 1 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 13190 OutlifID_ToHostID = 123696
Es = 0 Ts = 1 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 1 Label = 4462 Label_bak = 3
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 0
VNI = 49
Outlif Table : KEY(outlifid = 123696) RESULT(00180251, 10040d17, 00610080, 0000
00ff, 0000003f, 012f60ff, 0fa00000, fff03386)
RES:
un0.tunnel.uiBak:1 = 0
……
un0.tunnel.uiIpt:1 = 0
un0.tunnel.uiUdp:1 = 1
un0.tunnel.ui6to4:1 = 0
un0.tunnel.uiAuto:1 = 0
(4) 查看该芯片上的Outlif表项,是否存在。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 412614 slot 3 chip
0
=================== Hardware Table Info(HEX) =================
WORD0: 00000251
WORD1: 11073D1B
WORD2: 00000080
WORD3: 000000FF
WORD4: 0000003F
WORD5: 000000FF
WORD6: 05DC0000
WORD7: FFF03D8A
HW OUTLIF STRUCT INFO
{
{
Bak : 0
Bcm : 0
……
L3Port : 0
P2mp : 0
Drop : 0
Th : 0
Trunk : 0
Arp : 1
V4Tun : 0
V6Tun : 0
ApsTp : 0
Lspt : 1
Match : 1
V : 1
}tunnel
……
{
{
DvlanDlci : 4095
iOutlifId : 15754
}gen
{
DvlanDlci : 4095
OutlifId : 412614
}lspt
(5) 流量分担不均时,查看等价资源是否耗尽,检查逐流、逐包配置是否正确。
[Sysname-probe] display hardware internal l3 np ecmp-info ecmpstack slot 7
Pool ecmp info:
Available count: 16373
Resoure count: 16382
QueueHead: 61
QueueTail: 52
Pool point: c0000002dca3e910
Pool queue point c0000002dca60000
g_uiIPv4TcpDefendAclCount: 0
g_uiIPv6TcpDefendAclCount: 0
g_uiIPV4TCPDefendHandle: 4294967295
g_uiIPV6TCPDefendHandle: 4294967295
(6) 如果问题仍未解决,请搜集故障信息并联系技术支持人员。
公网LDP、TE等MPLS组网,MPLS入报文转发异常。
· 接口物理层down。
· 链路不稳定或光功率低。
· LSP隧道建立不成功。
· 设备软件故障。
· NP或平台转发故障。
(1) 在任意视图下执行display interface { interface-name | interface-type interface-number }查看接口状态,使接口处于UP状态。
(2) 在任意视图下执行display mpls ldp lsp [ ipv4-address mask-length ]查看LSP路径是否建立,如果路径未建立,请检查相关配置使LSP路径建立成功。
(3) 在任意视图下执行display mpls forwarding ilm [ label ] [ slot slot-number [ cpu cpu-number ] ]查看平台ILM表是否存在,如果存在,则参照步骤(4)处理,否则参照步骤(7)处理。
[Sysname] display mpls lsp 55.55.55.55 32
FEC Proto In/Out Label Interface/Out NHLFE
55.55.55.55/32 LDP 4130/4217 XGE10/4/11
55.55.55.55/32 LDP -/4217 XGE10/4/11
[Sysname] display mpls forwarding ilm 4130
Flags: T - Forwarded through a tunnel
N - Forwarded through the outgoing interface to the nexthop IP address
B - Backup forwarding information
A - Active forwarding information
M - P2MP forwarding information
InLabel Oper VRF Flag SwapLabel Forwarding Info
--------------------------------------------------------------------------------
4130 SWAP 0 NA 4217 XGE10/4/11 2.2.11.1
(4) 查找MPLS模块NP的ILM表项,如果NP的ILM表不存在,则执行步骤(7),如果NP的ILM表存在,如果表中Enum为1,根据表中OtlifId执行步骤(6),如果NP的ILM表存在,如果表中Enum大于1,根据表中Ecmplsp_Pointer执行步骤(5)。
[Sysname-probe] display hardware internal mpls hw-ilm inlabel 4130 slot 3 chip 0
=================== Hardware Table Info(HEX) =================
WORD0: 00000051
WORD1: 00000000
WORD2: 0001DA3D
WORD3: 010790FF
WORD4: 00000000
WORD5: 00000000
WORD6: 000FFFFF
WORD7: 00000000
HW ILM STRUCT INFO
{
……
Pop : 0
EcmpLsp : 0
Swap : 1
Php : 0
……
Reserve : 0
OutlifId : 121405
}gen_S
{
Reserve : 0
Enum : 1
Ecmplsp_Pointer: 55869
}ecmp_S
}WORD2
{
{
SwapLabel : 4217
Exp : 0
……
Fec : 0
}WORD7
(5) 在Probe视图下执行display hardware internal mpls hw-ecmp ecmpbase ecmppoint slot slot-number chip chip-id [ shadow ]查看芯片上对应的等价LSP硬件表项,如果硬件的等价LSP表不存在,则执行步骤(7),如果存在且正确,则根据等价LSP表中的OutlifId执行步骤(6)。
[Sysname-probe] display hardware internal mpls hw-ecmp ecmpbase 0 slot 5 chip 0
=================== Hardware Table Info(HEX) =================
WORD0: 00000051
WORD1: 00000000
WORD2: D8980000
WORD3: 00000001
HW ECMPLSP STRUCT INFO
{
SwapLabel : 0
Exp : 0
Zero : 0
Sec_Lbl_V : 0
Ilm_L : 1
L : 0
M : 1
Reserve2 : 0
V : 1
}WORD0
{
LifIdLo : 0
Bak_Label : 0
Exp : 0
Zero : 0
}WORD1
{
OutlifIdLo : 55448
Zero : 0
LifIdHi : 0
}WORD2
{
Bak_OutlifId : 0
OutlifIdHi : 1
}WORD3
=================== Hardware Table Info(HEX) =================
……
=================== No Hardware Table Info =================
(6) 查看该芯片上的Outlif表项,OutlifId如果为ARP OutlifId范围,则在Porbe视图下执行display hardware internal lif outlifi slot slot-number 122419,如果为LSPT OutlifId范围,则在Probe视图下执行display hardware internal mpls hw-outlif outlifid outlifid slot slot-number chip chip-id [ shadow ]
普通出接口时,直接封装公网标签做转发。聚合口时,此处是聚合口的OutLif表项。Gre隧道时,会封装Gre头和公网标签,再做二次转发。如果OutLIf表项不存在,则会不命中表项丢包。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 121405 slot 3 chip
0
=================== Hardware Table Info(HEX) =================
WORD0: 00000251
WORD1: 11073D1B
WORD2: 00000080
WORD3: 000000FF
WORD4: 0000003F
WORD5: 000000FF
WORD6: 05DC0000
WORD7: FFF03D8A
HW OUTLIF STRUCT INFO
{
{
Bak : 0
Bcm : 0
……
L3Port : 0
P2mp : 0
Drop : 0 ----drop非置位
Th : 0
Trunk : 0
Arp : 1
V4Tun : 0
V6Tun : 0
ApsTp : 0
Lspt : 1 ----表明出接口为lsp 隧道
Match : 1
V : 1
}tunnel
……
{
{
DvlanDlci : 4095
iOutlifId : 15754
}gen
{
DvlanDlci : 4095
OutlifId : 15754
}lspt
(7) 如果问题仍未解决,请搜集信息并联系技术支持人员定位。
正常l3vpn组网配置,IP入报文进MPLS公网出现转发异常。
· 接口物理层down、IP地址不正确。
· BGP、LDP等协议相关配置不正确。
· FTN表项不正确。
· Outlif 表项不正确。
· Ftnecmp表项不正确。
(1) 检查平台路由信息及标签信息,如果上述平台表项信息不存在,需检查基本组网配置并修改,使平台路由信息及标签信息正常。
(2) 查找Inlif表项,检查表项中的Vpn Id有效性,如果Vpn Id为0表示公网IP入,非0表示为私网Vpn Id;如果L3vpn标记未置位,会导致转发异常。
[Sysname -probe] display hardware internal lif np inlif slot 2 Ten-GigabitEthernet 2/4/3
.5
Inlif Table : KEY(vlan=5,port=206)
RESULT(80071011, 04200613, e0000200, 00000006, 00000102, 00680005
, 10000000, 00137085)
RES:
un0.gen.uiSa:1 = 1
un0.gen.uiV4m:1 = 0
……
un0.gen.uiL3:1 = 1
un0.gen.uiL3Vpn:1 = 1
un0.gen.uiPppoe:1 = 0
……
un3.gen.uiZero3:2 = 0
un3.gen.uiVpnId:16 = 6
un3.vll.uiZero1:1 = 0
un3.vll.ui8021P:3 = 0
(3) 查找驱动维护的FTN表项,如果该表项不存在,则会出现FTN表项不命中丢弃,其中Mask一定要准确,否则可能查不到驱动FTN表项,避免进入误区。
[Sysname-probe] display hardware internal l3 np fib 2 177.0.0.1 32 slot 2 chip 0
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0x43f6d> ECMPNum<0/1> MDC<2>!
ChipID is 0
FTN:
FTN KEY: VPNID = 2 MdcIdx = 1 IP_Prefix = 177.0.0.1/32
FTN RESULT:
00004451 0116e1ff 3101e330 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 0 Th = 0 Normal = 1 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 13190 OutlifID_ToHostID = 123696
Es = 0 Ts = 1 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 1 Label = 4462 Label_bak = 3
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 0
VNI = 49
Outlif Table : KEY(outlifid = 123696) RESULT(00180251, 10040d17, 00610080, 0000
00ff, 0000003f, 012f60ff, 0fa00000, fff03386)
RES:
un0.tunnel.uiBak:1 = 0
un0.tunnel.uiBcm:1 = 0
un0.tunnel.uiFwd:1 = 0
un0.tunnel.uiEs:1 = 0
un0.tunnel.uiTs:1 = 0
un0.tunnel.uiVxlan:1 = 0
un0.tunnel.uiMct:1 = 0
un0.tunnel.uiGre:1 = 0
un0.tunnel.uiIpt:1 = 0
un0.tunnel.uiUdp:1 = 1
un0.tunnel.ui6to4:1 = 0
un0.tunnel.uiAuto:1 = 0
(4) 查看该芯片上的Outlif表项,普通出接口时,直接封装公网标签做转发。聚合口时,此处是聚合口的OutLif表项。Gre隧道时,会封装Gre头和公网标签,再做二次转发。如果OutLIf表项不存在,则会不命中表项丢包。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 123696 slot 2 chip 0
=================== Hardware Table Info(HEX) =================
WORD0: 00180251
WORD1: 10040D17
WORD2: 00610080
WORD3: 000000FF
WORD4: 0000003F
WORD5: 012F60FF
WORD6: 0FA00000
WORD7: FFF03386
HW OUTLIF STRUCT INFO
(5) 查看平台FIB表项信息,获得vn handle相关信息,如果该表项不存在,则不会给驱动下发FTN表项,此时需检查配置,确认配置正确。
[Sysname-probe] display system internal fib prefix vpn-instance 1 177.0.0.1 32 slot 2
Destination: 0xb1000001 DstMask: 0xffffffff
VrfIndex: 0x2 SrcVrfIndex: 0
Attribute: 0 Count: 0x1
Epoch: 0 TimeStamp: 0x967
FFTimeStamp: 0x1a98
OrigingAs: 0x2be LastAs: 0x2be
VN Index: 0xc0000001fb216260 VN Context: 0xc0000001f169db80
** FIB Entry 1 **
ForwardType: 5
EntryFlags: 0x10300000 RouteStatus: 0x401a0000
InLabel: 0x116e BackupLabel: 0xffffffff
IpPrecedence: 0xffff QosLocalId: 0xffff
TrafficIndex: 0xffff
Context: 0x1e330 0x43f6d 0x8009c401 0xffff7889 0xffffffff 0xffffffff 0xffffffff
0xffffffff
(6) 在Probe视图下执行display system internal fib vn [ index index ] slot slot-number [ cpu cpu-number ]
找到NID,再执行如下命令获取OutLifId,如果此处获取的OutLifld与步骤(4)中获取的不一致,请直接联系技术支持人员处理。
[Sysname-probe] display system internal fib vn index c0000001fb216260 slot 2
** VN entry **
VNID: 0x1516000002 VNINDEX: 0xc0000001fb216260
NexthopNum: 1 CurNexthop: 0
Flags: 0x33 Epoch: 0
EntryTimeStamp: 0x1f99 FFTimeStamp: 0x89b
RefTime: 0x1fbf
DrvContext:
0x654c7 0x1ffff 0x4e2 0xfffffdf0
0xffffffff 0xa000000f 0xffffffff 0x1
0xffffffff 0xffffffff 0xffffffff 0xffffffff
0xffffffff 0xffffffff 0xffffffff 0xffffffff
** Nexthop 1 **
ADJEntry: 0xc0000001f56a5a00 Context: 0xc0000001f8eb8708
IfIdx: 0x1326 Weight: 1
Nexthop: 6.6.6.6 LclMaskLen: 0
LclAddr: Invalid NID: 0x10002260
[System-probe] display hardware internal mpls soft-nhlfe nhlfeid 268444256 slot 2
/============== SOFT NHLFE ENTRY ==============/
uiMdcID : 2
EcmpNum : 1
=== BEGIN : NHLFE[0] ===
IsTeNhlfe : 1(0:FALSE 1:TRUE)
IsActive : 1(0:FALSE 1:TRUE)
TeFlowId : 16383
NhlfeID : 268444256
Trunk Node Addr : 4294967295
TrunkId : 0
IsNeedStat : 1(0:FALSE 1:TRUE)
LspStatIndex : 3104
OutLifId[LSP ] : 123696
OutLifId[TP ] : 0
OutLifId[BFD ] : 0
(7) 如果问题仍未解决,请搜集故障信息并联系技术支持人员定位。
正常l3vpn组网配置,MPLS入报文、L3VPN终结转发异常。
· 接口物理层down、IP地址不正确。
· OSPF、LDP等协议相关配置不正确。
· ILM表项不正确。
· Outlif 表项不正确。
· Ecmplsp表项不正确。
(1) 查看接口up状态,查看有无错包和丢包统计,如有错包统计,请先排查是否是线缆问题或接口故障。
<Sysname> display interface brief
Interface Link Protocol Primary IP Description
GE7/1/1 DOWN DOWN --
GE7/1/2 UP UP --
(2) 查看公网接口信息表,正常MPLS标记会置位,如果MPLS标记位丢失,则报文转发不通,导致转发异常,出现该问题请参考转发故障处理。
(3) 查找硬件ILM表项,获取Vpn Id,并且L3vpn标记会置位,如果L3vpn标记未置位或ILM表项无效,则不命中ILM表项,造成数据包丢弃。
[Sysname-probe] display hardware internal mpls hw-ilm inlabel 4351 slot 2 chip 0
======== The table belong to mdc: 2 ==========
=================== Hardware Table Info(HEX) =================
WORD0: 00400111
WORD1: 00000000
WORD2: 00000000
WORD3: 00000000
WORD4: 00000000
WORD5: 00006148
WORD6: 00000000
WORD7: 00000000
HW ILM STRUCT INFO
{
Tag : 0
Net_CW : 0
MacLearnMode : 0
Sade : 0
Es : 0
Ts : 0
Oam : 0
Pwcar : 0
Ls : 1
Red : 0
P2mp : 0
Context : 0
6Vpe : 0
Th : 0
L3vpn : 0
Vll : 0
Vph : 0
(4) 查找驱动维护的FTN表项,此时是要进行MPLS终结,查IP的明细路由,掩码一般是32位,如果该表项不存在,则不命中FTN表项丢弃,导致转发不通,出现该问题请参考转发故障处理。
(5) 查看硬件OutLif表项,如果OutLif表项不存在,导致转发异常,出现该问题请参考转发故障处理。
(6) 如果问题仍未解决,请搜集故障信息并联系技术支持人员定位。
头节点配置TE GROUP组网,流量转发异常。
· 接口物理层down。
· 链路不稳定或光功率低。
· TE隧道建立不成功。
· 向TE隧道引流不成功。
· 设备软件故障。
· NP或平台转发故障。
(1) 查看TE隧道状态,如果TE隧道的Link、Protocol的状态均为UP,则执行步骤(2),如果TE隧道的Link、Protocol的状态存在DOWN,则确认TE隧道的配置是否正确,如果配置正确状态仍未DOWN,则执行步骤(7)。
<Sysname> display interface Tunnel brief
Brief information on interfaces in route mode:
Link: ADM - administratively down; Stby - standby
Protocol: (s) - spoofing
Interface Link Protocol Primary IP Description
Tun20 UP UP 11.11.1.2
Tun21 UP UP 11.11.2.2
Tun22 UP UP 11.11.3.2
(2) 查看路由是否正确建立,如果TE隧道的Link、Protocol的状态均为UP,则执行步骤(3),如果TE隧道的Link、Protocol的状态存在DOWN,则确认TE隧道的配置是否正确,如果配置正确状态仍未DOWN,则执行步骤(7)。
[Sysname] display ip routing-table 12.12.12.12 24
Summary count : 3
Destination/Mask Proto Pre Cost NextHop Interface
12.12.12.0/24 Static 1 0 0.0.0.0 Tun20
0.0.0.0 Tun22
Tun21
(3) 查看路由是否正确建立,如果fib表存在,且对应出接口为所配置的TE隧道的,则执行步骤(4),如果fib表不存在或有误,则执行步骤(7)。
<Sysname> display fib 12.12.12.12 24
Destination count: 1 FIB entry count: 3
Flag:
U:Usable G:Gateway H:Host B:Blackhole D:Dynamic S:Static
R:Relay F:FRR
Destination/Mask Nexthop Flag OutInterface/Token Label
12.12.12.0/24 0.0.0.0 USG 268435476 Null
12.12.12.0/24 0.0.0.0 USG 268435478 Null
12.12.12.0/24 0.0.0.0 USG 268435477 Null
(4) 在Probe视图下执行display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id查询NP硬件FTN表项,该表项中E_Num需为16,CBTS字段置位1,Drop不置位。如果某个ServiceClass的FTNECMP表中存在EcmpNum、uiEcmpBasePoint字段,则其存在二级等价表。如果不存在,则使其关联Outlif表,OutlifId对应OutlifId/ToHostId字段,如果表项中存在错误,则执行步骤(7)。如果表项中不存在错误,则根据不同ServiceClass查看二级等价表或者OutLif表。如果存在二级等价表,则根据uiEcmpBasePoint执行步骤(5),否则根据OutlifId/ToHostId执行步骤(6)。
[Sysname-probe] display hardware internal l3 np fib 12.12.12.12 24 slot 2 chip 0
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0x1880d9> ECMPNum<0/3> MDC<2>!
ChipID is 0
ECMP_NUM:
E_Num = 16
FTN:
FTN KEY: VPNID = 0 MdcIdx = 1 IP_Prefix = 12.12.12.12/24
FTN RESULT:
00000851 000031ff 31000002 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 1 Th = 0 Normal = 0 Drop = 0
Dft_Sys = 0 Dft_User = 0
……
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 1
VNI = 49
First FTN_ECMP info : ServiceClass = 0
FTNECMP:
KEY: BASE_POINTER = 2, SUBID = 0, MODULEVALUE = 0
RESULT:
00000c11 000000ff 00020003 00000000
ECMP = 1 Th = 0 Normal = 1 Drop = 0
EcmpNum = 2, uiEcmpBasePoint = 3
Dft_User = 0 Dft_Sys = 0
……
First FTN_ECMP info : ServiceClass = 1
FTNECMP:
KEY: BASE_POINTER = 2, SUBID = 0, MODULEVALUE = 1
RESULT:
00000411 000000ff 0001de33 00000000
ECMP = 0 Th = 0 Normal = 1 Drop = 0
OutlifId/ToHostId = 122419
Dft_User = 0 Dft_Sys = 0
Es = 0 Ts = 0 DhcpH = 0
(5) 在Probe视图下执行display np table 59 entry key 000300 slot slot-number查看对应的二级等价表,如果表项中存在,则根据二级等价表的OutlifId执行步骤(6)查询Outlif表,如果表项中不存在,则执行步骤(7)。
[Sysname-probe] display np table 59 entry key 000300 slot 2
LittleEndian Key : 00030000
LittleEndian Res : 11040000 FF000000 31DE0100 00000000 00000000 00000000 00000
000 00000000
BigEndian Key : 00000300
BigEndian Res : 00000411 000000FF 0001DE31 00000000 00000000 00000000 00000
000 00000000
Mcode Key : Byte3 Byte2 Byte1 Byte0
DW0 : 00 00 03 00
Mcode Res : Byte3 Byte2 Byte1 Byte0
DW0 : 00 00 04 11
DW1 : 00 00 00 FF
DW2 : 00 01 DE 31
DW3 : 00 00 00 00
DW4 : 00 00 00 00
DW5 : 00 00 00 00
DW6 : 00 00 00 00
DW7 : 00 00 00 00
(6) 在Probe视图下执行display hardware internal lif outlifi slot slot-number 122419查看NP硬件Outlif表。OutlifId如果为ARP OutlifId范围用前者命令,如果为LSPT OutlifId范围用后者。当为普通出接口时,直接封装公网标签做转发,聚合口时,此处是聚合口的OutLif表项。Gre隧道时,会封装Gre头和公网标签,再做二次转发。如果OutLIf表项不存在,则会不命中表项丢包。
[Sysname-probe] display hardware internal lif outlif slot 2 122419
Outlif Table : KEY(outlifid = 122419) RESULT(00100251, 10030d1a, 00000080, 0000
00ff, 0000003f, 000000ff, 25800000, fff03389)
RES:
un0.tunnel.uiBak:1 = 0
un0.tunnel.uiBcm:1 = 0
……
un0.tunnel.uiL3Port:1 = 0
un0.tunnel.uiP2mp:1 = 0
un0.tunnel.uiDrop:1 = 0
un0.tunnel.uiTh:1 = 0
……
un0.tunnel.uiV6Tun:1 = 0
un0.tunnel.uiLspt:1 = 1
un0.tunnel.uiLocal:1 = 0
un0.tunnel.uiMatch:1 = 1
(7) 如果问题仍未解决,请搜集故障信息并联系技术支持人员定位。
正常Segment Routing TE组网配置,IP入报文进MPLS公网转发异常。
· 接口物理层down、IP地址不正确。
· Ospf、isis、LDP等协议配置不正确。
· MPLS TE配置不正确、隧道不UP。
· FTN表项不正确。
· Outlif表项不正确。
· Ftnecmp表项不正确。
(1) 检查平台路由信息及标签信息,如果上述平台表项信息不存在,需检查基本组网配置并修改,使平台路由信息及标签信息正常。
(2) 查找驱动维护的FTN表项(非等价情况),如果该表项不存在,则会出现FTN表项不命中丢弃,其中Mask一定要准确,否则可能查不到驱动FTN表项,避免进入误区。
[Sysname-probe] display hardware internal l3 np fib 100.0.0.0 32 slot 7 chip 1
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0xdafe> ECMPNum<0/1>!
ChipID is 1
FTN:
FTN KEY: VPNID = 0 IP_Prefix = 100.0.0.0/32
FTN RESULT:
00000451 000031ff 3101da1b 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 0 Th = 0 Normal = 1 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 127575 OutlifID_ToHostID = 121371
Es = 0 Ts = 0 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 1 Label = 3 Label_bak = 3
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 0
VNI = 49
Outlif Table : KEY(outlifid = 121371) RESULT(10000251, 10042b07, 00000000, 000000ff, 0000003f, 03fac0ff, 05dc0001, 0010fc0f)
RES:
un0.tunnel.uiBak:1 = 0
如果该表项不存在,则会出现FTN表项不命中丢弃,注意Mask一定要准确,否则可能查不到驱动FTN表项,避免进入误区。
(3) 查找驱动维护的FTN表项(等价情况),如果该表项不存在,则会出现FTN表项不命中丢弃,其中Mask一定要准确,否则可能查不到驱动FTN表项,避免进入误区。注意查看等价标志位是否置位,E_Num值是否正确。查看Label值是否正确,两个出标签时,查看Sec_Lbl_V置位是否正确。
[Sysname-probe] display hardware internal l3 np fib 5.5.5.5 32 slot 7 chip 0
The ECMP Mode is g_uiEcmpModeFlag <0>
The FTN/FIB table Handle<0xcd4c> ECMPNum<0/2>!
ChipID is 0
ECMP_NUM:
E_Num = 2
FTN:
FTN KEY: VPNID = 0 IP_Prefix = 5.5.5.5/32
FTN RESULT:
00000811 000001ff 01020036 00000000
Ipv4-route tag:
Valid = 1 M = 1 Local = 0
ECMP = 1 Th = 0 Normal = 0 Drop = 0
Dft_Sys = 0 Dft_User = 0
LifId = 0 EcmpNum = 2 ECMPID = 216
MainEcmpID = 54 SubEcmpID = 0
Es = 0 Ts = 0 DhcpH = 0
TTL = 255 StackEnd1 = 1 StackEnd2 = 1
Label_v = 0 Label = 0 Label_bak = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Mask = 0 BgpIdx = 0
OrgAs = 0 PeerAs = 0
CBTS = 0
VNI = 1
ECMP:
KEY: BASE_POINTER = 216
InlifID[0] = 261135, ChipNum = 1
InlifID[1] = 127575, ChipNum = 255(Global)
FTNECMP:
KEY: BASE_POINTER = 54, SUBID = 0, MODULEVALUE = 0
RESULT:
00000411 000000ff 00064bc6 00000000
ECMP = 0 Th = 0 Normal = 1 Drop = 0
OutlifId/ToHostId = 412614
Dft_User = 0 Dft_Sys = 0
Es = 0 Ts = 0 DhcpH = 0
Local = 0 M = 1 V = 1 TTL = 255
StackEnd = 0 Label_v = 0 Label = 0 Label_bak = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0
Rd = 0 Rq = 0 Dscp = 0 QosLocalId = 0 Sec_Lbl_V = 0
Outlif Table : KEY(outlifid = 412614) RESULT(00008211, 10032b07, 00000000, 00000000, 00000000, 00000000, 05e00000, 00164bc6)
RES:
un0.tunnel.uiBak:1 = 0
un0.tunnel.uiBcm:1 = 0
(4) 查看该芯片上的Outlif表项(以非等价为例),获取Label_Index信息。
[Sysname-probe] display hardware internal mpls hw-outlif outlifid 121371 slot 7 chip
1
=================== Hardware Table Info(HEX) =================
WORD0: 10000A51
WORD1: 10030038
WORD2: 00000000
WORD3: 000000FF
WORD4: 0000003F
WORD5: 03FAC0FF
WORD6: 05DC0001
WORD7: FFF0F257
HW OUTLIF STRUCT INFO
{
{
Bak : 0
Bcm : 0
Fwd : 0
……
{
OuterLabel : 0
Exp : 0
StackEnd : 0
FlowIdOffset_L : 255
}lspt
……
{
MidLabel : 0
Exp : 0
StackEnd : 0
FlowIdOffset_H 63
}lspt
……
{
InnerLabel : 16300
Exp : 0
StackEnd : 0
Ttl : 255
}lspt
……
{
Mtu : 1500
Label_Index : 1
}srte
}un6
(5) 通过outlif表中的Label_Index查看该芯片上的Label表项是否正常下发。
[Sysname-probe]display hardware internal mpls hw-label labelindex 1 slot 7 chip 1
=================== Hardware Table Info(HEX) =================
WORD0: 00000111
WORD1: 00000000
WORD2: 00000000
WORD3: 00000000
WORD4: 00000000
WORD5: 00000000
WORD6: 00000000
WORD7: 00000000
HW LABEL STRUCT INFO
{
{
ui4th_Label_L : 0
UiExp : 0
uiS : 0
Reserve1 : 0
uiLabel_Layer : 1
Reserve2 : 0
uiMatch : 1
Reserve3 : 0
Valid : 1
}gen
}un0
{
{
ui5th_Label : 0
uiExp : 0
uiS : 0
ui4th_Label_H : 0
}gen
}un1
……
{
{
ui13th_Label : 0
uiExp : 0
uiS : 0
ui12th_Label_H: 0
}gen
}un7
(6) 如果问题仍未解决,请搜集信息并联系技术支持人员。
命令 |
说明 |
display interface brief |
显示接口UP/DOWN状态(任意视图) |
display interface |
显示接口输入输出报文统计(任意视图) |
display mpls ldp lsp [ ipv4-address mask-length ] |
显示LDP协议生成的LSP信息,即LDP LSP信息(任意视图) |
display fib vpn-instance vpn-instance-name |
显示指定VPN实例的FIB信息(任意视图) |
display bgp routing-table vpnv4 inlabel |
显示BGP IPv4单播路由的入标签信息(任意视图) |
display ip vpn-instance [ instance-name vpn-instance-name ] |
显示VPN实例的信息(任意视图) |
display ip routing-table vpn-instance vpn-instance-name |
显示与VPN实例相关联的IP路由表(任意视图) |
display hardware internal lif np inlif slot slot-number chip chip-id vlan vlanid port phyport |
显示驱动inlif表项信息(Probe视图) |
display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id |
显示路由及其对应的下一跳下发到硬件的信息(Probe视图) |
display hardware internal mpls soft-nhlfe nhlfeid nhlfeid slot slot-number |
显示nhlfe软件表项信息(Probe视图) |
display hardware internal mpls hw-outlif outlifid outlifid slot slot-number chip chip-id [ shadow ] |
显示硬件outlif表项信息(Probe视图) |
display hardware internal mpls hw-ilm inlabel label slot slot-number chip chip-id [ shadow ] |
显示硬件ilm表项信息(Probe视图) |
display system internal fib prefix [ vpn-instance vpn-instance-name ] slot slot-number [ cpu cpu-number ] |
显示平台fib路由信息(Probe视图) |
display system internal fib vn [ id id | index index ] slot slot-number [ cpu cpu-number ] |
显示平台vn和下一跳信息(Probe视图) |
display l2vpn xconnect-group [ name group-name ] [ verbose ] |
显示交叉连接组的信息(任意视图) |
display l2vpn forwarding { ac | pw } [ xconnect-group group-name ] [ slot slot-number [ cpu cpu-number ] ] [ verbose ] |
显示交叉连接的转发信息(任意视图) |
display l2vpn vsi [ name vsi-name ] [ verbose ] |
显示VSI信息(任意视图) |
display hardware internal mpls vpls vsiinfo vsi vsiindex slot slot-number [ tunnel-list from from-num to to-num ] |
显示vsi软件表项(Probe视图) |
display hardware internal mpls vpls linkinfo vsi vsiindex linkid linkid slot slot-number |
显示AC和PW侧软件表项(Probe视图) |
display hardware internal mc mll mid mid-id slot slot-number chip chip-id [ hardware ] |
显示出接口MLL表项信息(Probe视图) |
display hardware internal mpls soft-nhlfe nhlfeid nhlfeid slot slot-number |
查看软件Nhlfe表项(Probe视图) |
display hardware internal mpls vpws ac-info slot slot-number { interface interface-type interface-number | vlan vlanid interface interface-type interface-number } |
显示vll软件ac表项(Probe视图) |
display hardware internal mpls vpws soft-info inlabel inlabel slot slot-number |
显示vll关联的pw和ac软件表项(Probe视图) |
display hardware internal mpls hw-vp vpindex slot slot-number chip chip-id [ shadow ] |
显示vp硬件表项(Probe视图) |
对接口配置MQC业务后,MQC动作不生效,统计不增长或统计正常但其他动作未生效。
· 接口物理层down。
· 配置下发失败。
· 配置不正确。
· 高优先级业务的干扰。
· 软件故障。
· NP转发故障。
(1) 在任意视图下执行display interface [ interface-type interface-number ]命令查看接口状态:
¡ 如果显示为up,则执行步骤(2)。
(2) 在任意视图下执行display qos policy interface [ interface-type interface-number ] [ slot slot-number [ cpu cpu-number ] ] [ inbound | outbound ]来确认MQC业务是否已正确下发到硬件;MQC是按CB对下发的,下发失败的CB对后会有“Failed”的提示:
¡ 如果CB对下发失败,请检查本设备是否支持相应的MQC配置。
¡ 如果CB对下发成功,则执行步骤(3)。
(3) 检查配置的匹配规则是否能匹配到相应的报文,
¡ 如果确认能匹配到,则执行步骤(4)。
¡ 如果无法确认匹配到相应报文,请参考步骤(7)搜集故障信息并联系技术支持人员。
(4) 在任意视图下执行display current-configuration查看本接口或全局是否有配置其它优先级更高的ACL业务如FlowSpec、包过滤、PBR和MQC等:
¡ 如有,请通过配置排除这些业务对故障的干扰。
¡ 如没有,则执行步骤(5)。
(5) 根据MQC所配置的方向,选择如下命令查看V4Acl/V6Acl标记是否置位:
· 入方向:在Probe试图下执行display hardware internal lif np inlif slot slot-number interface interface-type interface-number
· 出方向:在Probe试图下执行display hardware internal lif opct slot slot-number interface interface-type interface-number
[System-probe] display hardware internal lif opct slot 1 Ten-GigabitEthernet 1/2/1 | include V4Acl
un0.gen.uiV4Acl:1 = 1
¡ 如果V4Acl/V6Acl标记置位,则执行步骤(6)。
¡ 如果V4Acl/V6Acl标记没有置位,则参考步骤(7)搜集故障信息并联系技术支持人员。
(6) 如果配置primap动作后,报文优先级映射不正确:
¡ 请检查MQC中是否包含remark配置,remark的优先级会高于primap,因此首先排除remark动作的影响。
¡ 在任意视图下执行display qos map-table color green/yellow/red inbound/outbound pri-table查看对应的软件优先级映射表,查看优先级映射表中的映射值是否与预期的一致。
(7) 如果问题仍无法解决,请参考如下命令搜集故障信息并联系技术支持人员分析。
· 用户视图下:
¡ diagnostic start test mqc-test slot-number subslot-number port-number [ act ](命令用来诊断搜集接口MQC表项信息)
· Probe视图下:
¡ display hardware internal qacl stat-collector slot slot-number chip chip-number
在配置侧配置FlowSpec后接收侧收到的报文未按配置的动作做限速、deny、重定向、remark-ipp等动作。
· BGP flowspec邻居未建立。
· flow-route下发失败。
· flow-route配置不正确。
· 软件故障。
(1) 在任意视图下执行display bgp peer { ipv4| vpnv4 } flowspec查看flowspec的bgp邻居是否已经建立起来:
¡ 如果邻居未建立,请先确保bgp flowspec邻居能正常建立。
¡ 如果邻居已建立,则执行步骤(2)。
(2) 在任意视图下执行display bgp routing-table ipv4 flowspec查看是否接收到了配置侧发来的flow-route:
¡ 如果未收到flow-route,请排查控制侧flowspec配置是否正确。
¡ 如果正确收到flow-route,请执行步骤(3)。
(3) 在任意视图下执行display flow-route all查看flow-route是否下发成功:
¡ 如果下发失败,请确认本设备是否支持该flow-route配置。
¡ 如果下发成功,则执行步骤(4)。
(4) 检查flow-route的匹配规则是否能匹配到相应的报文,如果确认能匹配到,则参考步骤(5)搜集故障信息并联系技术支持人员。
(5) 如果问题仍无法解决,请参考如下命令搜集信息并联系技术支持人员:
· 用户视图下:
¡ diagnostic start test flowspec-test slot-number subslot-number port-number [ act ](命令用来诊断搜集接口Flowspec表项信息)_
对接口应用PBR策略后,报文没有按照PBR策略节点的动作执行。
· 接口物理层down。
· 链路不稳定或光功率低。
· 直连接口的IP地址不在同一网段。
· ACL资源不足。
· 设备软件故障。
· NP或平台转发故障。
(1) 在任意视图下执行命令display interface brief查看设备接口状态,通过命令display interface interface-type interface-number确定指定接口应用PBR策略的接口和重定向动作对应的本设备接口的配置情况,确定IP地址配置无误。
(2) 如果IP地址配置正确,在任意视图下执行命令display counters inbound interface查看接口收发包统计是否正常,有无错包和丢包统计等。如果有错包统计,可以先排查是否是线缆问题或接口故障。
(3) 在任意视图下执行命令display ip policy-based-route [ policy policy-name ]查看该策略的详细配置,查看是否存在比该测试节点更小编号的有效节点存在。多策略节点的情况下,节点号较小的有效节点优先级较高,一旦匹配编号较小的节点后面的节点不再匹配。
[System] display ip policy-based-route policy route_policy_name
Route-policy : route_policy_name
node 10 permit: if-match acl 3000
if-match qos-loacl-id
apply ip-address next-hop 1.1.1.1
node 20 permit: if-match acl 3100
node 30 permit:
apply loadshare next-hop
apply ip-address next-hop 1.1.1.1 direct
apply ip-address next-hop 2.2.2.2 direct
apply output-interface tunnel1
node 40 deny:
node 50 deny: if-match acl 3000
apply apply precedence priority
apply ip-address next-hop 1.1.1.1
(4) 执行命令display ip policy-based-route interface interface-type interface-number查看策略的应用状态以及报文匹配情况,如果策略节点的状态为failed/no resource,在用户视图下执行命令display qos-acl resource [ slot slot-number ]查看acl资源使用情况;
[System] display ip policy-based-route interface HundredGigE 1/0/5
Policy based routing information for interface HundredGigE1/0/5:
Policy name: g1
node 1 permit:
apply next-hop 38.3.3.8
Matched: 0
Total matched: 0
[System] display qos-acl resource slot 1
Interfaces: HGE1/0/2 (slot 1)
---------------------------------------------------------------------
Type Total Reserved Configured Remaining Usage
---------------------------------------------------------------------
IPv4Acl 122880 0 0 122880 0%
IPv6Acl 32768 0 0 32768 0%
(5) 如果状态没有显示异常但无匹配统计,查看TC的报文类型是否与PBR匹配规则相匹配,通过命令 policy-based-route policy-name [ deny | permit ] node node-number进入策略节点视图,然后通过display acl acl-number查看PBR的匹配规则配置。
(6) 如果问题仍无法解决,请参考如下命令搜集信息并联系技术支持人员。
· 任意试图下:
¡ display ip policy-based-route [ policy policy-name ](命令用来显示已经配置的策略)
¡ display ip policy-based-route interface interface-type interface-number [ slot slot-number [ cpu cpu-number ] ](命令用来显示接口下转发策略路由的配置信息和统计信息)
¡ display qos-acl resource [ slot slot-number ](命令用来显示QoS和ACL资源的使用情况)
· Probe视图下:
¡ display hardware internal qacl acl-brief acl-application-type global slot slot-number { inbound | outbound }(命令用来显示ACL软件表项结构信息)
¡ display hardware internal qacl acl-entry acl-application-type global slot slot-number { inbound | outbound } [ from start-number ](命令用来显示ACL表项信息)
¡ display hardware internal tcam item handle handle-number table table-type { all | hard | soft } slot slot-number chip chip-id(命令用来查询TCAM中指定hanle表项信息)
启用OFP后,流量未按照Controller下发的流表项转发。
· 接口物理层down。
· OpenFlow实例未激活。
· 流表未下发成功。
· Acl资源不足。
· 设备软件故障。
· NP或平台转发故障。
(1) 在任意视图下执行命令display interface brief查看设备接口状态,通过命令display interface interface-type interface-number确定应用PBR策略的接口和重定向动作对应的本设备接口的配置情况,确定IP地址配置无误。
(2) 在任意视图下执行命令display counters inbound interface查看接口收发包统计是否正常,有无错包和丢包统计等。如果有错包统计,可以先排查是否是线缆问题或接口故障。
(3) 在任意视图下执行命令display openflow instance [ instance-id ],查看OpenFlow实例配置,确定基本配置完整,正常连接Controller,且实例已激活。
[System-of-inst-1] display this
#
openflow instance 1
default table-miss permit
classification global
controller 0 address ip 172.31.151.128
active instance
#
return
[System]display openflow instance 1
Instance 1 information:
Configuration information:
Description : --
Active status : Active
Inactive configuration:
None
Active configuration:
Classification: Global(Standard)
In-band management VLAN, total VLANs(0)
Empty VLAN
Connect mode: Multiple
MAC address learning: Enabled
TCP DSCP value: 10
Flow table:
Table ID(type): 0(Extensibility), count: 0
Flow-entry max-limit: 65535
Datapath ID: 0x0001000f32f7c480
Default table-miss: Permit
Forbidden port: None
Qinq Network: Disabled
TCP connection backup: Enabled
Port information:
HundredGigE1/0/2
HundredGigE1/0/3
HundredGigE1/0/5
HundredGigE1/0/6
Active channel information:
Controller 0 IP address: 172.31.151.126 port: 6633
(4) 通过命令display qos-acl resource [ slot slot-number ]查看acl资源使用情况;
[System] display qos-acl resource slot 1
Interfaces: HGE1/0/2 (slot 1)
---------------------------------------------------------------------
Type Total Reserved Configured Remaining Usage
---------------------------------------------------------------------
IPv4Acl 122880 0 0 122880 0%
IPv6Acl 32768 0 0 32768 0%
(5) 排查acl资源不足情况,通过命令display openflow instance [ instance-id ] 查看流表配置,确定指定流表项的匹配规则、动作以及匹配统计情况,包括table-miss表项的动作,如果指定流表项不存在,流表可能下发失败。
[System] display openflow instance 1 flow-table
Instance 1 flow table information:
Table 0 information:
Table type: Extensibility, flow entry count: 1, total flow entry count: 1
Flow entry 1 information:
cookie: 0x0, priority: 2, hard time: 0, idle time: 0, flags: none,
byte count: --, packet count: 0
Match information:
Input interface: HGE1/0/3
Instruction information:
Write actions:
Output interface: HGE1/0/5
(6) 如果普通表项的匹配统计为0,查看TC的报文类型与该流表项匹配规则是否相匹配,如果规则不匹配,看table-miss表项的匹配统计情况以及动作是否为drop,如果匹配统计正常且动作为drop,出接口无流量为普通流表项匹配规则设置有误。
[System] display openflow instance 1 flow-table
Instance 1 flow table information:
Table 0 information:
Table type: Extensibility, flow entry count: 2, total flow entry count: 2
MissRule flow entry information:
cookie: 0x0, priority: 0, hard time: 0, idle time: 0, flags: none,
byte count: --, packet count: 80617
Match information: any
Instruction information:
Write actions:
Drop
Flow entry 1 information:
cookie: 0x0, priority: 2, hard time: 0, idle time: 0, flags: none,
byte count: --, packet count: 0
Match information:
Input interface: HGE1/0/3
Instruction information:
Write actions:
Output interface: HGE1/0/5
(7) 如果仍无法解决问题,请参考如下命令搜集信息并联系技术支持人员:
· 任意视图下:
¡ display openflow instance [ instance-id ](命令用来显示OpenFlow实例的详细信息)
¡ display qos-acl resource [ slot slot-number ](命令用来显示QoS和ACL资源的使用情况)
· Probe视图下:
¡ display hardware internal qacl acl-brief acl-application-type global slot slot-number { inbound | outbound }(命令用来显示ACL软件表项结构信息)
¡ display hardware internal qacl acl-entry acl-application-type global slot slot-number { inbound | outbound } [ from start-number ](命令用来显示ACL表项信息)
¡ display hardware internal tcam item handle handle-number table table-type { all | hard | soft } slot slot-number chip chip-id(命令用来查询TCAM中指定hanle表项信息)
配置接口镜像后,镜像出接口无流量或流量与预期不符。
· 接口物理层down。
· 实际流量和源接口配置不符。
· 表项未下发成功。
· 交换网带宽不够导致镜像流量被丢弃。
· 设备软件故障。
(1) 执行display mirroring-group all查看接口镜像配置信息,查看status是否Active;如果status是Incomplete,说明配置不完整。
[System] display mirroring-group all
Mirroring group 1:
Type: Local
Status: Active
Sampler: s
Mirroring port:
HundredGigE5/0/3 Both
Monitor port: HundredGigE5/0/4
(2) 通过display interface interface-type interface-number命令检查镜像源接口状态是否UP,接口收发包统计是否正常,有无错包和丢包统计等。如果有错包统计,可以先排除是否线缆问题或接口故障。
(3) 通过display interface interface-type interface-number命令搜集镜像目的接口信息,查看接口状态是否UP;
(4) 如配置入方向镜像,执行disaply counters rate inbound interface,确认镜像源接口入方向是否有流量;
(5) 如配置出方向镜像,执行disaply counters rate outbound interface,确认镜像源接口出方向是否有流量;
(6) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· 用户视图下:
¡ diagnostic start test colinfo-forward [ slot [ type ] ] [ act ](命令用来搜集转发信息)
¡ diagnostic start test mirror-test slot-number subslot-number port-number [ act ](命令用来诊断搜集接口镜像表项信息)
对接口应用了MQC流镜像策略,流镜像不生效。
(1) 检查MQC策略是否应用成功、ACL表项是否下发成功。
(2) 检查MQC的ACL表项结果的Mirror标记是否置位。
(3) 在Probe视图下执行命令display np table 109 entry start 0 slot slot-number [ chip chip-id ]查看NP表单描述信息是否有误;
(4) 如果问题仍无法解决,请联系技术支持人员。
TM是NP芯片的一个重要功能模块,以NP为转发引擎的线卡板,各重要转发路径上都有TM参与报文的缓存和调度,接口出方向的队列缓存是TM最重要的应用。除了接口队列缓存外,报文上送CPU,入方向配置LR或qmprofile,报文分片处理时也要经过TM的处理。
在任意视图下执行display hardware np qacl tm-statcnt slot slot-number [ chip chip-id ] [ reset ]时可能发现有丢包统计。
<System-Probe> display hardware np qacl tm-statcnt slot 1 chip 0
Chip 0 ------------------------------------------------
TM0 global statistic:
commit transmit: 1536
excess transmit: 0
WRED drop: 0
timeout drop: 0
Chip 0 ------------------------------------------------
TM1 global statistic:
commit transmit: 23007
excess transmit: 0
WRED drop: 371
timeout drop: 0
当wred drop不为0时表明某通道有超过了设置的缓存能力的突发流量而引起的丢包。特别的,timeout drop丢包不为0时,表明接口发生过UP/DOWN,接口UP/DOWN的过程中会对TM中存储的残余报文进行flush清除,被flush清除的报文统计在TM的timeout drop统计项上。
· 接口转发流量超出了接口的能力。
· 配置了QOS相关业务对流量进行了限速。
· 接口出现了故障无法发包。
· 设备上进入了未知单播流量。
· 有目的IP是设备IP地址的流量。
· 到CPU处理的流量大小超过了CPU的能力。
· 设备受到了攻击。
(1) 在任意视图下执行display hardware np qacl tm-statcnt slot slot-number [ chip chip-id ] [ reset ]确认丢包发生的TM:
¡ 如果TM0有丢包,请执行步骤(6)。
¡ 如果TM1有丢包,请执行步骤(2)。
(2) 执行display current-configuration interface interface-type interface-number,查看当前接口的配置:
¡ 如果接口上配置了入方向的LR或qmprofile,请查看进入流量的大小是否超过了限速配置。
¡ 如果接口上配置了netstream,包括MQC模式的netstream和接口下直接配置的netstream,请查看netstream配置的采样率和当前进入接口的流量速率,根据“采样出的流量速率=采样率*接口进入的流量速率”计算采样出的流量速率,由于CPU的处理速率限制,如果最终速率超过了500M,请考虑适当降低采样率或分流接口进入的流量。
¡ 如果没有上述配置,请执行步骤(3)。
(3) 执行display qos policy control-plane slot slot-number [ cpu cpu-number ] 查看是否有COPP配置:
¡ 如果有COPP配置,请查看进入的流量速率是否超过了COPP的限速值,如果超过了限速值,请确认是否正常情况,是否受到了攻击或者是否需要放大限速值。
¡ 如果没有COPP配置,请执行步骤(4)。
(4) 执行display qos car control-plane whitelist [ ipv6 ] slot slot-number [ cpu cpu-number ]查看是否有白名单配置:
¡ 如果有白名单配置,请根据需求判断是否需要放大限速值。
¡ 如果没有白名单配置,请执行步骤(5)。
(5) 请参考5 协议转发故障处理,排查是否有协议上送CPU的速率过快,确认设备是否受到了攻击等。
(6) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· Probe视图下:
¡ display hardware internal qacl tm-statistics slot slot-number chip chip-id start start-id end end-id { tm0 | tm1 } [ reset ](命令用来查询指定TM范围队列的统计计数信息)
接口上配置qos lr/gts/qmprofile后,队列的限速配置没有生效。
· 流量没有进入配置限速的接口。
· 流量没有进入配置限速的队列。
(1) 首先排查流量是否正确走了配置限速的接口,比如一个物理口下有多个子接口,可以通过使能统计等手段确认流量是否是在配置了限速的子接口上转发:
¡ 如果流量没有走限速的接口,请修改配置使限速配置在流量的通道上。
¡ 如果流量进入了正确的接口,执行步骤(2)。
(2) 在任意视图下执行display qos queue-statistics interface interface-type interface-number outbound命令查看接口队列发包情况:
¡ 如果流量没有走正确的队列,请配置primap或remak等对流量的优先级进行映射,local-precedence可以决定报文进入的队列;
¡ 如果流量进入了正确的队列,执行步骤(3)。
(3) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· 用户视图下:
¡ diagnostic start test wred-test direction slot-number subslot-number port-number [ sub-port-number ] [ act ](命令用来诊断、搜集接口上LR和队列Gts的配置信息)
接口配置基于QPPB的PBR策略/MQC策略 ,报文没有匹配,即通过在任意视图下执行命令display qos policy interface [ interface-type interface-number ] inbound和命令display ip policy-based-route interface interface-type interface-name匹配为0,或者匹配后动作不生效。
· 接口物理层down。
· 接口IP 地址配置错误。
· Bgp邻居没有建立。
· 接收端相关路由(ip优先级与qos local id)没有生效。
· 策略没有应用在接口的入方向。
· 策略中模式不是qppb模式。
· 软件或微码转发故障。
(1) 首先通过执行命令display interface brief查看设备接口状态:
¡ 如果显示为down,请参考4.2章节处理。
¡ 如果现实为up,则执行步骤(2)。
(2) 其次通过命令display interface interface-type interface-name确定应用PBR策略/MQC策略的接口和重定向动作对应的本设备接口的配置情况,确定ip地址:
¡ 如果ip地址配置错误,请按照配置情况修改ip地址。
¡ 如果ip地址正确,则执行步骤(3)。
(3) 通过display bgp peer查看bgp邻居是否建立起来:
¡ qppb为通过bgp传播qos 策略,请确认所有设备均需运行bgp协议。
¡ 如果bgp 建立状态为Established,则执行步骤(4)。
(4) 通过执行display ip routing-table查看接收端相关路由:
¡ 如果ip优先级与qos local id不是路由策略配置值,则执行步骤(7)。
¡ 如果ip优先级与qos local id为路由策略配置值,则执行步骤(5)。
[System-GigabitEthernet1/3/4] display bgp routing-table ipv4 1.0.0.0
BGP local router ID: 172.31.152.111
Local AS number: 100
Paths: 1 available, 1 best
BGP routing table information of 1.0.0.0/32:
From : 10.1.1.2 (192.0.0.21)
Rely nexthop : 10.1.1.2
Original nexthop: 10.1.1.2
OutLabel : NULL
AS-path : 200
Origin : igp
Attribute value : pref-val 0
State : valid, external, best
IP precedence : N/A
QoS local ID : 3
Traffic index : N/A
(5) 在任意视图下执行display qos policy interface interface-type interface-number和display ip policy-based-route interface interface-type interface-number查看mqc策略与pbr策略确保应用在接口的入方向:
¡ 如果qppb 模式没有配置在接口的入方向,请配置在接口入方向。
¡ 如果在接口入方向配置,则执行步骤(6)。
(6) 通过display qos policy interface interface-type interface-number inbound 和display ip policy-based-route interface interface-type interface-number单看接口下的MQC和PBR配置:
¡ 请确认mqc mode是qppb-manipulation,无Failed提示;pbr匹配规则中有if match qos local id字段。
¡ 如没有则参考步骤(7)搜集故障信息并联系技术支持人员。
(7) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· Probe视图下:
¡ display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number }(命令显示接口的物理信息)
¡ display np table 9 entry key keyvalue [ mask maskvalue ] chassis chassis-number slot slot-number [ chip chip-id ] [ dword ](命令用来显示NP表单描述信息)
¡ display hardware internal l3 np fib [ vrid-number ] { ipv4-addr mask-length | ipv6-addr mask-length } slot slot-number chip chip-id(命令用来显示路由及其对应的下一跳下发到硬件的信息)
¡ display hardware internal tcam item handle handle-number table table-type { all | hard | soft } slot slot-number chip chip-id(命令用来查询TCAM中指定hanle表项信息)
表8-1 业务故障诊断命令
命令 |
说明 |
diagnostic start test mqc-test slot-number subslot-number port-number [ act ] |
命令用来诊断搜集接口MQC表项信息(用户视图) |
diagnostic start test flowspec-test slot-number subslot-number port-number [ act ] |
命令用来诊断搜集接口Flowspec表项信息(用户视图) |
display ip policy-based-route [ policy policy-name ] |
命令用来显示已经配置的策略(任意视图) |
display qos-acl resource [ slot slot-number ] |
命令用来显示接口下转发策略路由的配置信息和统计信息(任意视图) |
display hardware internal qacl acl-brief acl-application-type global slot slot-number { inbound | outbound } |
命令用来显示ACL软件表项结构信息(Probe视图) |
display hardware internal qacl acl-entry acl-application-type global slot slot-number { inbound | outbound } [ from start-number ] |
命令用来显示ACL表项信息(Probe视图) |
display hardware internal tcam item handle handle-number table table-type { all | hard | soft } slot slot-number chip chip-id |
命令用来查询TCAM中指定hanle表项信息(Probe视图) |
display openflow instance [ instance-id ] |
命令用来显示OpenFlow实例的详细信息(任意视图) |
display qos-acl resource [ slot slot-number ] |
命令用来显示QoS和ACL资源的使用情况(任意视图) |
diagnostic start test colinfo-forward [ slot [ type ] ] [ act ] |
命令用来搜集转发信息(用户视图) |
diagnostic start test mirror-test slot-number subslot-number port-number [ act ] |
命令用来诊断搜集接口镜像表项信息(用户视图) |
display hardware internal qacl tm-statistics slot slot-number chip chip-id start start-id end end-id { tm0 | tm1 } [ reset ] |
命令用来查询指定TM范围队列的统计计数信息(Probe视图) |
diagnostic start test wred-test direction slot-number subslot-number port-number [ sub-port-number ] [ act ] |
命令用来诊断、搜集接口上LR和队列Gts的配置信息(用户视图) |
display hardware internal intf port-info { interface { interface-type interface-number | interface-name } | slot slot-number } |
显示接口的物理信息(Probe视图) |
display np table 9 entry key keyvalue [ mask maskvalue ] chassis chassis-number slot slot-number [ chip chip-id ] [ dword ] |
命令用来显示NP表单描述信息(Probe视图) |
网板组播表项或拓扑表项错误,导致到FAP芯片的组播少复制或多复制。
(1) 在Probe视图下通过display hardware internal switch swfa check-result default slot slot-number命令查看组播和拓扑表项定期检查结果。
(2) 如果显示的结果中检测到错误,在Probe视图下执行命令set hardware internal switch lswmon task { name | pid } recover slot slot-number使能表项恢复功能。
(3) 在Probe视图下再次执行display hardware internal switch swfa check-result default slot slot-number检测次数增加而错误计数为0,表明表项已经恢复到正确状态。
(4) 如果故障仍未排除,搜集上述信息并联系技术支持人员。
跨单板或者本板不同物理接口之间普通单播不通,在排查其它问题同时也需要排查交换网故障。
(1) 优先排查接口,业务等相关故障。
(2) 排查交换网信息,在Probe视图下执行命令display hardware internal switch chip-info slot slot-number [ chip chip-id ] text读取到对端交换网芯片的ModID。
(3) 在Probe视图下执行命令display hardware internal switch tm fabric reachability dest fap-id [ chip chip-id ] slot slot-number指定槽位的芯片是否可达目的ModID。
(4) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· 任意视图下:
¡ display hardware switch tm fabric connect [ chip chip-id ] slot slot-number(命令用来查看FAP连接信息)
¡ display hardware switch tm fabric mesh_topology [ chip chip-id ] slot slot-number(命令用来查看FAP的mesh_topology信息)
¡ display hardware switch tm interrupts [ chip chip-id ] slot slot-number(命令用来查看中断信息)
¡ display hardware switch tm statistics fap [ chip chip-id ] slot slot-number(命令用来查看FAP各模块的统计信息)
¡ display hardware switch tm ingress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片入方向拥塞信息)本命令板卡上需要有jericho交换芯片
· Probe视图下:
¡ display hardware internal switch tm fabric connect chip chip-id slot slot-number(命令用来查看FAP连接信息)
¡ display hardware internal switch tm interrupts chip chip-id slot slot-number(命令用来查看中断信息)
¡ display hardware internal switch tm statistics fap [ chip chip-id ] slot slot-number(命令用来查看FAP各模块的统计信息)
¡ display hardware internal switch tm ingress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片入方向拥塞信息)本命令板卡上需要有jericho交换芯片
跨单板或者本板不同物理接口之间普通组播报文,部分或者都不通,或者有丢包,优先排查其它问题同时再次排查交换网。
(1) 优先排查接口,组播业务等相关故障,如果接口及组播业务均正常再检查交换网。
(2) Probe视图下执行命令display hardware switch tm fabric mesh_topology [ chip chip-id ] slot slot-number查看交换网topo延时,正常延时值在100以内。
(3) 任意视图下执行命令display hardware switch tm statistics nif [ chip chip-id ] slot slot-number查看入方向组播报文是否正常上送交换网。
(4) 任意视图下执行命令display hardware switch tm statistics sfi [ chip chip-id ] slot slot-number指定槽位的网板收发报文是否正常。
(5) 如果仍未解决问题,请参考如下命令搜集信息并联系技术支持人员:
· 任意视图下:
¡ display hardware switch tm statistics fap [ chip chip-id ] slot slot-number(命令用来查看FAP各模块的统计信息)
¡ display hardware switch tm fabric mesh_topology [ chip chip-id ] slot slot-number(命令用来查看FAP的mesh_topology信息)
¡ display hardware switch tm interrupts [ chip chip-id ] slot slot-number(命令用来查看中断信息)
¡ display hardware switch tm statistics fap [ chip chip-id ] slot slot-number(命令用来查看FAP各模块的统计信息)
¡ display hardware switch tm ingress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片入方向拥塞信息)本命令板卡上需要有jericho交换芯片
¡ display hardware switch tm egress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片出方向Buffer信息)本命令板卡上需要有jericho交换芯片
¡ display hardware switch tm fcinfo [ chip chip-id ] port port-number slot slot-number(显示指定交换芯片流控信息)本命令板卡上需要有jericho交换芯片
· Probe视图下:
¡ display hardware internal switch tm fabric connect chip chip-id slot slot-number(命令用来查看FAP连接信息)
¡ display hardware internal switch tm interrupts chip chip-id slot slot-number(命令用来查看中断信息)
¡ display hardware internal switch tm statistics fap [ chip chip-id ] slot slot-number(命令用来查看FAP各模块的统计信息)
¡ display hardware internal switch tm ingress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片入方向拥塞信息)本命令板卡上需要有jericho交换芯片
¡ display hardware internal switch tm egress congestion [ chip chip-id ] slot slot-number { last record-number | max }(显示指定交换芯片出方向Buffer信息)本命令板卡上需要有jericho交换芯片
¡ display hardware internal switch tm fcinfo [ chip chip-id ] port port-number slot slot-number(显示指定交换芯片流控信息)本命令板卡上需要有jericho交换芯片
Probe视图下执行命令display hardware internal switch devm fabric-topo slot slot-number1 slot slot-number查看互联接口关系,再执行命令display hardware internal switch chip-info slot slot-number [ chip chip-id ] text查看相应接口状态,接口状态为!ena。
(1) Probe视图下执行命令display hardware internal switch devm slot-record slot slot-number,查看网板和线卡的槽位核心数据是否已经相互添加,如果添加执行步骤(2),没有添加则联系技术支持人员定位。
(2) Probe视图下执行命令display hardware internal switch devm slot-record slot slot-number查看网板和线卡的芯片核心数据是否互相添加,如果添加执行步骤(3),没有添加则联系技术支持人员定位。
(3) Probe视图下执行命令display hardware internal switch devm event-record slot slot-number查看互相之间是否有板事件产生,搜集以上信息联系技术支持人员。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!