03-一键诊断命令
本章节下载: 03-一键诊断命令 (604.81 KB)
目 录
1.1.1 diagnostic troubleshooting enable
1.1.2 diagnostic troubleshooting health enable
1.2.1 diagnostic troubleshooting test cpu high-ratio
1.2.2 diagnostic troubleshooting test cpu overload
1.3.1 diagnostic troubleshooting test memory high-ratio
1.3.2 diagnostic troubleshooting test memory overload
1.4.1 diagnostic troubleshooting health module ldp
1.4.2 diagnostic troubleshooting test neighbor-create-abnormal ldp
1.4.3 diagnostic troubleshooting test neighbor-flap ldp
1.5.1 diagnostic troubleshooting health module te
1.5.2 diagnostic troubleshooting test te-tunnel establish-abnormal
1.5.3 diagnostic troubleshooting test te-tunnel lsp-event
1.6.1 diagnostic troubleshooting health module l2vpn
1.6.2 diagnostic troubleshooting test l2vpn-pw establish-abnormal
1.6.3 diagnostic troubleshooting test l2vpn-pw flap
1.7.1 diagnostic troubleshooting test ping failed-reason
1.8.1 diagnostic troubleshooting test snmp-agent packet-process-failure
1.8.2 diagnostic troubleshooting test snmp-agent packet-process-time
1.8.3 diagnostic troubleshooting test snmp-agent trap-send-failure
1.9.1 diagnostic troubleshooting health module bgp
1.9.2 diagnostic troubleshooting test establish-abnormal bgp
1.9.3 diagnostic troubleshooting test flap bgp
1.9.4 diagnostic troubleshooting test peer-establish-abnormal bgp
1.9.5 diagnostic troubleshooting test peer-flap bgp
1.9.6 diagnostic troubleshooting test route-record bgp flowspec
diagnostic troubleshooting enable命令用来开启业务功能的一键诊断功能。
undo diagnostic troubleshooting enable命令用来关闭业务功能的一键诊断功能。
【命令】
diagnostic troubleshooting [ test test-name test-item ] enable
undo diagnostic troubleshooting [ test test-name test-item ] enable
【视图】
系统视图
【缺省情况】
业务功能的一键诊断功能处于开启状态。
【缺省用户角色】
network-admin
【参数】
test test-name:表示测试例的名称,为1~31个字符的字符串,不区分大小写。具体取值可通过执行diagnostic troubleshooting test ?命令来获取。不指定该参数时,表示对所有测试项进行配置。
test-item:表示测试项的名称,为1~31字符的字符串,不区分大小写。具体取值可通过执行diagnostic troubleshooting test test-name ?命令来获取。
【使用指导】
只有开启业务功能的一键诊断功能后,才允许执行业务功能一键诊断。
缺省情况下,为方便用户随时对设备进行维护,所有业务功能的一键诊断功能都处于开启状态。部分测试例不需要存储运行数据,部分测试例需要存储运行数据并根据存储的历史数据进行一键诊断。对于需要存储运行数据的测试例,开启业务功能的一键诊断功能并完成业务模块的配置后,业务模块会将测试项监控的运行数据记录到GOLD模块,以便GOLD模块对测试项进行一键诊断。记录运行数据会消耗设备资源,影响系统性能。如果用户不关心某业务功能的运行状态,可以关闭对应测试项的一键诊断功能,减少对系统性能的影响。
【举例】
# 开启SNMP报文处理失败测试项的一键诊断功能。
<Sysname> system-view
[Sysname] diagnostic troubleshooting snmp-agent packet-process-failure enable
【相关命令】
· diagnostic troubleshooting test
diagnostic troubleshooting health enable命令用来开启业务模块健康度一键诊断功能。
undo diagnostic troubleshooting health enable命令用来关闭业务模块健康度一键诊断功能。
【命令】
diagnostic troubleshooting health [ module module-name ] enable
undo diagnostic troubleshooting health [ module module-name ] enable
【视图】
系统视图
【缺省情况】
业务模块健康度一键诊断功能处于开启状态。
【缺省用户角色】
network-admin
【参数】
module module-name:模块名,为1~31个字符的字符串,区分大小写。不指定该参数时,则开启所有设备支持的业务模块的健康度用例。
【使用指导】
只有开启业务模块健康度一键诊断功能后,才允许执行业务模块健康度一键诊断。
开启业务模块健康度一键诊断功能并完成业务模块的配置后,业务模块会将不健康业务信息记录到GOLD模块,以便GOLD模块进行健康度一键诊断。记录业务模块的不健康信息会消耗设备资源,影响系统性能。如果用户不关心某业务模块的健康度,可以关闭该业务模块的健康度监测,减少对系统性能的影响。
【举例】
# 开启MPLS TE业务模块健康度一键诊断功能。
<Sysname> system-view
[Sysname] diagnostic troubleshooting health module te enable
【相关命令】
· diagnostic troubleshooting health
diagnostic troubleshooting test cpu high-ratio命令用来对CPU利用率超门限事件进行一键诊断。
【命令】
diagnostic troubleshooting test cpu high-ratio
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
系统每隔1分钟对CPU利用率进行一次采样。开启CPU利用率超门限事件一键诊断功能后,如果设备本次CPU利用率的采样值大于CPU利用率低级别告警门限(CPU利用率告警门限可通过monitor cpu-usage threshold命令配置),则设备认为CPU利用率超门限,会在GOLD模块的内存中记录一条CPU利用率超门限事件。
执行本命令后,设备会显示下列信息,以帮助用户定位CPU利用率高的问题。
· 最近CPU利用率的采样值(最多显示7条)。
· 显示最近CPU超门限事件记录(最多显示7条)。
· 显示最近一次CPU利用率超门限事件发生时CPU利用率排名前五的进程的信息。
关于CPU利用率告警功能的详细描述请参见“设备管理配置指导”中的“硬件资源管理”。
请先使用diagnostic troubleshooting test cpu high-ratio enable命令,开启CPU利用率超门限事件一键诊断功能,否则,本命令执行失败。(CPU利用率超门限事件一键诊断功能缺省处于开启状态。)
【举例】
# 对CPU利用率超门限事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test cpu high-ratio
Slot 1 CPU 0 usage:
Time Usage
2022-07-25 02:37:52 30%
2022-07-25 02:32:16 28%
2022-07-25 02:22:16 28%
2022-07-25 02:12:16 27%
2022-07-25 02:52:16 29%
2022-07-25 01:32:16 28%
2022-07-25 01:12:16 25%
Slot 1 CPU 0 recent high usage records:
Time Severe threshold Minor threshold Usage
2022-07-25 02:18:52 80% 25% 30%
2022-07-25 02:18:53 80% 25% 28%
2022-07-25 02:22:16 80% 25% 28%
2022-07-25 02:12:16 80% 25% 27%
2022-07-25 02:52:16 80% 25% 29%
2022-07-25 01:32:16 80% 25% 28%
2022-07-25 01:12:16 80% 25% 25%
Top 5 slot 1 CPU 0 usage processes in the last record:
JID PID PRI State FDs HH:MM:SS Usage Name
1026 1026 120 S 1188 00:11:16 12.61% forward
999 999 120 S 190 00:00:37 5.55% ifmond
847 847 120 S 183 00:01:10 5.29% drv_app
983 983 120 S 94 00:01:00 4.76% diagd
1201 1201 120 S 199 00:02:09 4.26% pppd
表1-1 diagnostic troubleshooting test cpu high-ratio命令显示信息描述表
字段 |
描述 |
Slot 1 CPU 0 usage |
Slot 1 CPU 0最近CPU利用率信息记录,最多可记录7条 |
Time |
CPU利用率采样时间 |
Usage |
CPU利用率取值 |
Slot 1 CPU 0 recent high usage records |
Slot 1 CPU 0最近CPU利用率超门限事件记录,最多可记录7条 |
Severe threshold |
CPU利用率高级别告警门限。CPU利用率采样值大于CPU利用率低级别告警门限或CPU利用率高级别告警门限,GOLD会记CPU利用率超门限事件 |
Minor threshold |
CPU利用率低级别告警门限,CPU利用率采样值大于CPU利用率低级别告警门限或CPU利用率高级别告警门限,GOLD会记CPU利用率超门限事件 |
Top 5 slot 1 CPU 0 usage processes in the last record |
最近一条CPU利用率超门限事件发生时,Slot 1 CPU 0的CPU利用率占前五的进程的信息 |
JID |
任务编号,用于唯一标识一个进程,该编号不会随着进程的重启而改变 |
PID |
进程编号 |
PRI |
进程优先级(优先级在进程调度时发挥作用,优先级高的会优先得到调度) |
State |
进程状态,可能的取值为: · R:Running,运行状态或处于运行队列 · S:Sleeping,可中断睡眠状态 · T:Traced or stopped,暂停状态 · D:Uninterruptible sleep,不可中断睡眠状态 · Z:Zombie,僵死状态 |
FDs |
进程已使用的FD个数 |
HH:MM:SS |
进程最近一次启动后的运行时间。当进程的持续运行时间大于或等于100小时时,该列仅显示小时数,不再显示分和秒 |
Name |
进程名 |
【相关命令】
· diagnostic troubleshooting enable
· monitor cpu-usage threshold(设备管理命令参考/硬件资源管理)
diagnostic troubleshooting test cpu overload命令用来对CPU利用率突增事件进行一键诊断。
【命令】
diagnostic troubleshooting test cpu overload
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
设备执行一次监控诊断测试例cpu-overload,会对CPU利用率采样一次,该采样值用于CPU利用率突增事件一键诊断。监控诊断测试例cpu-overload缺省处于开启状态,可通过diagnostic monitor enable来配置。监控诊断测试例cpu-overload的执行周期缺省为30分钟,可通过diagnostic monitor interval命令修改。
开启CPU利用率突增事件一键诊断功能后,如果设备本次CPU利用率的采样值减去上一次采样值的结果大于10%,则认为CPU利用率突增,会在GOLD模块的内存中记录一条CPU利用率突增事件。
执行本命令后,设备会显示下列信息,以帮助用户定位CPU利用率突增的问题。
· 显示最近CPU利用率突增事件,最多显示7条。
· 显示最近一次CPU利用率突增事件发生时CPU利用率排前五的进程的信息。
请先使用diagnostic troubleshooting test cpu overload enable命令,开启CPU利用率突增事件一键诊断功能,否则,本命令执行失败。(CPU利用率突增事件一键诊断功能缺省处于开启状态。)
【举例】
# 对CPU利用率突增事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test cpu overload
Slot 1 CPU 0 recent uasge burst records:
Time Usage(%)
2022-07-25 02:18:52 From 10 to 30
Top 5 slot 1 CPU 0 usage processes in the last record:
Process 1011 (forward)
TID LAST_CPU Stack PRI State HH:MM:SS:MSEC Name
1011 12 136K 120 S 0:8:24:620 forward
Thread (LWP 1011):
Switch counts: 1
User stack:
#0 0x00007fb893904dbd in syscall+0x1d/0x37
#1 0x00007fb896160748 in futex_async+0x48/0x50
#2 0x00007fb896161e98 in call_rcu_wait+0xa8/0xb5
#3 0x00007fb896162646 in call_rcu_thread+0x556/0x6ed
#4 0x00007fb899e742de in start_thread+0xfe/0x3e0
Kernel stack:
[<ffffffff9a1090b4>] futex_wait_queue_me+0xc4/0x120
[<ffffffff9a109d16>] futex_wait+0x116/0x270
[<ffffffff9a10bbf7>] do_futex+0x237/0xb40
[<ffffffff9a10c581>] SyS_futex+0x81/0x180
[<ffffffff9a87f3fb>] entry_SYSCALL_64_fastpath+0x1e/0xad
[<ffffffffffffffff>] 0xffffffffffffffff
Process 1016 (ifmond)
TID LAST_CPU Stack PRI State HH:MM:SS:MSEC Name
1016 5 136K 120 S 0:1:0:0 ifmond
Thread (LWP 1026):
Switch counts: 1
User stack:
#0 0x00007fb893904dbd in syscall+0x1d/0x37
#1 0x00007fb896160748 in futex_async+0x48/0x50
#2 0x00007fb896161e98 in call_rcu_wait+0xa8/0xb5
#3 0x00007fb896162646 in call_rcu_thread+0x556/0x6ed
#4 0x00007fb899e742de in start_thread+0xfe/0x3e0
Kernel stack:
[<ffffffff9a1090b4>] futex_wait_queue_me+0xc4/0x120
[<ffffffff9a109d16>] futex_wait+0x116/0x270
[<ffffffff9a10bbf7>] do_futex+0x237/0xb40
[<ffffffff9a10c581>] SyS_futex+0x81/0x180
[<ffffffff9a87f3fb>] entry_SYSCALL_64_fastpath+0x1e/0xad
[<ffffffffffffffff>] 0xffffffffffffffff
……
表1-2 diagnostic troubleshooting test cpu overload命令显示信息描述表
字段 |
描述 |
Slot 1 CPU 0 recent uasge burst records |
Slot 1 CPU 0最近的CPU利用率突增事件记录,最多可记录7条 |
Time |
CPU利用率采样时间 |
Usage(%) |
CPU利用率变化情况,用百分比表示 |
Top 5 slot 1 CPU 0 usage processes in the last record |
Slot 1 CPU 0最近一条CPU利用率超门限事件发生时,CPU使用率占前五的进程的信息 |
Process 1011 (forward) |
进程的编号(进程的名称) |
TID |
线程编号 |
LAST_CPU |
进程最近一次被调度时,所在的CPU |
Stack |
堆栈大小,单位为KB |
PRI |
线程使用CPU的优先级 |
State |
线程状态,可能的取值为: · R:Running,运行状态或正在队列中等待调度 · S:Sleeping,可中断睡眠状态 · T:Traced or stopped,暂停状态 · D:Uninterruptible sleep,不可中断睡眠状态 · Z:Zombie,僵死状态 |
HH:MM:SS:MSEC |
线程最近一次启动后的运行时间 |
Name |
线程名称 |
Thread (LWP 1026) |
被跟踪进程的子进程 |
Switch counts |
被调度的次数 |
User stack |
用户态堆栈信息,仅用户态进程显示该信息 |
Kernel stack |
内核态堆栈信息,仅内核态进程显示该信息 |
【相关命令】
· diagnostic monitor enable(设备管理命令参考/GOLD)
· diagnostic monitor interval(设备管理命令参考/GOLD)
· diagnostic troubleshooting enable
diagnostic troubleshooting test memory high-ratio命令用来对剩余内存超门限事件进行一键诊断。
【命令】
diagnostic troubleshooting test memory high-ratio
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
系统每隔5秒对剩余内存进行一次采样。开启内存超门限事件一键诊断功能后,如果设备当前剩余内存采样值小于等于一级内存告警门限(内存告警门限可通过memory-threshold命令配置),则设备认为剩余内存超门限,会在GOLD模块的内存中记录一条剩余内存超门限事件。
执行本命令后,设备会显示当前内存使用情况以及最近剩余内存超过告警门限的事件,最多显示7条,帮助用户定位系统剩余内存不足的问题。
请先使用diagnostic troubleshooting test memory high-ratio enable命令,开启内存超门限事件一键诊断功能,否则,本命令执行失败。(内存超门限事件一键诊断功能缺省处于开启状态。)
【举例】
# 对剩余内存超门限事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting memory high-ratio
Start diagnose at 2013-02-22 14:16:27.
End diagnose at 2013-02-22 14:16:27, Actual time:0 seconds.
Memory statistics are measured in KB:
Slot 1:
Total Used Free Shared Buffers Cached FreeRatio
Mem: 8086816 6971116 1115700 0 372 3907428 22.0%
-/+ Buffers/Cache: 3063316 5023500
Swap: 0 0 0
Container memory statistics are measured in KB:
Slot 1:
Total Used Free UsageRatio
Slot 1 recent high memory usage records:
Time Threshold FreeRatio
2013-02-21 13:28:21 13% 14.4%
表1-3 diagnostic troubleshooting test memory high-ratio命令显示信息描述表
字段 |
描述 |
Memory statistics are measured in KB: |
物理设备中内存使用情况,以下统计信息均以KB为单位 |
Mem |
内存使用信息 |
Total |
系统可分配的物理内存的大小 设备总物理内存分为不可分配物理内存和可分配物理内存: · 不可分配物理内存用于内核代码段存储、内核管理开销等;可分配物理内存用于支撑业务模块的运行、文件存储等操作 · 可分配内存的大小由设备根据系统运行需要自动计算划分 · 可分配物理内存的大小=设备总物理内存-不可分配内存的大小 |
Used |
整个系统已用的物理内存大小 |
Free |
整个系统可用的物理内存大小 |
Shared |
多个进程共享的物理内存总额。取值为“--”时,表示不支持统计该参数的值 |
Buffers |
已使用的文件缓冲区的大小。取值为“--”时,表示不支持统计该参数的值 |
Cached |
高速缓冲寄存器已使用的内存大小。取值为“--”时,表示不支持统计该参数的值 |
FreeRatio |
整个系统物理内存的空闲率 |
-/+ Buffers/Cache |
-/+ Buffers/Cache:used = Mem:Used – Mem:Buffers – Mem:Cached,表示应用程序已用的物理内存大小 -/+ Buffers/Cache:free = Mem:Free + Mem:Buffers + Mem:Cached,表示应用程序可用的物理内存大小 |
Swap |
交换分区的使用信息 |
Container memory statistics are measured in KB |
Comware容器对内存的使用情况,包括: · Total:Comware容器总共可分配的物理内存的大小,单位为KB · Used:Comware容器已使用的物理内存的大小,单位为KB · Free:Comware容器可用的物理内存的大小,单位为KB · UsageRatio:Comware容器对物理内存的使用率 |
Slot 1 recent high memory usage records |
Slot 1最近内存超门限事件的记录,最多可记录7条 |
Time |
内存超门限发生的时间 |
Threshold |
内存门限值 |
【相关命令】
· diagnostic troubleshooting enable
· memory-threshold(设备管理命令参考/硬件资源管理)
diagnostic troubleshooting test memory overload命令用来对内存使用量突增事件进行一键诊断。
【命令】
diagnostic troubleshooting test memory overload
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
设备执行一次监控诊断测试例memory-overload,会对内存使用量采样一次,该采样值用于内存使用量突增事件一键诊断。监控诊断测试例memory-overload缺省处于开启状态,可通过diagnostic monitor enable来配置。监控诊断测试例memory-overload的执行周期缺省为12小时,可通过diagnostic monitor interval命令修改。
开启内存使用量突增事件一键诊断功能后,如果设备本次内存使用量的采样值减去上一次采样值的结果大于50M,则认为内存使用量突增,会在GOLD模块的内存中记录一条内存使用量突增事件。
执行本命令后,设备会显示下列信息,以帮助用户定位系统剩余内存不足的问题。
· 显示最近内存使用量突增事件,最多显示7条。
· 显示最近一次内存使用量突增事件发生时内存使用量排前五的进程的信息。
请先使用diagnostic troubleshooting test memory overload enable命令,开启内存使用量突增事件一键诊断功能,否则,本命令执行失败。(内存使用量突增事件一键诊断功能缺省处于开启状态。)
【举例】
# 对内存使用量突增事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting memory overload
Slot 1 recent memory usage burst records:
Time Memory used (MB)
2022-07-25 08:18:52 From 456 to 556
2022-07-25 07:18:52 From 456 to 556
2022-07-25 06:18:52 From 456 to 556
2022-07-25 05:18:52 From 456 to 556
2022-07-25 04:18:52 From 456 to 556
2022-07-25 03:18:52 From 456 to 556
2022-07-25 02:18:52 From 456 to 556
Slot 1 top 5 memory usage processes in the last record:
Process: scmd (jobID 1)
Total allocated memory: 393760 bytes
Total free memory: 144672 bytes
Heap usage of the job:
Tag UsedBlocks UsedBytes FreeBlocks FreeBytes
0x0 1412 362704 24 144304
0x1060000 2 96 0 0
0x1090000 0 0 3 240
0x10b0000 3 96 2 64
0x1120000 7 2496 0 0
0x1150000 1 64 1 64
0x1570000 1 11536 0 0
0x15a0000 26 16768 0 0
Process: aaa (jobID 2)
Total allocated memory: 393760 bytes
Total free memory: 144672 bytes
Heap usage of the job:
Tag UsedBlocks UsedBytes FreeBlocks FreeBytes
0x0 1412 362704 24 144304
0x1060000 2 96 0 0
0x1090000 0 0 3 240
0x10b0000 3 96 2 64
0x1120000 7 2496 0 0
0x1150000 1 64 1 64
0x1570000 1 11536 0 0
0x15a0000 26 16768 0 0
表1-4 diagnostic troubleshooting test memory overload命令显示信息描述表
字段 |
描述 |
Slot 1 recent memory usage burst records |
Slot 1最近内存使用量突增事件记录,最多可记录7条 |
Time |
内存突增事件发生的时间 |
Memory used (MB) |
上一次采集时内存使用量和当前采集时内存使用量,单位为MB |
Slot 1 top 5 memory usage processes in the last record |
显示内存使用量增长最多的前5个进程的内存使用量信息 |
Process: scmd (jobID 1) |
进程的名称为scmd(任务ID是1) |
Total allocated memory |
任务已使用的堆内存大小,单位为字节 |
Total free memory |
任务可使用的堆内存大小,单位为字节 |
Heap usage of the job |
任务对堆内存的使用情况 |
Tag |
系统内部软件模块的编号 |
UsedBlocks |
已使用的内存块个数 |
UsedBytes |
已使用的内存大小,单位为字节 |
FreeBlocks |
剩余的内存块个数 |
FreeBytes |
剩余的内存大小,单位为字节 |
【命令参考】
· diagnostic monitor enable(设备管理命令参考/GOLD)
· diagnostic monitor interval(设备管理命令参考/GOLD)
· diagnostic troubleshooting enable
diagnostic troubleshooting health module ldp命令用来对LDP模块执行一次健康度诊断。
【命令】
diagnostic troubleshooting health module ldp
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
本命令用来诊断LDP模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。
请先使用diagnostic troubleshooting health module ldp enable命令,开启LDP模块健康度一键诊断功能,否则,本命令执行失败。
【举例】
# 对LDP模块执行一次健康度诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting health module ldp enable
[Sysname] diagnostic troubleshooting health module ldp
Show LDP health events:
--------------------------------------------------------------------------------
Health event Detect time Description
--------------------------------------------------------------------------------
RES_LABEL_ALLOC_FAIL 2022-4-20 10:01:50 Failed to alloc labels to LDP. (ErrorCode=[1] )
表1-5 diagnostic troubleshooting health module ldp命令显示信息描述表
字段 |
描述 |
Health event |
健康度事件类型,取值包括: · RES_LABEL_ALLOC_FAIL:LDP申请标签段失败 · RES_LABEL_ALLOC_RESUME:LDP可用标签数量恢复 |
Detect time |
健康度事件发生时间 |
Description |
健康度事件的详细描述 |
【相关命令】
· diagnostic troubleshooting health enable
diagnostic troubleshooting test neighbor-create-abnormal ldp命令用来对LDP会话建立异常事件进行一键诊断。
【命令】
diagnostic troubleshooting test neighbor-create-abnormal ldp { local [ vpn-instance vpn-instance-name ] peer peer-lsr-id interface interface-type interface number | remote peer peer-lsr-id } [ diagnostic-time diagnostic-time ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
local:表示LDP本地会话。
vpn-instance vpn-instance-name:指定LDP对等体所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示LDP对等体属于公网中。
peer peer-lsr-id:指定LDP对等体的LSR ID。peer-lsr-id为LDP对等体的LSR ID。
interface-type interface-number:指定LDP本地会话的接口。interface-type interface-number为接口类型和接口编号。
remote peer peer-lsr-id:表示LDP远端会话。peer-lsr-id为LDP对等体的LSR ID。
diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为1~60,单位为秒,缺省值为30。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time。
【使用指导】
请先使用diagnostic troubleshooting test neighbor-create-abnormal ldp enable命令,开启LDP会话建立异常事件一键诊断功能,否则,本命令执行失败。
开启一键诊断功能并完成LDP配置后,LDP模块会将LDP会话建立异常的运行数据记录到GOLD模块,以便GOLD模块对LDP会话建立异常进行一键诊断。
记录LDP会话建立异常的运行数据会消耗设备资源,影响系统性能。如果用户不关心LDP模块的运行状态,可以关闭LDP会话建立异常的一键诊断功能,减少对系统性能的影响。
【举例】
# 对LDP会话建立异常事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test neighbor-create-abnormal ldp enable
[Sysname] diagnostic troubleshooting test neighbor-create-abnormal ldp remote peer 2.2.2.2
Start diagnose at 2022-09-29 06:41:20, Estimated time:30 seconds.
Please wait.....................Done.
End diagnose at 2022-09-29 06:41:40, Actual time:30 seconds.
Diagnosis report:
--------------------------------------------------------------------------------
PeerID Status Reason
2.2.2.2 NOT_EXISTENT No LSR-ID
--------------------------------------------------------------------------------
表1-6 diagnostic troubleshooting test neighbor-create-abnormal ldp命令显示信息描述表
字段 |
描述 |
Peer ID |
LDP邻居的LSR ID |
Status |
LDP会话状态,取值包括: · NOT_EXISTENT:会话不存在 · INITIALIZED:会话处于初始化状态 · OPEN_SENT:会话已发送Init消息,等待接收对端的Init消息 · OPEN_RECV:会话已经发送Open消息,等待接收对端的Open消息 · OPER:会话处于Up状态 |
Reason |
LDP会话无法建立的原因,取值包括: · Device in memory-threshold:设备处于内存门限 · No LSR-ID:无可用的LSR ID · Local interface down:本地接口处于down状态 · Local interface has no IPv4 address:本地接口未配置IPv4地址 · Local interface has no MPLS capability:本地接口未开启MPLS能力 · Local interface has no LDP capability:本地接口未开启LDP能力 · No hello packet received:未收到对端发送的Hello报文 · No target peer:未配置target-peer命令 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test neighbor-flap ldp命令用来对LDP对等体震荡事件进行一键诊断。
【命令】
diagnostic troubleshooting test neighbor-flap ldp [ [ vpn-instance vpn-instance-name ] peer peer-id ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
vpn-instance vpn-instance-name:指定LDP对等体所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示LDP对等体属于公网中。
peer peer-lsr-id:指定LDP对等体的LSR ID。peer-lsr-id为LDP对等体的LSR ID。
【使用指导】
请先使用diagnostic troubleshooting test neighbor-flap ldp enable命令,开启LDP对等体震荡事件一键诊断功能,否则,本命令执行失败。
开启一键诊断功能并完成LDP配置后,LDP模块会将LDP对等体震荡的运行数据记录到GOLD模块,以便GOLD模块对LDP对等体震荡进行一键诊断。记录LDP对等体震荡的运行数据会消耗设备资源,影响系统性能。如果用户不关心LDP模块的运行状态,可以关闭LDP对等体震荡的一键诊断功能,减少对系统性能的影响。
【举例】
# 对地址为2.2.2.2的LDP对等体震荡事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting neighbor-flap ldp enable
[Sysname] diagnostic troubleshooting neighbor-flap ldp peer 2.2.2.2
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait......................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
--------------------------------------------------------------------------------
PeerID Down time Duration time Reason
2.2.2.2 2022-04-01 10:15:35 1h32m19s Interface not operational
--------------------------------------------------------------------------------
表1-7 diagnostic troubleshooting test neighbor-flap ldp命令显示信息描述表
字段 |
描述 |
PeerID |
对等体的LSR ID |
Down time |
震荡发生时间 |
Duration time |
Down状态持续时间 |
Reason |
震荡原因,取值包括: · Interface not operational:表示接口不可用 · MPLS disabled on interface:表示接口已关闭MPLS能力 · LDP disabled on interface:表示接口已关闭LDP能力 · LDP auto-configure disabled on interface:表示接口已关闭LDP自动配置功能 · VPN instance changed on interface:表示接口所属的VPN实例已更改 · LDP instance deleted:表示LDP实例已删除 · Targeted peer deleted:表示手动删除targeted peer · L2VPN disabled targeted peer:表示L2VPN注销targeted peer · TE tunnel disabled targeted peer:表示TE隧道注销targeted peer · Session protection disabled targeted peer:表示会话保护注销targeted peer · OSPF Remote LFA disabled targeted peer:表示OSPF Remote LFA注销targeted peer · IS-IS Remote LFA disabled targeted peer:表示IS-IS Remote LFA注销targeted peer · Process deactivated:表示LDP进程降级 · Failed to receive the initialization message:表示未收到初始化信息 · Graceful restart reconnect timer expired:表示GR重连定时器超时 · Failed to recover adjacency by NSR:表示NSR恢复邻接关系失败 · Failed to upgrade session by NSR:表示NSR升级会话失败 · Closed the GR session:表示GR会话关闭 · Keepalive hold timer expired:表示keepalive保持时间超时 · Hello hold timer expired:表示hello保持时间超时 · Session reset:表示重启会话 · TCP connection down:表示TCP连接断开 · Received a fatal notification message:表示收到致命的通知信息 · Internal error:表示内部错误 · Memory in critical state:表示内存达到critical状态 · Transport address changed on interface:表示接口上的传输地址更改 · MD5 password changed:表示会话MD5密码变化 |
diagnostic troubleshooting health module te命令用来对MPLS TE模块执行一次健康度诊断。
【命令】
diagnostic troubleshooting health module te
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
本命令用来诊断MPLS TE模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。
请先使用diagnostic troubleshooting health module te enable命令,开启MPLS TE模块健康度一键诊断功能,否则,本命令执行失败。
【举例】
# 对MPLS TE模块执行一次健康度诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting health module te enable
[Sysname] diagnostic troubleshooting health module te
Show TE health events:
--------------------------------------------------------------------------------
Health event Detect time Description
--------------------------------------------------------------------------------
BSID_ALLOC_FAILED 2022-4-20 10:01:50 Tunnel 1 allocated
binding-sid label
15999 failed.
表1-8 diagnostic troubleshooting health module te命令显示信息描述表
字段 |
描述 |
Health event |
健康度事件类型,取值为BSID_ALLOC_FAILED,表示MPLS TE隧道申请BSID失败 |
Detect time |
健康度事件发生时间 |
Description |
健康度事件的详细描述 |
【相关命令】
· diagnostic troubleshooting health module te enable
diagnostic troubleshooting test te-tunnel establish-abnormal命令用来执行一次MPLS TE隧道建立异常一键诊断功能。
【命令】
diagnostic troubleshooting test te-tunnel establish-abnormal tunnel tunnel-id [ diagnostic-time diagnostic-time ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
tunnel tunnel-id:对指定MPLS TE隧道执行一次隧道建立异常一键诊断功能。tunnel-id为设备上已创建的Tunnel接口的编号。
diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为10~300,单位为秒,缺省值为120。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time。
【使用指导】
请先使用diagnostic troubleshooting test te-tunnel establish-abnormal enable命令,开启MPLS TE隧道建立异常一键诊断功能,否则,本命令执行失败。
开启一键诊断功能并完成MPLS TE配置后,MPLS TE模块会将MPLS TE隧道建立异常的运行数据记录到GOLD模块,以便GOLD模块对MPLS TE隧道建立异常进行一键诊断。记录MPLS TE隧道建立异常的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS TE模块的运行状态,可以关闭MPLS TE隧道建立异常的一键诊断功能,减少对系统性能的影响。
【举例】
# 对Tunnel ID为1的MPLS TE隧道执行一次隧道建立异常一键诊断功能。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test te-tunnel establish-abnormal enable
[Sysname] diagnostic troubleshooting test te-tunnel establish-abnormal tunnel 1
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait......................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
(M): Modify LSP
--------------------------------------------------------------------------------
Tunnel Name: Tunnel1
Ingress LSR ID: 1.1.1.1 Egress LSR ID: 3.3.3.3
LSP type : Main Detect time: 2022-4-20 10:01:50
Reason: RSVP not configured on interface HGE1/0/1 with IP address 10.1.1.1 on LSR 1.1.1.1.
LSP type : Hot-standby Detect time: 2022-4-20 10:01:52
Reason: CSPF computation failed.
--------------------------------------------------------------------------------
表1-9 diagnostic troubleshooting te-tunnel establish-abnormal命令显示信息描述表
字段 |
描述 |
Tunnel Name |
隧道名称 |
Ingress LSR ID |
隧道头结点的LSR ID |
Egress LSR ID |
隧道尾结点的LSR ID |
LSP type |
LSP类型,取值包括: · Main:主路径 · Hot-standby:热备份路径 · (M):表示MBB方式生成的LSP |
Detect Time |
得出诊断结果的时间 |
Reason |
隧道建立失败原因,取值包括: · Establish success:LSP建立成功,没有异常 · The destination not configured:隧道目的地址未配置 · The MPLS LSR-ID not configured:未配置MPLS LSR ID · The MPLS TE not configured:未全局开启MPLS TE功能 · The tunnel has been shut down:隧道处于shutdown状态 · LSPM isn't running:LSP管理功能未运行 · SRM isn't running:Segment Routing管理功能未运行 · RSVP isn't running:RSVP协议未运行 · PCE isn't running:PCEP协议未运行 · No out segment of the SR label:SR首标签没有出方向 · Segment routing path compute failed:SRLSP路径计算失败 · Segment routing path verification failed:SRLSP路径校验失败 · Equal-cost backup LSP not supported:不支持等价备份路径 · Backup LSP is the same as main LSP:SRLSP主备同路 · SR path compute element not respond:SRLSP路径计算单元无响应 · Backup LSP sharing the same SRLG with the main LSP:SRLSP备份路径与主路径属于同一个SRLG · Main and backup LSPs can't be equal-cost paths:SRLSP主路径等价情况下,备路径不能建立 · SR out segment is tunnel itself:SR路径出接口包含隧道本身 · SR out segment is too deep:SR路径标签栈深度超过限制 · Modify unchanged:Modify LSP与主路径相同 · RSVP path compute failed:RSVP路径计算失败 · RSVP not configured on interface HGE1/0/1 of LSR 1.1.1.1:节点上的接口没有开启RSVP能力 · RSVP signaling error(24,1) occurred on the LSR 1.1.1.1:RSVP路径建立过程中产生RSVP协议错误 · RSVP LSP can't be established with nextsid in explicit-path:RSVP信令建立的隧道不能使用显式路径方式指定下一跳标签 · RSVP downstream is not responding:RSVP路径下游设备无响应 · RSVP busy:RSVP协议繁忙,无响应 · Unreferenced to any static CRLSP or SRLSP:Static信令下未配置静态CRLSP名称Static CRLSP is down:静态CRLSP处于Down状态 · Static CRLSP busy:静态CRLSP繁忙,无响应 · LSP or tunnel BFD down:LSP关联的BFD Down · Delegated tunnel without PCE update:隧道托管给PCE,但是PCE未更新 · Minor memory-threshold:设备处于一级内存门限 · Critical memory-threshold:设备处于三级内存门限 · Unknown error:未知错误 · Backup LSP is the same as main LSP:主备同路 |
【相关命令】
· diagnostic troubleshooting test te-tunnel establish-abnormal enable
diagnostic troubleshooting test te-tunnel lsp-event命令用来对MPLS TE隧道震荡和路径切换事件进行一键诊断。
【命令】
diagnostic troubleshooting test te-tunnel lsp-event [ flap | switch ] tunnel tunnel-id
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
flap:对MPLS TE隧道震荡事件进行一键诊断。
switch:对MPLS TE隧道路径切换事件进行一键诊断。
tunnel tunnel-id:对指定MPLS TE隧道执行一次一键诊断功能。tunnel-id为设备上已创建的Tunnel接口的编号。
【使用指导】
执行本命令时,如果没有指定flap和switch参数,则表示对MPLS TE隧道震荡和路径切换事件进行一键诊断。
请先使用diagnostic troubleshooting test te-tunnel lsp-event enable命令,开启MPLS TE隧道震荡和路径切换事件一键诊断功能,否则,本命令执行失败。
执行本命令后,设备会显示MPLS TE隧道最近5次由up变为down的事件信息、MPLS TE隧道最近5次路径切换的事件信息,帮助用户定位MPLS TE隧道震荡和路径切换问题。
本命令仅支持对采用Segment Routing协议建立的MPLS TE隧道进行一键诊断。
开启一键诊断功能并完成MPLS TE配置后,MPLS TE模块会将MPLS TE隧道震荡和路径切换的运行数据记录到GOLD模块,以便GOLD模块对MPLS TE隧道震荡和路径切换进行一键诊断。
记录MPLS TE隧道震荡和路径切换的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS TE模块的运行状态,可以关闭MPLS TE隧道震荡和路径切换的一键诊断功能,减少对系统性能的影响。
【举例】
# 对Tunnel ID为1的MPLS TE隧道执行一次隧道震荡和路径切换事件一键诊断功能。
<Sysname>system-view
[Sysname] diagnostic troubleshooting test te-tunnel lsp-event enable
[Sysname] diagnostic troubleshooting test te-tunnel lsp-event tunnel 1
Tunnel Name:Tunnel1
IngressLSRID:1.1.1.1 EgressLSRID:3.3.3.3
Admin state: Normal Tunnel state: Up
Path state:
Main path info : 1.1.1.1/1/61103 State: Active
Backup path info: 1.1.1.1/1/61104 State: Up
--------------------------------------------------------------------------------
Last five lsp-flap events:
LSP type:Main Down time:2022-4-20 10:01:50
Reason: The interface with IP address 10.1.1.1 went down.
LSP Type:Hot-standby Down Time: 2022-4-20 10:01:52
Reason:Configuration changed.[shutdown]
--------------------------------------------------------------------------------
Last five lsp-switch events:
Switch type : Main LSP recovered Switch time: 2021-8-14 14:30:29.734
Reason : Main LSP up
Path details:
Old path : 16010 - 2371 - 17030
New path : 16010 – 1802
Switch type : Backup LSP inused Switch time: 2021-8-14 14:30:29.734
Reason : Main LSP down
Path detail:
Old path : 16010 – 1802
New path : 16010 - 2371 - 17030
表1-10 diagnostic troubleshooting test te-tunnel lsp-event命令显示信息描述表
字段 |
描述 |
Tunnel Name |
隧道名称 |
IngressLSRID |
隧道头结点的LSR ID |
EgressLSRID |
隧道尾结点的LSR ID |
Admin state |
隧道接口的管理状态,取值包括: · Normal:未通过shutdown命令关闭隧道接口 · Shutdown:通过shutdown命令关闭隧道接口 |
Tunnel state |
隧道的运行状态,取值包括Down和Up |
Path state |
路径状态,即隧道内每条LSP的状态 |
Main path info |
主路径信息,取值为Ingress LSR ID/Tunnel ID/LSP ID |
Backup path info |
备路径信息,取值为Ingress LSR ID/Tunnel ID/LSP ID |
State |
路径状态,取值包括: · Active:表示SRLSP建立成功且当前使用该SRLSP转发流量 · Up:表示SRLSP建立成功 · Down:表示SRLSP未建立或者建立失败 |
Last five times lsp-flap record |
最近5次隧道震荡事件记录 |
LSP type |
LSP类型,取值包括: · Main:隧道主路径 · Hot-standby:隧道备份路径 |
Down time |
隧道震荡发生时间。 |
Reason |
隧道震荡原因,取值包括: · No out segment:SID对应的表项没有出接口信息 · IGP calculated path failed:IGP计算路径失败 · SRLG check failed:SRLG校验失败 · Configuration changed:配置修改 · PCE state recover:PCE状态回退 |
Last five times lsp-switch record |
最近5次隧道路径切换事件记录 |
Switch Type |
路径切换类型,取值包括: · Backup LSP inused :由于主路径故障,流量切换到备路径进行转发 · Main LSP recovered :由于主路径故障恢复,流量回切到主路径转发 · Main LSP make-before-break:配置修改等导致的主MBB |
Switch Time |
隧道路径切换时间 |
Reason |
路径切换的原因,取值包括: · Main LSP down:主路径down · Main LSP up:主路径up · Main LSP BFD down:BFD检测到主路径down · Main LSP BFD up:BFD检测到主路径up · Configuration changed:配置修改 |
Path detail |
路径详细信息 |
Old path |
切换前的路径信息,显示为从栈顶到栈底的标签栈信息 |
New path |
切换后的路径信息,显示为从栈顶到栈底的标签栈信息 |
【相关命令】
· diagnostic troubleshooting test te-tunnel lsp-event enable
diagnostic troubleshooting health module l2vpn命令用来对MPLS L2VPN模块执行一次健康度诊断。
【命令】
diagnostic troubleshooting health module l2vpn
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
本命令用来诊断MPLS L2VPN模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。
请先使用diagnostic troubleshooting health module l2vpn enable命令,开启MPLS L2VPN模块健康度一键诊断功能,否则,本命令执行失败。
【举例】
# 对MPLS L2VPN模块执行一次健康度诊断。
<Sysname> system
[Sysname] diagnostic troubleshooting health module l2vpn enable
[Sysname] diagnostic troubleshooting health module l2vpn
Show L2VPN health events:
--------------------------------------------------------------------------------
Health event Detect time Description
LABEL_NOT_ALLOCATED 04-15 07:37:06 ESI failed to apply for the label.
(IfName=Vpna)
LABEL_NOT_ALLOCATED 04-15 07:37:06 Upwesi failed to apply for the
label.(VsiName=Vpna,PwId=200)
LABEL_NOT_ALLOCATED 04-15 07:37:06 EVPN VPLS failed to apply for the
label.(VsiName=Vpna)
LABEL_NOT_ALLOCATED 04-15 07:37:06 EVPN VPWS failed to apply for the
label.(XcgName=Xpna)
VN_EXCEED 04-15 07:38:16 Too many VNs.(
VsiName=Vpna,IpAaddr=1.1.1.1,PwId=200)
SRV6SID_NOT_ALLOCATED 04-15 07:38:16 SRv6 SID alloc failed.(VsiName=Vpna)
CONNECT_FAIL 04-15 07:38:16 The connection between l2vpn and l3vpn
failed. (ModeName=L3vpn)
AC_VIBRATE 04-15 07:38:16 AC flapping.(Minute=10,DataNum=20,
OscillationNum=30)
PW_VIBRATE 04-15 07:38:16 PW flapping.(Minute=10,DataNum=20,
OscillationNum=30)
COMMUNICATION_FAIL 04-15 07:38:16 RIB tunnel exception.(IpAddr=
10.1.1.2)
SMOOTH_SUCCESS 04-15 07:38:16 After l2vpn and ldp are smoothed,10 pwm
data are aged.(DataType=Ldp,Uismooth=10)
SMOOTH_EXCEED 04-15 07:38:16 L2vpn timed out for 60 minutes waiting for
ldp smooth end.(DataType=Ldp)
HA_RECOVER_FAIL 04-15 07:38:16 VSI vpna link ID HA recovery failed.
表1-11 diagnostic troubleshooting health module l2vpn命令显示信息描述表
字段 |
描述 |
Diag_Type |
健康度事件类型,取值包括: · LABEL_NOT_ALLOCATED:标签申请失败 · LINKID_NOT_ALLOCATED:linkid申请失败 · VN_EXCEED:VN超规格 · SRV6SID_NOT_ALLOCATED:SRv6 SID申请失败 · CONNECT_FAIL:建立连接失败 · COMMUNICATION_FAIL:通信失败 · HA_RECOVER_FAIL:从HA恢复失败 · SMOOTH_EXCEED:平滑超过60分钟 · SMOOTH_SUCCESS:平滑成功 · PW_VIBRATE:PW震荡 · AC_VIBRATE:AC震荡 |
Detect-Time |
发现异常的时间 |
Description |
健康度事件的详细描述 |
【相关命令】
· diagnostic troubleshooting health module l2vpn enable
diagnostic troubleshooting test l2vpn-pw establish-abnormal命令用来对PW建立失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test l2vpn-pw establish-abnormal { vsi vsi-name | xconnect-group-name group-name connection connection-name } peer ip-address pw-id pw-id
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
vsi vsi-name:对指定VSI内的PW建立失败事件进行一键诊断。vsi-name表示VSI的名称,为1~31个字符的字符串,区分大小写。
xconnect-group-name group-name connection connection-name:对指定交叉连接内的PW建立失败事件进行一键诊断。group-name表示交叉连接组的名称,为1~31个字符的字符串,区分大小写;connection-name表示交叉连接的名称,为1~20个字符的字符串,不能包含字符“-”,区分大小写。
peer ip-address:指定PW远端PE的LSR ID。ip-address表示为远端PE的LSR ID。
pw-id pw-id:指定PW的PW ID。pw-id为PW的PW ID,取值范围为1~4294967295。
【使用指导】
请先使用diagnostic troubleshooting test l2vpn-pw establish-abnormal enable命令,开启PW建立失败事件一键诊断功能,否则,本命令执行失败。
开启一键诊断功能并完成MPLS L2VPN配置后,MPLS L2VPN模块会将PW建立失败的运行数据记录到GOLD模块,以便GOLD模块对PW建立失败进行一键诊断。
记录PW建立失败的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS L2VPN模块的运行状态,可以关闭PW建立失败的一键诊断功能,减少对系统性能的影响。
【举例】
# 对VSI名称为vpna内的PW建立失败事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test l2vpn-pw establish-abnormal enable
[Sysname] diagnostic troubleshooting test l2vpn-pw establish-abnormal vsi vpna peer 1.1.1.9 pw-id 1
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait......................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
--------------------------------------------------------------------------------
Peer IP PW ID PW Type Reason(All need resolved)
1.1.1.9 1 vlan MTU not match
--------------------------------------------------------------------------------
表1-12 diagnostic troubleshooting test l2vpn-pw establish-abnormal命令显示信息描述表
字段 |
描述 |
Peer IP |
远端PE的IP地址 |
PW ID |
PW的标识 |
PW Type |
PW的数据封装类型,取值包括Ethernet、VLAN和“-”。“-”表示未指定PW的数据封装类型 |
Reason |
PW建立失败的原因,取值包括: · BFD session for PW down:用来检测PW的BFD会话状态为down · BGP RD was deleted:BGP的RD被删除 · BGP RD was empty:未配置BGP的RD · Control word not match:PW两端控制字功能配置不一致 · Encapsulation not match:PW两端封装类型不一致 · Label not allocated:标签未分配 · LDP interface parameter not match:PW两端接口LDP协商参数不一致 · Local and remote LDP PWs have different TAIIs:本端携带的SAII与对端携带的TAII不同 · Non-existent remote LDP PW:对端设备已删除LDP PW · Local AC Down:本地AC状态为down · Local AC was non-existent:未配置本地AC · Local LDP PW VN defect:本地LDP PW存在VN缺陷 · Local LDP PW was not sent mapping message:本端未发送LDP mapping消息 · Local VSI Down:本地VSI状态为down · MTU not match:PW两端MTU不一致 · Remote AC Down:对端AC状态down · Remote LDP PW VN defect:远端LDP PW存在VN缺陷 · PW down after created:创建PW后,PW的初始状态为down · Tunnel Down:承载PW的隧道down |
【相关命令】
· diagnostic troubleshooting test l2vpn-pw establish-abnormal enable
diagnostic troubleshooting test l2vpn-pw flap命令用来对PW震荡事件进行一键诊断。
【命令】
diagnostic troubleshooting test l2vpn-pw flap { vsi vsi-name | xconnect-group-name group-name connection connection-name } peer ip-address pw-id pw-id
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
vsi vsi-name:对指定VSI内的PW震荡事件进行一键诊断。vsi-name表示VSI的名称,为1~31个字符的字符串,区分大小写。
xconnect-group-name group-name connection connection-name:对指定交叉连接内的PW震荡事件进行一键诊断。group-name表示交叉连接组的名称,为1~31个字符的字符串,区分大小写;connection-name表示交叉连接的名称,为1~20个字符的字符串,不能包含字符“-”,区分大小写。
peer ip-address:指定PW远端PE的LSR ID。ip-address表示为远端PE的LSR ID。
pw-id pw-id:指定PW的PW ID。pw-id为PW的PW ID,取值范围为1~4294967295。
【使用指导】
请先使用diagnostic troubleshooting test l2vpn-pw flap enable命令,开启PW震荡事件一键诊断功能,否则,本命令执行失败。
开启一键诊断功能并完成MPLS L2VPN配置后,MPLS L2VPN模块会将PW震荡的运行数据记录到GOLD模块,以便GOLD模块对PW震荡进行一键诊断。
记录PW震荡的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS L2VPN模块的运行状态,可以关闭PW震荡的一键诊断功能,减少对系统性能的影响。
【举例】
# 对VSI名称为vpna内的PW震荡事件进行一键诊断。
<Sysname> system
[Sysname] diagnostic troubleshooting test l2vpn-vsi-pw flap vsi vpna peer 1.1.1.9 pw-id 1
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait......................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
----------------------------------------------------------------------------------------Peer IP PW ID PW type State Change time Reason
1.1.1.9 1 vlan Down->Up 2018/08/01 07:33:22 Tunnel Up
1.1.1.9 1 vlan Up->Down 2018/08/01 07:29:58 Tunnel Down
表1-13 diagnostic troubleshooting test l2vpn-pw flap命令显示信息描述表
字段 |
描述 |
Peer IP |
远端PE的IP地址 |
PW ID |
PW的标识 |
PW type |
PW的数据封装类型,取值包括Ethernet、VLAN、Unknown和“-”。“-”表示未指定PW的数据封装类型 |
State |
PW状态切换 |
Change time |
PW状态切换的时间 |
Reason |
PW震荡的原因,取值包括: · BFD session for PW down:用来检测PW的BFD会话状态为down · BGP RD was deleted:BGP的RD被删除 · BGP RD was empty:未配置BGP的RD · Control word not match:PW两端控制字功能配置不一致 · Encapsulation not match:PW两端封装类型不一致 · Label not allocated:标签未分配 · LDP interface parameter not match:PW两端接口LDP协商参数不一致 · Local and remote LDP PWs have different TAIIs:本端携带的SAII与对端携带的TAII不同 · Non-existent remote LDP PW:对端设备已删除LDP PW · Local AC Down:本地AC状态为down · Local AC was non-existent:未配置本地AC · Local LDP PW VN defect:本地LDP PW存在VN缺陷 · Local LDP PW was not sent mapping message:本端未发送LDP mapping消息 · Local VSI Down:本地VSI状态为down · MTU not match:PW两端MTU不一致 · Remote AC Down:对端AC状态down · Remote LDP PW VN defect:远端LDP PW存在VN缺陷 · PW down after created:创建PW后,PW的初始状态为down · Tunnel Down:承载PW的隧道down |
【相关命令】
· diagnostic troubleshooting test l2vpn-pw flap enable
diagnostic troubleshooting test ping failed-reason命令用来对Ping失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test ping failed-reason [ -a source-ip | -f | -i interface-type interface-number | -s packet-size | -t timeout ] [ vpn-instance vpn-instance-name ] { ip-address ipv4-address | ipv6-address ipv6-address }
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
-a source-ip:指定ICMP回显请求(ECHO-REQUEST)报文的源IP地址。该地址必须是设备上已配置的IP地址。不指定该参数时,ICMP回显请求报文的源IP地址是该报文出接口的主IP地址。
-f:将长度大于出接口MTU的报文直接丢弃,即不允许对发送的ICMP回显请求报文进行分片。
-i interface-type interface-number:指定发送ICMP回显请求报文的接口的类型和编号。不指定该参数时,将根据目的IP查找路由表或者转发表来确定发送ICMP回显请求报文的接口。
-s packet-size:指定发送的ICMP回显请求报文的长度(不包括IP和ICMP报文头),取值范围为20~9600,单位为字节,缺省值为56。
-t timeout:指定ICMP回显应答(ECHO-REPLY)报文的超时时间,发送ICMP回显请求报文timeout时长后还没有收到ICMP回显应答报文,源端则认为ICMP回显应答报文超时。取值范围为0~65535,单位为毫秒,缺省值为2000。
vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。
ip-address ipv4-address:对目的地址为指定地址的IPv4 Trap报文进行一键诊断。ipv4-address表示IPv4地址。
ipv6-address ipv6-address:对目的地址为指定地址的IPv6 Trap报文进行一键诊断。ipv4-address表示IPv6地址。
【使用指导】
执行本命令时,设备会使用命令行中指定的参数,Ping指定的IP地址,并显示Ping结果。如果Ping失败,还会显示失败原因,帮助用户定位Ping失败的问题。
Ping相关介绍请参见“网络管理和监控配置指导”中的“Ping和Tracert”。
请先使用diagnostic troubleshooting test ping failed-reason enable命令,开启Ping失败事件一键诊断功能,否则,本命令执行失败。(Ping失败事件一键诊断功能缺省处于开启状态。)
【举例】
# 对目的地址2.1.1.1进行Ping一键诊断,Ping报文出接口为Gigabitethernet1/0/1。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test ping fail-reason –i gigabitethernet 1/0/1 ip 2.1.1.1
Diagnosis report:
Ping failed.
Failure reason: An incorrect outgoing interface was specified.
# 对目的地址1.1.1.1进行Ping一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test ping fail-reason ip-address 1.1.1.1
Diagnosis report:
Ping succeeded.
表1-14 diagnostic troubleshooting test ping fail-reason命令诊断报告描述表
字段 |
描述 |
Diagnosis report |
诊断报告 |
Ping succeeded |
Ping成功 |
Ping failed |
Ping失败 |
Failure reason |
Ping失败的原因,取值请参见表1-15 |
表1-15 Ping失败原因描述表
字段 |
描述 |
The link transmission delay is too long. |
链路传输时延过长 |
The ping packet is too large and discarded. |
Ping报文过大而被丢弃 |
An incorrect outgoing interface was specified. |
指定了错误的出接口,出接口没有到达目的地的链路 |
No reachable routes exist between the source and destination IPs. |
源IP和目的IP之间没有可到达的路由 |
The specified destination VPN is incorrect. |
指定的目的端VPN不正确 |
No APR entry to the destination exists. |
不存在到达目的端的ARP表项 |
No FIB entry to the destination exists. |
不存在到达目的端的FIB表项 |
ICMP packets are discarded due to ICMP attack defense. |
因为ICMP防攻击功能导致ICMP报文被丢弃 |
Unknown reason. |
未知原因 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test snmp-agent packet-process-failure命令用来对SNMP报文处理失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test snmp-agent packet-process-failure [ ip-address ipv4-address | ipv6-address ipv6-address ] [ vpn-instance vpn-instance-name ] [ diagnose-time diagnostic-time ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
ip-address ipv4-address:表示IPv4地址。对于设备收到的SNMP报文,该地址用来过滤SNMP报文的源地址;对于设备发送的SNMP报文,该地址用来过滤SNMP报文的目的地址。
ipv6-address ipv6-address:表示IPv6地址。对于设备收到的SNMP报文,该地址用来过滤SNMP报文的源地址;对于设备发送的SNMP报文,该地址用来过滤SNMP报文的目的地址。
vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。
diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为60~1800,单位为秒,缺省值为300。本参数为诊断预计持续的时间,如果业务模块在该时间内未收集到足够多的数据,则诊断实际需要的时间可能比该时间稍长,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time。
【使用指导】
执行本命令后,设备会记录诊断持续时间内,SNMP发送以及接收失败的报文的信息。待诊断持续时间到达时,汇总并显示这些记录信息,帮助用户定位SNMP报文处理失败的问题。
SNMP功能的基本配置请参见“网络管理和监控配置指导”中的“SNMP”。
请先使用diagnostic troubleshooting test snmp-agent packet-process-failure enable命令,开启SNMP报文处理失败事件一键诊断功能,否则,本命令执行失败。(SNMP报文处理失败事件一键诊断功能缺省处于开启状态。)
【举例】
# 对SNMP报文处理失败事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test snmp-agent packet-process-failure ip-address 1.1.1.1
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait.....................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
SNMP global statistics
SNMP packets received: 4
SNMP packets sent: 4
Receiving failure detailed information:
RecvTime : 2022-06-07, 15:20:38:230
ReqID : 0
SourceIP/VPN : 10.1.1.1/--
Verison/PDU type: v3/--
FailReason : Unknown user name.
Solution : Please check the corresponding configuration.
RecvTime : 2022-06-07, 15:20:38:230
ReqID : 0
SourceIP/VPN : 10.1.1.1/--
Verison/PDU type: v3/--
FailReason : Unknown username.
Solution : Please check the corresponding configuration.
RecvTime : 2022-06-07, 15:20:38:230
ReqID : 0
SourceIP/VPN : 10.1.1.1/--
Verison/PDU type: v3/--
FailReason : Unknown username.
Solution : Please check the corresponding configuration.
Sending failure detailed information:
SendTime : 2022-06-10, 19:30:35:288
ReqID : 1683
DestIP/VPN : 10.1.1.15/vpn1
Verison/PDU type : v3/--
FailReason : SNMP PDUs had OuttooBig error-status.
Solution : Please check the corresponding configuration.
SendTime : 2022-06-10, 19:30:35:288
ReqID : 1683
DestIP/VPN : 10.1.1.15/vpn1
Verison/PDU type : v3/--
FailReason : SNMP PDUs had OuttooBig error-status.
Solution : Please check the corresponding configuration.
表1-16 diagnostic troubleshooting test snmp-agent packet-process-failure命令显示信息描述表
字段 |
描述 |
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds. Please wait..................... Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds. |
一键诊断开始的时间,诊断预计需要花费的时间 (诊断进行中)请等待…… 一键诊断结束的时间,诊断实际花费的时间 |
Diagnosis report |
诊断报告 |
SNMP global statistics |
SNMP全局统计信息 |
SNMP packets received |
诊断时间内SNMP接收到的报文数量 |
SNMP packets sent |
诊断时间内SNMP发送出去的报文数量 |
Receiving failure detailed information |
SNMP报文接收失败信息记录 |
Sending failure detailed information |
SNMP报文发送失败信息记录 |
RecvTime |
SNMP报文接收时的系统时间 |
SendTime |
SNMP报文发送时的系统时间 |
ReqID |
SNMP报文中携带的Request ID |
SourceIP/VPN |
设备接收的SNMP报文中的源IP地址/VPN信息 |
DestIP/VPN |
设备发送的SNMP报文中的目的IP地址/VPN信息 |
FailReason |
SNMP报文处理失败原因,取值请参见表1-17 |
Solution |
针对该失败原因,提出的建议解决方案,取值为: Please check the corresponding configuration:请检查对应的配置 |
表1-17 SNMP报文处理失败原因列表
字段 |
描述 |
Unknown securitymodel |
未知的安全模式 |
Invalid messages |
无效的消息 |
Unknown PDU handlers |
未知的报文 |
Unsupported security level |
不支持的安全等级 |
Message is not in the time window |
消息不在时间窗口内 |
Unknown username |
未知的用户名 |
Unknown engine IDs |
未知的引擎号 |
Wrong digests |
错误的摘要信息 |
Decryption error |
解密错误 |
Unsupported version |
不支持的版本 |
ASN.1 or BER errors in the process of decoding |
在解码过程中发生ASN.1(Abstract Syntax Notation dot one,抽象记法1)或BER(Basic Encoding Rules,基本编码规则)错误 |
Unknown SNMP community name |
未知的SNMP团体名 |
Operation not supported by the community |
团体不支持的非法操作 |
SNMP PDUs had an IntooBig error |
SNMP报文有IntooBig错误 |
SNMP PDUs had an InnoSuchName error |
SNMP报文有noSuchName错误 |
SNMP PDUs had an InBadValue error |
SNMP报文有InBadValue错误 |
SNMP PDUs had an IngenErr error |
SNMP报文有IngenErr错误 |
SNMP PDUs had an OuttooBig erro |
SNMP报文有OuttooBig错误 |
SNMP PDUs had an OutnoSuchName error |
SNMP报文有OutnoSuchName错误 |
SNMP PDUs had an OutBadValue error |
SNMP报文有OutBadValue错误 |
SNMP PDUs had an OutgenErr error |
SNMP报文有OutgenErr错误 |
Alternate response class PDUs dropped silently |
响应报文被静默丢弃 |
Forwarded confirmed class PDUs dropped silently |
数据转发报文被静默丢弃 |
Unavailable contexts |
不可用的上下文内容 |
Unknown contexts |
未知的上下文内容 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test snmp-agent packet-process-time命令用来对SNMP报文处理耗时事件进行一键诊断。
【命令】
diagnostic troubleshooting test snmp-agent packet-process-time [ ip-address ipv4-address | ipv6-address ipv6-address ] [ vpn-instance vpn-instance-name ] [ diagnose-time diagnostic-time ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
ip-address ipv4-address:表示IPv4地址,收到的IPv4 SNMP报文中的源地址。
ipv6-address ipv6-address:表示IPv6地址,收到的IPv6 SNMP报文中的源地址。
vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。
diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为60~1800,单位为秒,缺省值为300。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time。
【使用指导】
执行本命令后,设备会记录诊断持续时间内,SNMP处理每个报文需要的时间信息。待诊断持续时间到达时,汇总并显示这些记录信息,帮助用户定位SNMP报文处理耗时过长的问题。
SNMP功能的基本配置请参见“网络管理和监控配置指导”中的“SNMP”。
请先使用diagnostic troubleshooting test snmp-agent packet-process-time enable命令,开启SNMP报文处理耗时事件一键诊断功能,否则,本命令执行失败。(SNMP报文处理耗时事件一键诊断功能缺省处于开启状态。)
【举例】
# 对SNMP报文处理耗时事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting snmp-agent packet-process-time
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.
Please wait......................
Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.
Diagnosis report:
SNMP global statistics
SNMP packets received : 2
RecvTime : 2022-06-08, 09:07:20:568
ReqID : 1121
SourceIP/VPN : 10.1.1.1/-
Version/PDU type: v2c/get-next
SNMPTime (ms) : 0
APPTime (ms) : 0
TotalTime (ms) : 0
VBNum : 3
VB : sysUpTime.0(1.3.6.1.2.1.1.3.0)=1008561, sysName.0(1.3.6.1.2.1.1.5.0)=Sysname, sysServices.0(1.3.6.1.2.1.1.7.0)=86
RecvTime : 2022-06-08, 10:25:20:568
ReqID : 1650
SourceIP/VPN : 10.1.1.5/-
Version/PDU type: v1/get-next
SnmpTime(ms) : 0
AppTime(ms) : 0
TotalTime(ms) : 0
VBNum : 3
VB : sysUpTime.0(1.3.6.1.2.1.1.3.0)=100881, sysName.0(1.3.6.1.2.1.1.5.0)=Sysname, sysServices.0(1.3.6.1.2.1.1.7.0)=65
表1-18 diagnostic troubleshooting test snmp-agent packet-process-time命令显示信息描述表
字段 |
描述 |
Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds. Please wait...................... Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds. |
一键诊断开始的时间,诊断预计需要花费的时间 (诊断进行中)请等待…… 一键诊断结束的时间,诊断实际花费的时间 |
Diagnosis report |
诊断报告 |
SNMP global statistics |
SNMP全局统计信息 |
SNMP packets received |
诊断时间内SNMP接收到的报文数量 |
RecvTime |
SNMP报文接收时的系统时间 |
ReqID |
SNMP报文中携带的Request ID |
SourceIP/VPN |
SNMP报文中的源IP地址/VPN信息 |
Version/PDU type |
SNMP报文中的版本号/操作类型 |
SNMPTime (ms) |
SNMP插件处理耗时,单位是毫秒 |
APPTime (ms) |
SNMP进程处理耗时,单位是毫秒 |
TotalTime (ms) |
SNMP报文处理总耗时时间,单位是毫秒 |
VBNum |
SNMP报文携带的绑定变量个数 |
VB |
SNMP报文携带的绑定变量内容,最多显示8个 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test snmp-agent trap-send-failure命令用来对SNMP Trap发送失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test snmp-agent trap-send-failure [ ip-address ipv4-address | ipv6-address ipv6-address ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
ip-address ipv4-address:表示IPv4地址,对目的地址为指定地址的IPv4 Trap报文进行一键诊断。
ipv6-address ipv6-address:表示IPv6地址,对目的地址为指定地址的IPv6 Trap报文进行一键诊断。
【使用指导】
开启SNMP Trap发送失败事件一键诊断功能后,当SNMP Trap发送失败,SNMP会将Trap发送失败事件的相关信息记录下来。执行本命令时,设备会显示这些记录的信息,帮助用户定位SNMP Trap发送失败的问题。
SNMP Trap相关配置请参见“网络管理和监控配置指导”中的“SNMP”。
请先使用diagnostic troubleshooting test snmp-agent trap-send-failure enable命令,开启SNMP Trap发送失败事件一键诊断功能,否则,本命令执行失败。(SNMP Trap发送失败事件一键诊断功能缺省处于开启状态。)
【举例】
# 查看SNMP Trap发送失败的统计信息。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test snmp-agent trap-send-failure
Trap name: coldStart
Target host:
Host 1:
IP address : 192.168.1.1
SendTime : 2022-06-08 15:50:31:296
SecurityName : abc
Version : v3
VBNum : 2
VB : sysUpTime.0=286976,snmpTrapOID.0=1.3.6.1.6.3.1.1.5.1
Host 2:
IP address : 192.168.1.35
SendTime : 2022-06-08 15:55:32:368
SecurityName : def
Version : v2c
VBNum : 2
VB : sysUpTime.0=365898, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.1
Trap name : warmStart
Target host:
Host 1:
IP address : 192.168.1.1
SendTime : 2022-06-08 15:55:36:259
SecurityName : abc
Version : v2c
VBNum : 2
VB : sysUpTime.0=687682, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.2
Host 2:
IP address : 192.168.1.35
SendTime : 2022-06-08 16:15:12:566
SecurityName : def
Version : v3
VBNum : 2
VB : sysUpTime.0=351528, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.2
表1-19 diagnostic troubleshooting test snmp-agent trap-send-failure命令显示信息描述表
字段 |
描述 |
Trap Name |
Trap的名字 |
Target host |
接受SNMP Trap的设备的信息 |
Host[n] |
接收Trap的目的主机的信息,n表示目的主机信息的编号 |
IP address |
目的主机IP地址 |
SendTime |
发送trap时的系统时间 |
Securityname |
SNMP报文中的安全字 |
Version |
SNMP报文中的版本号 |
Version/PDU type |
SNMP报文中的版本号/操作类型 |
VBNum |
SNMP报文携带的绑定变量个数 |
VB |
SNMP报文携带的绑定变量内容,最多显示8个 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting health module bgp命令用来为BGP模块执行一次健康度诊断。
【命令】
diagnostic troubleshooting health module bgp
【视图】
系统视图
【缺省用户角色】
network-admin
【使用指导】
请先使用diagnostic troubleshooting health module bgp enable命令,开启BGP模块的健康度一键诊断功能,否则,本命令执行失败。(缺省情况下,BGP模块的健康度一键诊断功能处于开启状态)
本命令用来诊断BGP模块当前的运行状态是否健康。执行本命令后,终端会显示BGP模块的不健康信息,包括不健康信息记录的时间、不健康的类型以及造成不健康的原因,供用户查看。
系统正在执行一个模块的健康度诊断时,不允许同时执行其他模块的健康度诊断。
【举例】
# 查看BGP模块的健康度信息。
<Sysname> system-view
[Sysname] diagnostic troubleshooting health module bgp
Start diagnose at 2022-11-21 08:08:44
please wait.Done.
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.
PADS_Type Time Reason
OPEN_ERROR 01-27 20:23:30 wrong AS number(Instance=bgp1, peer=1.1.1.1, VPN
instance=vpn1)
HEADER_ERROR 01-27 20:23:30 bad message length(Instance=bgp1, peer=2.1.1.1,
VPN instance=vpn1)
表1-20 diagnostic troubleshooting health module bgp命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44 |
开始健康度诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒 |
please wait.Done. |
健康度诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束健康度诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及健康度诊断持续的实际时间 |
PADS_Type |
模块不健康的类型,包括: · HEADER_ERROR:接收的BGP消息头错误 · OPEN_ERROR:接收的Open消息错误 · UPDATE_ERROR:接收的Update消息错误 · FSM_ERROR:BGP状态机错误 · SESSION_CEASE:BGP会话中止 |
Time |
记录BGP模块不健康信息的时间 |
Reason |
BGP模块不健康的原因,以及造成该原因的BGP会话信息。会话信息的格式为(Instance=instance, peer=peer, VPN instance=instance-name)。instance表示BGP会话所属BGP实例;peer表示BGP会话的对等体IP地址;instance-name表示BGP会话所属VPN实例,BGP会话处于公网时,instance-name显示为空;reason包括: · HEADER_ERROR类型对应的不健康原因: ¡ invalid Marker field:BGP消息头中的Marker字段不为全f ¡ bad message length:BGP消息头长度过长或过短 ¡ bad message type:BGP消息头的类型错误 · OPEN_ERROR类型对应的不健康原因: ¡ version unsupported:BGP版本不支持 ¡ wrong AS number:BGP对等体的AS号错误 ¡ BGP identifier conflicted:对端的Router ID与本端的Router ID相同导致冲突 ¡ unsupported optional parameter:不支持的可选参数 ¡ authentication failure:BGP会话的安全认证失败 ¡ unacceptable hold time:Open消息中携带的会话保持时间不是协商后的时间 ¡ unsupported capability type:可选参数中的capability类型不支持 · UPDATE_ERROR类型对应的不健康原因: ¡ malformed attribute list:属性列表格式错误 ¡ unrecognized well known attribute:对等体发送的Update消息中携带不支持的公认属性 ¡ well known attribute missing:对等体发送的Update消息中缺少必须的公认属性 ¡ attribute flags error:对等体发送的Update消息中携带的路由属性标志错误 ¡ attribute length error:对等体发送的Update消息中携带的路由属性长度错误 ¡ invalid NEXT HOP Attribute:对等体发送的Update消息中携带无效的下一跳属性 ¡ optional attribute error:对等体发送的Update消息中携带的可选属性错误 ¡ invalid destination network:对等体发送的Update消息中携带错误的目的网络地址 ¡ malformed AS path attribute:对等体发送的Update消息中AS路径属性的形式错误 · FSM_ERROR类型对应的不健康原因: ¡ receive unexpected message in OpenSent state:BGP会话处于OpenSent状态时,本端设备收到了不应收到的消息类型 ¡ receive unexpected message in OpenConfirm state:BGP会话处于OpenConfirm状态时,本端设备收到了不应收到的消息类型 ¡ receive unexpected message in Established state:BGP会话处于Established状态时,本端设备收到了不应收到的消息类型 · SESSION_CEASE类型对应的不健康原因: ¡ maximum number of prefixes reached:从对等体接收到的路由数量超过了可以接收的最大数量 ¡ administrative shutdown:手工复位了本端设备与BGP对等体的会话 ¡ address family deleted:BGP会话所在的地址族被删除 ¡ administrative reset:手工复位了本端设备与所有BGP对等体的会话 ¡ connection rejected:BGP会话连接被拒绝 ¡ other configuration change:其他配置变化 ¡ connection collision resolution:BGP会话连接冲突 ¡ insufficient of resources:系统资源不足 |
【相关命令】
· diagnostic troubleshooting health enable
diagnostic troubleshooting test establish-abnormal bgp命令用来对指定实例下所有BGP会话建立失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test establish-abnormal bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话建立失败事件进行一键诊断。
vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话建立失败事件进行一键诊断。
【使用指导】
请先使用diagnostic troubleshooting test establish-abnormal bgp enable命令,开启BGP会话建立失败事件一键诊断功能,否则,本命令执行失败。(BGP会话建立失败事件一键诊断功能缺省处于开启状态)
BGP会话建立失败事件一键诊断功能处于开启状态时,设备会自动将BGP会话建立失败的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话建立失败诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话建立失败的原因。
有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。
系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。
【举例】
# 对default实例下的所有公网对等体进行BGP会话建立失败事件一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test peer-establish-abnormal bgp
Start diagnose at 2022-11-21 08:08:44
please wait.Done.
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.
BGP local router ID: 10.1.1.1
IPv4-family for VPN instance vpn1:
Peer Time State Reason
1.1.1.1 01-27 20:23:30 OpenConfirm memory threshold was reached
2.1.1.1 01-27 20:23:30 OpenConfirm bad message head
表1-21 diagnostic troubleshooting test peer-establish-abnormal bgp命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44 |
开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒 |
please wait.Done. |
一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间 |
BGP local router ID |
本地的路由器ID |
IPv4-family for public |
公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv6-family for public |
公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv4-family for VPN instance vpn-instance-name |
VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
IPv6-family for VPN instance vpn-instance-name |
VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
Peer |
对等体的IP地址 |
Time |
BGP会话建立失败的时间。格式为MM-DD hh:mm:ss,其中MM为月、DD为日、hh为小时、mm为分钟、ss为秒 |
State |
发生BGP会话建立失败事件时,BGP会话所处的状态 |
Reason |
BGP会话建立失败的原因,包括: · router ID missing:Router ID缺失 · memory threshold was reached:系统内存达到门限 · peer limit was reached:BGP对等体的数量超过限制 · peer not exist:指定的对等体不存在 · direct EBGP session source interface check failed:不存在与直连EBGP对等体建立连接的UP状态物理接口 · source interface update failed upon TCP reconnection:重新建立TCP连接时,TCP连接的源接口更新失败 · TCP connection-socket bind failed:TCP连接绑定套接字失败 · TCP connection failed:TCP连接失败 · TCP connection info not exist:BGP会话的TCP连接信息不存在 · send buffer full:BGP会话发送缓冲区已满 · bad message head:本地设备收到无效的BGP消息头 · bad message length:本地设备接收的BGP消息长度无效 · bad message type:本地设备接收的BGP消息类型无效 · received messages not matching the FSM state:收到了与当前BGP会话状态不对应的报文 · inconsistent BGP version or holdtime:对等体的BGP版本或者会话保持时间与本端不一致 · failed to parse optional parameters in open message:BGP Open消息中的可选参数解析失败 · not enabled peer in correct address family:对等体没有在正确的地址族下使能 · inconsistent AS number:对端设备的AS号与本端指定的对等体AS号不一致 · conflicting router id:对等体的Router ID与本端设备发送冲突 · keepalive message sending failed:Keepalive消息发送失败 · failed to obtain TCP connection info in openconfirm state:在Openconfim状态下获取TCP连接的信息失败 · failed to create keepalive timer:Keepalive消息定时器创建失败 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test flap bgp命令用来对指定实例下所有BGP对等体的会话断开事件进行一键诊断。
【命令】
diagnostic troubleshooting test flap bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话断开事件进行一键诊断。
vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话断开事件进行一键诊断。
【使用指导】
请先使用diagnostic troubleshooting test flap bgp enable命令,开启BGP会话断开事件一键诊断功能,否则,本命令执行失败。(BGP会话断开事件一键诊断功能缺省处于开启状态)
BGP会话断开事件一键诊断功能处于开启状态时,设备会自动将BGP会话断开的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话断开诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话断开的原因。
有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。
系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。
【举例】
# 对default实例下所有公网BGP对等体的断开事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test flap bgp
Start diagnose at 2022-11-21 08:08:44
please wait.Done.
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.
BGP local router ID: 10.1.1.1
IPv4-family for VPN instance vpn1:
Peer Time State Reason
1.1.1.1 01-27 20:23:30 Established->Idle address family deleted
表1-22 diagnostic troubleshooting test peer-flap bgp命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44 |
开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒 |
please wait.Done. |
一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间 |
BGP local router ID |
本地的路由器ID |
IPv4-family for public |
公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv6-family for public |
公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv4-family for VPN instance vpn-instance-name |
VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
IPv6-family for VPN instance vpn-instance-name |
VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
Peer |
对等体的IP地址 |
Time |
BGP会话断开的时间。格式为MM-DD hh:mm:ss,其中MM为月、DD为日、hh为小时、mm为分钟、ss为秒 |
State |
BGP会话断开后,BGP会话的状态变化 |
Reason |
BGP会话断开的原因,包括: · connection not synchronized:连接不同步,目前实现为收到的BGP消息头前16字节不全为F · bad message length:本地设备接收到的BGP消息长度无效 · bad message type:本地设备接收到的BGP消息类型无效 · withdrawn message too long:Update撤销消息的长度过长 · route attribute length too long:Update消息中携带的路由属性长度过长 · route attribute appears multiple times:同一路由属性在同一Update消息中出现了多次 · route attribute length field shorter than 2 bytes:在Update消息中,描述路由属性长度的字段不足2字节 · extended attribute length field shorter than 2 bytes:在Update消息中,路由属性的长度可扩展,但描述路由属性长度的字段不足2字节 · attribute length field shorter than 1 byte:在Update消息中,路由属性的长度为正常长度,但描述路由属性长度的字段不足1字节 · link-state attribute error:Update消息中的链路状态属性形式错误 · unrecognized well-known attribute:Update消息中携带本端不支持的公认属性 · attribute-type attribute missed:Update消息中必须携带的路由属性丢失,attribute-type表示丢失的路由属性,取值包括: ¡ ORIGIN:源属性 ¡ AS_PATH:AS路径属性 ¡ LOCAL_PREF:本地优先级属性 ¡ NEXT_HOP:下一跳属性 · attribute flags error:Update消息中携带的路由属性标志位错误 · attribute-type attribute length error:Update消息中携带的路由属性长度错误,attribute-type表示长度错误的路由属性,取值包括: ¡ AS_PATH:包含2字节AS号的AS路径属性 ¡ AS4_PATH:包含4字节AS号的AS路径属性 ¡ CLUSTER_LIST:集群ID列表属性 ¡ AGGREGATOR:包含2字节AS号的聚合者属性 ¡ AS4_AGGREGATOR:包含4字节AS号的聚合者属性 ¡ ORIGIN:源属性 ¡ NEXT_HOP:下一跳属性 ¡ MED:多出口区分属性 ¡ LOCAL_PREF:本地优先级属性 ¡ ATOMIC_AGGREGATE:原子聚合属性 ¡ ORIGINATOR_ID:起源者ID属性 ¡ MP_REACH_NLRI:多协议可达NLRI属性 ¡ COMMUNITY:团体属性 ¡ EXT-COMMUNITY:扩展团体属性 · attribute length exceeded the limit:Update消息中携带的路由属性长度超出限制 · invalid ORIGIN attribute:Update消息中携带的源属性无效 · invalid NEXT_HOP attribute:Update消息中携带的下一跳属性无效 · invalid next hop length in MP_REACH_NLRI (address-family):在Update消息中,MP_REACH_NLRI属性的下一跳长度错误,address-family为发生下一跳长度错误的MP_REACH_NLRI属性所属的地址族,取值包括: ¡ 4u:IPv4单播地址族 ¡ MPLS:MPLS地址族 ¡ VPNv4:VPNv4地址族 ¡ 6u:IPv6单播地址族 ¡ VPNv6:VPNv6地址族 ¡ L2VPN:L2VPN地址族 · the length of MP_UNREACH_NLRI attribute is less than 3 bytes:Update消息中携带的MP_UNREACH_NLRI属性长度小于3字节 · the length of MP_REACH_NLRI or MP_UNREACH_NLRI attribute exceeds the limit:Update消息中携带的MP_REACH_NLRI 或MP_UNREACH_NLRI属性长度超过限制 · erroneous MP_REACH_NLRI or MP_UNREACH_NLRI attribute end position:Update消息中携带的MP_REACH_NLRI或MP_UNREACH_NLRI属性结束位置错误 · invalid network field:目的网络地址字段无效 · malformed AS_PATH:AS路径属性形式错误 · hold timer expiration caused by local device:由本端设备造成的会话保持定时器超时 · hold timer expiration caused by peer device:由对端设备造成的会话保持定时器超时 · connect retry timer expired:会话重建定时器超时 · TCP_CR_Acked event received:收到了TCP_CR_Acked事件 · TCP_Connection_Confirmed event received:收到了TCP_Connection_Confirmed事件 · open message received:收到Open消息 · manualstop event received:收到manualstop事件 · physical interface configuration changed:物理接口配置改变 · BFD session down event received:收到BFD会话DOWN事件,BGP也断开相应的BGP会话 · physical interface configuration changed:物理接口配置改变 · maximum number of prefixes reached:从对等体收到的路由数量超过peer route-limit命令配置的最大数量 · maximum number of prefixes reached in address-family:在指定地址族内,从对等提接收到的路由数量超过peer route-limit命令配置的最大数量,address-family为地址族名称,取值包括: ¡ IPv4 unicast:BGP IPv4单播地址族 ¡ IPv6 unicast:BGP IPv6单播地址族 ¡ VPNv4:BGP VPNv4地址族 ¡ VPNv6:BGP VPNv6地址族 ¡ The peer is configured with the peer ignore command:指定对等体配置了peer ignore命令来禁止与该对等体建立会话 · address family deleted:建立BGP会话的地址族被删除 · peer disabled:禁止本端设备与对等体交换路由信息 · administrative reset:复位BGP会话或者BGP会话相关的配置改变导致BGP会话重新建立 · connection rejected:TCP连接被对端拒绝 · other configuration change:其他对等体的配置变化导致本端设备与当前对等体的会话断开 · connection collision resolution:连接冲突 · two connections exist and one uses MD5:存在两个连接,且其中一个配置了MD5认证 · no memory to parse the attribute:解析路由属性时系统内存不足 · no memory for the route:生成路由或者标签块信息时,获取不到内存 · no memory to generate unreachable NLRI:封装不可达NLRI属性时申请不到内存 · no memory for message encapsulation:封装BGP消息时申请不到内存 · can’t get the VPN RD:解析前缀时获取不到RD · can’t get the VPN routing table:解析前缀时获取不到VPN路由表 · can’t get the attributes:解析前缀时获取不到路由属性 · entered severe memory state:进入二级门限告警 · entered critical memory state:进入三级门限告警 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test peer-establish-abnormal bgp命令用来对指定对等体的BGP会话建立失败事件进行一键诊断。
【命令】
diagnostic troubleshooting test peer-establish-abnormal bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ] peer { ip-address ipv4-address | ipv6-address ipv6-address } [ diagnostic-time diagnostic-time ]
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话建立失败事件进行一键诊断。
vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话建立失败事件进行一键诊断。
peer ip-address ipv4-address:对指定对等体的BGP会话建立失败事件进行一键诊断,ipv4-address为对等体的IPv4地址。
peer ipv6-address ipv6-address:对指定对等体的BGP会话建立失败事件进行一键诊断,ipv6-address为对等体的IPv6地址。
diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为1~60,单位为秒,缺省值为30。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2×diagnostic-time。
【使用指导】
请先使用diagnostic troubleshooting test peer-establish-abnormal bgp enable命令,开启BGP会话建立失败事件一键诊断功能,否则,本命令执行失败。(BGP会话建立失败事件一键诊断功能缺省处于开启状态)
执行本命令后,设备会在指定的诊断持续时间内,重新尝试与未能成功建立BGP会话的对等体建立连接,并记录和显示在持续时间内BGP会话建立失败的诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话建立失败的原因。
系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。
【举例】
# 对default实例下的公网对等体1.1.1.1进行BGP会话建立失败事件一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test peer-establish-abnormal bgp peer ip-address 1.1.1.1 diagnostic-time 20
Start diagnose at 2022-11-21 08:08:44, Estimated time:20 seconds.
please wait.....................Done.
End diagnose at 2022-11-21 08:09:05,Actual time:21 seconds.
Diagnosis report:
BGP local router ID: 10.1.1.1
IPv4-family for VPN instance vpn1:
Peer Time State Reason
1.1.1.1 01-27 20:23:30 OpenConfirm memory threshold was reached
表1-23 diagnostic troubleshooting test peer-establish-abnormal bgp peer命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44, Estimated time:20 seconds. |
开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒。以及一键诊断预计的持续时间 |
please wait.....Done. |
一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒。以及一键诊断持续的实际时间 |
Diagnosis report |
诊断报告 |
BGP local router ID |
本地的路由器ID |
IPv4-family for public |
公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv6-family for public |
公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv4-family for VPN instance vpn-instance-name |
VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
IPv6-family for VPN instance vpn-instance-name |
VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
Peer |
对等体的IP地址 |
Time |
BGP会话建立失败的时间。格式为MM-DD hh:mm:ss,其中MM为月,DD为日,hh为小时,mm为分钟,ss为秒 |
State |
发生BGP会话建立失败事件时,BGP会话所处的状态 |
Reason |
BGP会话建立失败的原因,包括: · router ID missing:Router ID缺失 · memory threshold was reached:系统内存达到门限 · peer limit was reached:BGP对等体的数量超过限制 · session not exist:指定的对等体不存在 · direct EBGP session source interface check failed:不存在与直连EBGP对等体建立连接的UP状态物理接口 · source interface update failed upon TCP reconnection:重新建立TCP连接时,TCP连接的源接口更新失败 · TCP connection-socket bind failed:TCP连接绑定套接字失败 · TCP connection failed:TCP连接失败 · TCP connection info not exist:BGP会话的TCP连接信息不存在 · send buffer full:BGP会话发送缓冲区已满 · bad message head:本地设备收到无效的BGP消息头 · bad message length:本地设备接收的BGP消息长度无效 · bad message type:本地设备接收的BGP消息类型无效 · received messages not matching the FSM state:收到了与当前BGP会话状态不对应的报文 · inconsistent BGP version or holdtime:对等体的BGP版本或者会话保持时间与本端不一致 · failed to parse optional parameters in open message:BGP Open消息中的可选参数解析失败 · not enabled peer in correct address family:对等体没有在正确的地址族下使能 · inconsistent AS number:对端设备的AS号与本端指定的对等体AS号不一致 · conflicting router id:对等体的Router ID与本端设备发送冲突 · keepalive message sending failed:Keepalive消息发送失败 · failed to obtain TCP connection info in openconfirm state:在Openconfim状态下获取TCP连接的信息失败 · failed to create keepalive timer:Keepalive消息定时器创建失败 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test peer-flap bgp命令用来对指定BGP对等体的会话断开事件进行一键诊断。
【命令】
diagnostic troubleshooting test peer-flap bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ] peer { ip-address ipv4-address | ipv6-address ipv6-address }
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话断开事件进行一键诊断。
vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话断开事件进行一键诊断。
peer ip-address ipv4-address:对指定对等体的BGP会话断开事件进行一键诊断,ipv4-address为对等体的IPv4地址。
peer ipv6-address ipv6-address:对指定对等体的BGP会话断开事件进行一键诊断,ipv6-address为对等体的IPv6地址。
【使用指导】
请先使用diagnostic troubleshooting test peer-flap bgp enable命令,开启BGP会话断开事件一键诊断功能,否则,本命令执行失败。(BGP会话断开事件一键诊断功能缺省处于开启状态)
BGP会话断开事件一键诊断功能处于开启状态时,设备会自动将BGP会话断开的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话断开诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话断开的原因。
有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。
系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。
【举例】
# 对default实例下公网BGP对等体1.1.1.1进行断开事件的一键诊断。
<Sysname> system-view
[Sysname] diagnostic troubleshooting test peer-flap bgp peer ip-address 1.1.1.1
Start diagnose at 2022-11-21 08:08:44
please wait.Done.
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.
BGP local router ID: 10.1.1.1
IPv4-family for VPN instance vpn1:
Peer Time State Reason
1.1.1.1 01-27 20:23:30 Established->Idle address family deleted
表1-24 diagnostic troubleshooting test peer-flap bgp命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44 |
开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒 |
please wait.Done. |
一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间 |
BGP local router ID |
本地的路由器ID |
IPv4-family for public |
公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv6-family for public |
公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息 |
IPv4-family for VPN instance vpn-instance-name |
VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
IPv6-family for VPN instance vpn-instance-name |
VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称 |
Peer |
对等体的IP地址 |
Time |
BGP会话断开的时间。格式为MM-DD hh:mm:ss,其中MM为月,DD为日,hh为小时,mm为分钟,ss为秒 |
State |
BGP会话断开后,BGP会话的状态变化 |
Reason |
BGP会话断开的原因,包括: · connection not synchronized:连接不同步,目前实现为收到的BGP消息头前16字节不全为F · bad message length:本地设备接收到的BGP消息长度无效 · bad message type:本地设备接收到的BGP消息类型无效 · withdrawn message too long:Update撤销消息的长度过长 · route attribute length too long:Update消息中携带的路由属性长度过长 · route attribute appears multiple times:同一路由属性在同一Update消息中出现了多次 · route attribute length field shorter than 2 bytes:在Update消息中,描述路由属性长度的字段不足2字节 · extended attribute length field shorter than 2 bytes:在Update消息中,路由属性的长度可扩展,但描述路由属性长度的字段不足2字节 · attribute length field shorter than 1 byte:在Update消息中,路由属性的长度为正常长度,但描述路由属性长度的字段不足1字节 · link-state attribute error:Update消息中的链路状态属性形式错误 · unrecognized well-known attribute:Update消息中携带本端不支持的公认属性 · attribute-type attribute missed:Update消息中必须携带的路由属性丢失,attribute-type表示丢失的路由属性,取值包括: ¡ ORIGIN:源属性 ¡ AS_PATH:AS路径属性 ¡ LOCAL_PREF:本地优先级属性 ¡ NEXT_HOP:下一跳属性 · attribute flags error:Update消息中携带的路由属性标志位错误 · attribute-type attribute length error:Update消息中携带的路由属性长度错误,attribute-type表示长度错误的路由属性,取值包括: ¡ AS_PATH:包含2字节AS号的AS路径属性 ¡ AS4_PATH:包含4字节AS号的AS路径属性 ¡ CLUSTER_LIST:集群ID列表属性 ¡ AGGREGATOR:包含2字节AS号的聚合者属性 ¡ AS4_AGGREGATOR:包含4字节AS号的聚合者属性 ¡ ORIGIN:源属性 ¡ NEXT_HOP:下一跳属性 ¡ MED:多出口区分属性 ¡ LOCAL_PREF:本地优先级属性 ¡ ATOMIC_AGGREGATE:原子聚合属性 ¡ ORIGINATOR_ID:起源者ID属性 ¡ MP_REACH_NLRI:多协议可达NLRI属性 ¡ COMMUNITY:团体属性 ¡ EXT-COMMUNITY:扩展团体属性 · attribute length exceeded the limit:Update消息中携带的路由属性长度超出限制 · invalid ORIGIN attribute:Update消息中携带的源属性无效 · invalid NEXT_HOP attribute:Update消息中携带的下一跳属性无效 · invalid next hop length in MP_REACH_NLRI (address-family):在Update消息中,MP_REACH_NLRI属性的下一跳长度错误,address-family为发生下一跳长度错误的MP_REACH_NLRI属性所属的地址族,取值包括: ¡ 4u:IPv4单播地址族 ¡ MPLS:MPLS地址族 ¡ VPNv4:VPNv4地址族 ¡ 6u:IPv6单播地址族 ¡ VPNv6:VPNv6地址族 ¡ L2VPN:L2VPN地址族 · the length of MP_UNREACH_NLRI attribute is less than 3 bytes:Update消息中携带的MP_UNREACH_NLRI属性长度小于3字节 · the length of MP_REACH_NLRI or MP_UNREACH_NLRI attribute exceeds the limit:Update消息中携带的MP_REACH_NLRI 或MP_UNREACH_NLRI属性长度超过限制 · erroneous MP_REACH_NLRI or MP_UNREACH_NLRI attribute end position:Update消息中携带的MP_REACH_NLRI或MP_UNREACH_NLRI属性结束位置错误 · invalid network field:目的网络地址字段无效 · malformed AS_PATH:AS路径属性形式错误 · hold timer expiration caused by local device:由本端设备造成的会话保持定时器超时 · hold timer expiration caused by peer device:由对端设备造成的会话保持定时器超时 · connect retry timer expired:会话重建定时器超时 · TCP_CR_Acked event received:收到了TCP_CR_Acked事件 · TCP_Connection_Confirmed event received:收到了TCP_Connection_Confirmed事件 · open message received:收到Open消息 · manualstop event received:收到manualstop事件 · physical interface configuration changed:物理接口配置改变 · BFD session down event received:收到BFD会话DOWN事件,BGP也断开相应的BGP会话 · physical interface configuration changed:物理接口配置改变 · maximum number of prefixes reached:从对等体收到的路由数量超过peer route-limit命令配置的最大数量 · maximum number of prefixes reached in address-family:在指定地址族内,从对等提接收到的路由数量超过peer route-limit命令配置的最大数量,address-family为地址族名称,取值包括: ¡ IPv4 unicast:BGP IPv4单播地址族 ¡ IPv6 unicast:BGP IPv6单播地址族 ¡ VPNv4:BGP VPNv4地址族 ¡ VPNv6:BGP VPNv6地址族 ¡ The peer is configured with the peer ignore command:指定对等体配置了peer ignore命令来禁止与该对等体建立会话 · address family deleted:建立BGP会话的地址族被删除 · peer disabled:禁止本端设备与对等体交换路由信息 · administrative reset:复位BGP会话或者BGP会话相关的配置改变导致BGP会话重新建立 · connection rejected:TCP连接被对端拒绝 · other configuration change:其他对等体的配置变化导致本端设备与当前对等体的会话断开 · connection collision resolution:连接冲突 · two connections exist and one uses MD5:存在两个连接,且其中一个配置了MD5认证 · no memory to parse the attribute:解析路由属性时系统内存不足 · no memory for the route:生成路由或者标签块信息时,获取不到内存 · no memory to generate unreachable NLRI:封装不可达NLRI属性时申请不到内存 · no memory for message encapsulation:封装BGP消息时申请不到内存 · can’t get the VPN RD:解析前缀时获取不到RD · can’t get the VPN routing table:解析前缀时获取不到VPN路由表 · can’t get the attributes:解析前缀时获取不到路由属性 · entered severe memory state:进入二级门限告警 · entered critical memory state:进入三级门限告警 |
【相关命令】
· diagnostic troubleshooting enable
diagnostic troubleshooting test route-record bgp flowspec命令用来对BGP Flowspec路由增删事件进行一键诊断。
【命令】
diagnostic troubleshooting test route-record bgp [ instance instance-name ] flowspec
【视图】
系统视图
【缺省用户角色】
network-admin
【参数】
instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP Flowspec路由增删事件进行一键诊断。
【使用指导】
请先使用diagnostic troubleshooting test test route-record bgp enable命令,开启BGP Flowspec路由增删事件一键诊断功能,否则,本命令执行失败。(BGP Flowspec路由增删事件一键诊断功能缺省处于开启状态)
BGP Flowspec路由增删事件一键诊断功能处于开启状态时,设备会自动将BGP Flowspec路由的添加和删除信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP Flowspec路由增删事件诊断信息。诊断信息包括产生诊断信息的时间、添加和删除的BGP Flowspec路由的详细信息等。
有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。
系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。
【举例】
# 对default实例BGP IPv4 Flowspec地址族下的路由增删事件进行一键诊断。
<Sysname> system-view
[Sysname] diagnose trouble-shooting test route-record bgp flowspec
ChangeType : ADD
Time : 2022-02-21 18:24:36
VPN-Instance Name : vpn1
From : 10.1.1.1
Network:
Source IP : 10.10.1.0/24
Protocol : =0|=1|=6
Dest.Port : =1000
Src.Port : =179
ICMP Type : =10
ICMP Code : =200|=300
TCPFlags : =255
Length : =1024
DSCP : =6|=2
Frag : =4/528
Ext-Community :
CO-Flag : Color(01:1)
FLOWSPEC RATE : 324 Bps
FLOWSPEC ACTION : 32
ChangeType : DEL
Time : 2022-02-21 18:24:36
VPN-Instance Name : vpn2
From : 11.1.1.1
Network:
Source IP : 11.10.1.0/24
Protocol : =0|=1|=6
Dest.Port : =1000
Src.Port : =179
ICMP Type : =10
ICMP Code : =200|=300
TCPFlags : =255
Length : =1024
DSCP : =6|=2
Frag : =4/528
Ext-Community :
CO-Flag : Color(01:1)
FLOWSPEC RATE : 324 Bps
FLOWSPEC ACTION : 32
表1-25 命令显示信息描述表
字段 |
描述 |
Start diagnose at 2022-11-21 08:08:44 |
开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒 |
please wait.Done. |
一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成 |
End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds. |
结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间 |
ChangeType |
路由的事件类型,包括: · ADD:路由被添加到BGP Flowspec路由表 · DEL:路由从BGP Flowspec路由表中删除 |
Time |
路由增删事件发生的时间 |
VPN-Instance Name |
路由所属的VPN实例 |
Public-instance |
路由属于公网实例 |
From |
发送该BGP Flowspec路由的对等体IP地址 |
Network |
BGP Flowspec路由的前缀信息 |
Ext-Community |
BGP Flowspec路由携带的扩展团体属性 |
【相关命令】
· diagnostic troubleshooting enable
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!