• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

22-智能运维命令参考

目录

03-一键诊断命令

本章节下载 03-一键诊断命令  (604.46 KB)

03-一键诊断命令

  录

1 一键诊断

1.1 一键诊断开启命令

1.1.1 diagnostic troubleshooting enable

1.1.2 diagnostic troubleshooting health enable

1.2 CPU一键诊断命令

1.2.1 diagnostic troubleshooting test cpu high-ratio

1.2.2 diagnostic troubleshooting test cpu overload

1.3 内存一键诊断命令

1.3.1 diagnostic troubleshooting test memory high-ratio

1.3.2 diagnostic troubleshooting test memory overload

1.4 LDP一键诊断命令

1.4.1 diagnostic troubleshooting health module ldp

1.4.2 diagnostic troubleshooting test neighbor-create-abnormal ldp

1.4.3 diagnostic troubleshooting test neighbor-flap ldp

1.5 MPLS TE一键诊断命令

1.5.1 diagnostic troubleshooting health module te

1.5.2 diagnostic troubleshooting test te-tunnel establish-abnormal

1.5.3 diagnostic troubleshooting test te-tunnel lsp-event

1.6 MPLS L2VPN一键诊断命令

1.6.1 diagnostic troubleshooting health module l2vpn

1.6.2 diagnostic troubleshooting test l2vpn-pw establish-abnormal

1.6.3 diagnostic troubleshooting test l2vpn-pw flap

1.7 Ping一键诊断命令

1.7.1 diagnostic troubleshooting test ping failed-reason

1.8 SNMP一键诊断命令

1.8.1 diagnostic troubleshooting test snmp-agent packet-process-failure

1.8.2 diagnostic troubleshooting test snmp-agent packet-process-time

1.8.3 diagnostic troubleshooting test snmp-agent trap-send-failure

1.9 BGP一键诊断命令

1.9.1 diagnostic troubleshooting health module bgp

1.9.2 diagnostic troubleshooting test establish-abnormal bgp

1.9.3 diagnostic troubleshooting test flap bgp

1.9.4 diagnostic troubleshooting test peer-establish-abnormal bgp

1.9.5 diagnostic troubleshooting test peer-flap bgp

1.9.6 diagnostic troubleshooting test route-record bgp flowspec

 


1 一键诊断

1.1  一键诊断开启命令

1.1.1  diagnostic troubleshooting enable

diagnostic troubleshooting enable命令用来开启业务功能的一键诊断功能。

undo diagnostic troubleshooting enable命令用来关闭业务功能的一键诊断功能。

【命令】

diagnostic troubleshooting [ test test-name test-item ] enable

undo diagnostic troubleshooting [ test test-name test-item ] enable

【视图】

系统视图

【缺省情况】

业务功能的一键诊断功能处于开启状态。

【缺省用户角色】

network-admin

【参数】

test test-name:表示测试例的名称,为1~31个字符的字符串,不区分大小写。具体取值可通过执行diagnostic troubleshooting test 命令来获取。不指定该参数时,表示对所有测试项进行配置。

test-item:表示测试项的名称,为1~31字符的字符串,不区分大小写。具体取值可通过执行diagnostic troubleshooting test test-name 命令来获取。

【使用指导】

只有开启业务功能的一键诊断功能后,才允许执行业务功能一键诊断。

缺省情况下,为方便用户随时对设备进行维护,所有业务功能的一键诊断功能都处于开启状态。部分测试例不需要存储运行数据,部分测试例需要存储运行数据并根据存储的历史数据进行一键诊断。对于需要存储运行数据的测试例,开启业务功能的一键诊断功能并完成业务模块的配置后,业务模块会将测试项监控的运行数据记录到GOLD模块,以便GOLD模块对测试项进行一键诊断。记录运行数据会消耗设备资源,影响系统性能。如果用户不关心某业务功能的运行状态,可以关闭对应测试项的一键诊断功能,减少对系统性能的影响。

【举例】

# 开启SNMP报文处理失败测试项的一键诊断功能。

<Sysname> system-view

[Sysname] diagnostic troubleshooting snmp-agent packet-process-failure enable

【相关命令】

·     diagnostic troubleshooting test

1.1.2  diagnostic troubleshooting health enable

diagnostic troubleshooting health enable命令用来开启业务模块健康度一键诊断功能。

undo diagnostic troubleshooting health enable命令用来关闭业务模块健康度一键诊断功能。

【命令】

diagnostic troubleshooting health [ module module-name ] enable

undo diagnostic troubleshooting health [ module module-name ] enable

【视图】

系统视图

【缺省情况】

业务模块健康度一键诊断功能处于开启状态。

【缺省用户角色】

network-admin

【参数】

module module-name:模块名,为1~31个字符的字符串,区分大小写。不指定该参数时,则开启所有设备支持的业务模块的健康度用例。

【使用指导】

只有开启业务模块健康度一键诊断功能后,才允许执行业务模块健康度一键诊断。

开启业务模块健康度一键诊断功能并完成业务模块的配置后,业务模块会将不健康业务信息记录到GOLD模块,以便GOLD模块进行健康度一键诊断。记录业务模块的不健康信息会消耗设备资源,影响系统性能。如果用户不关心某业务模块的健康度,可以关闭该业务模块的健康度监测,减少对系统性能的影响。

【举例】

# 开启MPLS TE业务模块健康度一键诊断功能。

<Sysname> system-view

[Sysname] diagnostic troubleshooting health module te enable

【相关命令】

·     diagnostic troubleshooting health

1.2  CPU一键诊断命令

1.2.1  diagnostic troubleshooting test cpu high-ratio

diagnostic troubleshooting test cpu high-ratio命令用来对CPU利用率超门限事件进行一键诊断。

【命令】

diagnostic troubleshooting test cpu high-ratio

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

工作机制

系统每隔1分钟对CPU利用率进行一次采样。开启CPU利用率超门限事件一键诊断功能后,如果设备本次CPU利用率的采样值大于CPU利用率低级别告警门限(CPU利用率告警门限可通过monitor cpu-usage threshold命令配置),则设备认为CPU利用率超门限,会在GOLD模块的内存中记录一条CPU利用率超门限事件。

执行本命令后,设备会显示下列信息,以帮助用户定位CPU利用率高的问题。

·     最近CPU利用率的采样值(最多显示7条)。

·     显示最近CPU超门限事件记录(最多显示7条)。

·     显示最近一次CPU利用率超门限事件发生时CPU利用率排名前五的进程的信息。

关于CPU利用率告警功能的详细描述请参见“设备管理配置指导”中的“硬件资源管理”。

注意事项

请先使用diagnostic troubleshooting test cpu high-ratio enable命令,开启CPU利用率超门限事件一键诊断功能,否则,本命令执行失败。(CPU利用率超门限事件一键诊断功能缺省处于开启状态。)

【举例】

# 对CPU利用率超门限事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test cpu high-ratio

Slot 1 CPU 0 usage:

Time                             Usage

2022-07-25 02:37:52              30%

2022-07-25 02:32:16              28%

2022-07-25 02:22:16              28%

2022-07-25 02:12:16              27%

2022-07-25 02:52:16              29%

2022-07-25 01:32:16              28%

2022-07-25 01:12:16              25%

 

Slot 1 CPU 0 recent high usage records:

Time                    Severe threshold    Minor threshold       Usage

2022-07-25 02:18:52     80%                 25%                    30%

2022-07-25 02:18:53     80%                 25%                    28%

2022-07-25 02:22:16     80%                 25%                    28%

2022-07-25 02:12:16     80%                 25%                    27%

2022-07-25 02:52:16     80%                 25%                    29%

2022-07-25 01:32:16     80%                 25%                    28%

2022-07-25 01:12:16     80%                 25%                    25%

 

Top 5 slot 1 CPU 0 usage processes in the last record:

JID       PID    PRI   State   FDs     HH:MM:SS    Usage    Name

1026      1026   120   S       1188    00:11:16    12.61%   forward

999       999    120   S       190     00:00:37    5.55%    ifmond

847       847    120   S       183     00:01:10    5.29%    drv_app

983       983    120   S       94      00:01:00    4.76%    diagd

1201      1201   120   S       199     00:02:09    4.26%    pppd

表1-1 diagnostic troubleshooting test cpu high-ratio命令显示信息描述表

字段

描述

Slot 1 CPU 0 usage

Slot 1 CPU 0最近CPU利用率信息记录,最多可记录7条

Time

CPU利用率采样时间

Usage

CPU利用率取值

Slot 1 CPU 0 recent high usage records

Slot 1 CPU 0最近CPU利用率超门限事件记录,最多可记录7条

Severe threshold

CPU利用率高级别告警门限。CPU利用率采样值大于CPU利用率低级别告警门限或CPU利用率高级别告警门限,GOLD会记CPU利用率超门限事件

Minor threshold

CPU利用率低级别告警门限,CPU利用率采样值大于CPU利用率低级别告警门限或CPU利用率高级别告警门限,GOLD会记CPU利用率超门限事件

Top 5 slot 1 CPU 0 usage processes in the last record

最近一条CPU利用率超门限事件发生时,Slot 1 CPU 0的CPU利用率占前五的进程的信息

JID

任务编号,用于唯一标识一个进程,该编号不会随着进程的重启而改变

PID

进程编号

PRI

进程优先级(优先级在进程调度时发挥作用,优先级高的会优先得到调度)

State

进程状态,可能的取值为:

·     R:Running,运行状态或处于运行队列

·     S:Sleeping,可中断睡眠状态

·     T:Traced or stopped,暂停状态

·     D:Uninterruptible sleep,不可中断睡眠状态

·     Z:Zombie,僵死状态

FDs

进程已使用的FD个数

HH:MM:SS

进程最近一次启动后的运行时间。当进程的持续运行时间大于或等于100小时时,该列仅显示小时数,不再显示分和秒

Name

进程名

 

【相关命令】

·     diagnostic troubleshooting enable

·     monitor cpu-usage threshold(设备管理命令参考/硬件资源管理)

1.2.2  diagnostic troubleshooting test cpu overload

diagnostic troubleshooting test cpu overload命令用来对CPU利用率突增事件进行一键诊断。

【命令】

diagnostic troubleshooting test cpu overload

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

工作机制

设备执行一次监控诊断测试例cpu-overload,会对CPU利用率采样一次,该采样值用于CPU利用率突增事件一键诊断。监控诊断测试例cpu-overload缺省处于开启状态,可通过diagnostic monitor enable来配置。监控诊断测试例cpu-overload的执行周期缺省为30分钟,可通过diagnostic monitor interval命令修改。

开启CPU利用率突增事件一键诊断功能后,如果设备本次CPU利用率的采样值减去上一次采样值的结果大于10%,则认为CPU利用率突增,会在GOLD模块的内存中记录一条CPU利用率突增事件。

执行本命令后,设备会显示下列信息,以帮助用户定位CPU利用率突增的问题。

·     显示最近CPU利用率突增事件,最多显示7条。

·     显示最近一次CPU利用率突增事件发生时CPU利用率排前五的进程的信息。

注意事项

请先使用diagnostic troubleshooting test cpu overload enable命令,开启CPU利用率突增事件一键诊断功能,否则,本命令执行失败。(CPU利用率突增事件一键诊断功能缺省处于开启状态。)

【举例】

# 对CPU利用率突增事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test cpu overload

Slot 1 CPU 0 recent uasge burst records:

Time                      Usage(%)

2022-07-25 02:18:52       From 10 to 30

 

Top 5 slot 1 CPU 0 usage processes in the last record:

Process 1011 (forward)

    TID  LAST_CPU    Stack      PRI    State   HH:MM:SS:MSEC  Name

   1011     12        136K      120      S     0:8:24:620     forward

Thread (LWP 1011):

Switch counts: 1

User stack:

#0  0x00007fb893904dbd in syscall+0x1d/0x37

#1  0x00007fb896160748 in futex_async+0x48/0x50

#2  0x00007fb896161e98 in call_rcu_wait+0xa8/0xb5

#3  0x00007fb896162646 in call_rcu_thread+0x556/0x6ed

#4  0x00007fb899e742de in start_thread+0xfe/0x3e0

Kernel stack:

[<ffffffff9a1090b4>] futex_wait_queue_me+0xc4/0x120

[<ffffffff9a109d16>] futex_wait+0x116/0x270

[<ffffffff9a10bbf7>] do_futex+0x237/0xb40

[<ffffffff9a10c581>] SyS_futex+0x81/0x180

[<ffffffff9a87f3fb>] entry_SYSCALL_64_fastpath+0x1e/0xad

[<ffffffffffffffff>] 0xffffffffffffffff

 

Process 1016 (ifmond)

    TID  LAST_CPU    Stack      PRI    State   HH:MM:SS:MSEC  Name

   1016      5        136K      120      S     0:1:0:0        ifmond

Thread (LWP 1026):

Switch counts: 1

User stack:

#0  0x00007fb893904dbd in syscall+0x1d/0x37

#1  0x00007fb896160748 in futex_async+0x48/0x50

#2  0x00007fb896161e98 in call_rcu_wait+0xa8/0xb5

#3  0x00007fb896162646 in call_rcu_thread+0x556/0x6ed

#4  0x00007fb899e742de in start_thread+0xfe/0x3e0

Kernel stack:

[<ffffffff9a1090b4>] futex_wait_queue_me+0xc4/0x120

[<ffffffff9a109d16>] futex_wait+0x116/0x270

[<ffffffff9a10bbf7>] do_futex+0x237/0xb40

[<ffffffff9a10c581>] SyS_futex+0x81/0x180

[<ffffffff9a87f3fb>] entry_SYSCALL_64_fastpath+0x1e/0xad

[<ffffffffffffffff>] 0xffffffffffffffff

……

表1-2 diagnostic troubleshooting test cpu overload命令显示信息描述表

字段

描述

Slot 1 CPU 0 recent uasge burst records

Slot 1 CPU 0最近的CPU利用率突增事件记录,最多可记录7条

Time

CPU利用率采样时间

Usage(%)

CPU利用率变化情况,用百分比表示

Top 5 slot 1 CPU 0 usage processes in the last record

Slot 1 CPU 0最近一条CPU利用率超门限事件发生时,CPU使用率占前五的进程的信息

Process 1011 (forward)

进程的编号(进程的名称)

TID

线程编号

LAST_CPU

进程最近一次被调度时,所在的CPU

Stack

堆栈大小,单位为KB

PRI

线程使用CPU的优先级

State

线程状态,可能的取值为:

·     R:Running,运行状态或正在队列中等待调度

·     S:Sleeping,可中断睡眠状态

·     T:Traced or stopped,暂停状态

·     D:Uninterruptible sleep,不可中断睡眠状态

·     Z:Zombie,僵死状态

HH:MM:SS:MSEC

线程最近一次启动后的运行时间

Name

线程名称

Thread (LWP 1026)

被跟踪进程的子进程

Switch counts

被调度的次数

User stack

用户态堆栈信息,仅用户态进程显示该信息

Kernel stack

内核态堆栈信息,仅内核态进程显示该信息

 

【相关命令】

·     diagnostic monitor enable(设备管理命令参考/GOLD)

·     diagnostic monitor interval(设备管理命令参考/GOLD)

·     diagnostic troubleshooting enable

1.3  内存一键诊断命令

1.3.1  diagnostic troubleshooting test memory high-ratio

diagnostic troubleshooting test memory high-ratio命令用来对剩余内存超门限事件进行一键诊断。

【命令】

diagnostic troubleshooting test memory high-ratio

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

工作机制

系统每隔5秒对剩余内存进行一次采样。开启内存超门限事件一键诊断功能后,如果设备当前剩余内存采样值小于等于一级内存告警门限(内存告警门限可通过memory-threshold命令配置),则设备认为剩余内存超门限,会在GOLD模块的内存中记录一条剩余内存超门限事件。

执行本命令后,设备会显示当前内存使用情况以及最近剩余内存超过告警门限的事件,最多显示7条,帮助用户定位系统剩余内存不足的问题。

注意事项

请先使用diagnostic troubleshooting test memory high-ratio enable命令,开启内存超门限事件一键诊断功能,否则,本命令执行失败。(内存超门限事件一键诊断功能缺省处于开启状态。)

【举例】

# 对剩余内存超门限事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting memory high-ratio

Start diagnose at 2013-02-22 14:16:27.                                         

End diagnose at 2013-02-22 14:16:27, Actual time:0 seconds.                    

Memory statistics are measured in KB:                                          

Slot 1:                                                                         

             Total      Used      Free    Shared   Buffers    Cached   FreeRatio

Mem:       8086816   6971116   1115700         0       372   3907428       22.0%

-/+ Buffers/Cache:   3063316   5023500                                          

Swap:            0         0         0                                         

Container memory statistics are measured in KB:                                

Slot 1:                                                                         

             Total      Used      Free  UsageRatio                             

                                                                               

Slot 1 recent high memory usage records:                                       

Time                       Threshold        FreeRatio                          

2013-02-21 13:28:21        13%              14.4%                              

表1-3 diagnostic troubleshooting test memory high-ratio命令显示信息描述表

字段

描述

Memory statistics are measured in KB:

物理设备中内存使用情况,以下统计信息均以KB为单位

Mem

内存使用信息

Total

系统可分配的物理内存的大小

设备总物理内存分为不可分配物理内存和可分配物理内存:

·     不可分配物理内存用于内核代码段存储、内核管理开销等;可分配物理内存用于支撑业务模块的运行、文件存储等操作

·     可分配内存的大小由设备根据系统运行需要自动计算划分

·     可分配物理内存的大小=设备总物理内存-不可分配内存的大小

Used

整个系统已用的物理内存大小

Free

整个系统可用的物理内存大小

Shared

多个进程共享的物理内存总额。取值为“--”时,表示不支持统计该参数的值

Buffers

已使用的文件缓冲区的大小。取值为“--”时,表示不支持统计该参数的值

Cached

高速缓冲寄存器已使用的内存大小。取值为“--”时,表示不支持统计该参数的值

FreeRatio

整个系统物理内存的空闲率

-/+ Buffers/Cache

-/+ Buffers/Cache:used = Mem:Used – Mem:Buffers – Mem:Cached,表示应用程序已用的物理内存大小

-/+ Buffers/Cache:free = Mem:Free + Mem:Buffers + Mem:Cached,表示应用程序可用的物理内存大小

Swap

交换分区的使用信息

Container memory statistics are measured in KB

Comware容器对内存的使用情况,包括:

·     Total:Comware容器总共可分配的物理内存的大小,单位为KB

·     Used:Comware容器已使用的物理内存的大小,单位为KB

·     Free:Comware容器可用的物理内存的大小,单位为KB

·     UsageRatio:Comware容器对物理内存的使用率

Slot 1 recent high memory usage records

Slot 1最近内存超门限事件的记录,最多可记录7条

Time

内存超门限发生的时间

Threshold

内存门限值

 

【相关命令】

·     diagnostic troubleshooting enable

·     memory-threshold(设备管理命令参考/硬件资源管理)

1.3.2  diagnostic troubleshooting test memory overload

diagnostic troubleshooting test memory overload命令用来对内存使用量突增事件进行一键诊断。

【命令】

diagnostic troubleshooting test memory overload

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

工作机制

设备执行一次监控诊断测试例memory-overload,会对内存使用量采样一次,该采样值用于内存使用量突增事件一键诊断。监控诊断测试例memory-overload缺省处于开启状态,可通过diagnostic monitor enable来配置。监控诊断测试例memory-overload的执行周期缺省为12小时,可通过diagnostic monitor interval命令修改。

开启内存使用量突增事件一键诊断功能后,如果设备本次内存使用量的采样值减去上一次采样值的结果大于50M,则认为内存使用量突增,会在GOLD模块的内存中记录一条内存使用量突增事件。

执行本命令后,设备会显示下列信息,以帮助用户定位系统剩余内存不足的问题。

·     显示最近内存使用量突增事件,最多显示7条。

·     显示最近一次内存使用量突增事件发生时内存使用量排前五的进程的信息。

注意事项

请先使用diagnostic troubleshooting test memory overload enable命令,开启内存使用量突增事件一键诊断功能,否则,本命令执行失败。(内存使用量突增事件一键诊断功能缺省处于开启状态。)

【举例】

# 对内存使用量突增事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting memory overload

Slot 1 recent memory usage burst records:

Time                      Memory used (MB)

2022-07-25 08:18:52       From 456 to 556

2022-07-25 07:18:52       From 456 to 556

2022-07-25 06:18:52       From 456 to 556

2022-07-25 05:18:52       From 456 to 556

2022-07-25 04:18:52       From 456 to 556

2022-07-25 03:18:52       From 456 to 556

2022-07-25 02:18:52       From 456 to 556

 

Slot 1 top 5 memory usage processes in the last record:

Process: scmd (jobID 1)

Total allocated memory: 393760 bytes

Total free memory: 144672 bytes

Heap usage of the job:

Tag            UsedBlocks     UsedBytes      FreeBlocks     FreeBytes

0x0            1412           362704         24             144304

0x1060000      2              96             0              0

0x1090000      0              0              3              240

0x10b0000      3              96             2              64

0x1120000      7              2496           0              0

0x1150000      1              64             1              64

0x1570000      1              11536          0              0

0x15a0000      26             16768          0              0

 

Process: aaa (jobID 2)

Total allocated memory: 393760 bytes

Total free memory: 144672 bytes

Heap usage of the job:

Tag            UsedBlocks     UsedBytes      FreeBlocks     FreeBytes

0x0            1412           362704         24             144304

0x1060000      2              96             0              0

0x1090000      0              0              3              240

0x10b0000      3              96             2              64

0x1120000      7              2496           0              0

0x1150000      1              64             1              64

0x1570000      1              11536          0              0

0x15a0000      26             16768          0              0

表1-4 diagnostic troubleshooting test memory overload命令显示信息描述表

字段

描述

Slot 1 recent memory usage burst records

Slot 1最近内存使用量突增事件记录,最多可记录7条

Time

内存突增事件发生的时间

Memory used (MB)

上一次采集时内存使用量和当前采集时内存使用量,单位为MB

Slot 1 top 5 memory usage processes in the last record

显示内存使用量增长最多的前5个进程的内存使用量信息

Process: scmd (jobID 1)

进程的名称为scmd(任务ID是1)

Total allocated memory

任务已使用的堆内存大小,单位为字节

Total free memory

任务可使用的堆内存大小,单位为字节

Heap usage of the job

任务对堆内存的使用情况

Tag

系统内部软件模块的编号

UsedBlocks

已使用的内存块个数

UsedBytes

已使用的内存大小,单位为字节

FreeBlocks

剩余的内存块个数

FreeBytes

剩余的内存大小,单位为字节

 

【命令参考】

·     diagnostic monitor enable(设备管理命令参考/GOLD)

·     diagnostic monitor interval(设备管理命令参考/GOLD)

·     diagnostic troubleshooting enable

1.4  LDP一键诊断命令

1.4.1  diagnostic troubleshooting health module ldp

diagnostic troubleshooting health module ldp命令用来对LDP模块执行一次健康度诊断。

【命令】

diagnostic troubleshooting health module ldp

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

本命令用来诊断LDP模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。

请先使用diagnostic troubleshooting health module ldp enable命令,开启LDP模块健康度一键诊断功能,否则,本命令执行失败。

【举例】

# 对LDP模块执行一次健康度诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting health module ldp enable

[Sysname] diagnostic troubleshooting health module ldp

Show LDP health events:

--------------------------------------------------------------------------------

Health event                            Detect time                            Description

--------------------------------------------------------------------------------

RES_LABEL_ALLOC_FAIL                    2022-4-20 10:01:50                    Failed to alloc labels to LDP. (ErrorCode=[1] )

表1-5 diagnostic troubleshooting health module ldp命令显示信息描述表

字段

描述

Health event

健康度事件类型,取值包括:

·     RES_LABEL_ALLOC_FAIL:LDP申请标签段失败

·     RES_LABEL_ALLOC_RESUME:LDP可用标签数量恢复

Detect time

健康度事件发生时间

Description

健康度事件的详细描述

 

【相关命令】

·     diagnostic troubleshooting health enable

1.4.2  diagnostic troubleshooting test neighbor-create-abnormal ldp

diagnostic troubleshooting test neighbor-create-abnormal ldp命令用来对LDP会话建立异常事件进行一键诊断。

【命令】

diagnostic troubleshooting test neighbor-create-abnormal ldp { local [ vpn-instance vpn-instance-name ] peer peer-lsr-id interface interface-type interface number | remote peer peer-lsr-id } [ diagnostic-time diagnostic-time ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

local:表示LDP本地会话。

vpn-instance vpn-instance-name:指定LDP对等体所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示LDP对等体属于公网中。

peer peer-lsr-id:指定LDP对等体的LSR ID。peer-lsr-id为LDP对等体的LSR ID。

interface-type interface-number:指定LDP本地会话的接口。interface-type interface-number为接口类型和接口编号。

remote peer peer-lsr-id:表示LDP远端会话。peer-lsr-id为LDP对等体的LSR ID。

diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为1~60,单位为秒,缺省值为30。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time

【使用指导】

请先使用diagnostic troubleshooting test neighbor-create-abnormal ldp enable命令,开启LDP会话建立异常事件一键诊断功能,否则,本命令执行失败。

开启一键诊断功能并完成LDP配置后,LDP模块会将LDP会话建立异常的运行数据记录到GOLD模块,以便GOLD模块对LDP会话建立异常进行一键诊断。

记录LDP会话建立异常的运行数据会消耗设备资源,影响系统性能。如果用户不关心LDP模块的运行状态,可以关闭LDP会话建立异常的一键诊断功能,减少对系统性能的影响。

【举例】

# 对LDP会话建立异常事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test neighbor-create-abnormal ldp enable

[Sysname] diagnostic troubleshooting test neighbor-create-abnormal ldp remote peer 2.2.2.2

Start diagnose at 2022-09-29 06:41:20, Estimated time:30 seconds.

Please wait.....................Done.

End diagnose at 2022-09-29 06:41:40, Actual time:30 seconds.

Diagnosis report:

--------------------------------------------------------------------------------

PeerID          Status       Reason

2.2.2.2         NOT_EXISTENT No LSR-ID

--------------------------------------------------------------------------------

表1-6 diagnostic troubleshooting test neighbor-create-abnormal ldp命令显示信息描述表

字段

描述

Peer ID

LDP邻居的LSR ID

Status

LDP会话状态,取值包括:

·     NOT_EXISTENT:会话不存在

·     INITIALIZED:会话处于初始化状态

·     OPEN_SENT:会话已发送Init消息,等待接收对端的Init消息

·     OPEN_RECV:会话已经发送Open消息,等待接收对端的Open消息

·     OPER:会话处于Up状态

Reason

LDP会话无法建立的原因,取值包括:

·     Device in memory-threshold:设备处于内存门限

·     No LSR-ID:无可用的LSR ID

·     Local interface down:本地接口处于down状态

·     Local interface has no IPv4 address:本地接口未配置IPv4地址

·     Local interface has no MPLS capability:本地接口未开启MPLS能力

·     Local interface has no LDP capability:本地接口未开启LDP能力

·     No hello packet received:未收到对端发送的Hello报文

·     No target peer:未配置target-peer命令

 

【相关命令】

·     diagnostic troubleshooting enable

1.4.3  diagnostic troubleshooting test neighbor-flap ldp

diagnostic troubleshooting test neighbor-flap ldp命令用来对LDP对等体震荡事件进行一键诊断。

【命令】

diagnostic troubleshooting test neighbor-flap ldp [ [ vpn-instance vpn-instance-name ] peer peer-id ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

vpn-instance vpn-instance-name:指定LDP对等体所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示LDP对等体属于公网中。

peer peer-lsr-id:指定LDP对等体的LSR ID。peer-lsr-id为LDP对等体的LSR ID。

【使用指导】

请先使用diagnostic troubleshooting test neighbor-flap ldp enable命令,开启LDP对等体震荡事件一键诊断功能,否则,本命令执行失败。

开启一键诊断功能并完成LDP配置后,LDP模块会将LDP对等体震荡的运行数据记录到GOLD模块,以便GOLD模块对LDP对等体震荡进行一键诊断。记录LDP对等体震荡的运行数据会消耗设备资源,影响系统性能。如果用户不关心LDP模块的运行状态,可以关闭LDP对等体震荡的一键诊断功能,减少对系统性能的影响。

【举例】

# 对地址为2.2.2.2的LDP对等体震荡事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting neighbor-flap ldp enable

[Sysname] diagnostic troubleshooting neighbor-flap ldp peer 2.2.2.2

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

--------------------------------------------------------------------------------

PeerID          Down time             Duration time     Reason

2.2.2.2         2022-04-01 10:15:35   1h32m19s          Interface not operational

--------------------------------------------------------------------------------

表1-7 diagnostic troubleshooting test neighbor-flap ldp命令显示信息描述表

字段

描述

PeerID

对等体的LSR ID

Down time

震荡发生时间

Duration time

Down状态持续时间

Reason

震荡原因,取值包括:

·     Interface not operational:表示接口不可用

·     MPLS disabled on interface:表示接口已关闭MPLS能力

·     LDP disabled on interface:表示接口已关闭LDP能力

·     LDP auto-configure disabled on interface:表示接口已关闭LDP自动配置功能

·     VPN instance changed on interface:表示接口所属的VPN实例已更改

·     LDP instance deleted:表示LDP实例已删除

·     Targeted peer deleted:表示手动删除targeted peer

·     L2VPN disabled targeted peer:表示L2VPN注销targeted peer

·     TE tunnel disabled targeted peer:表示TE隧道注销targeted peer

·     Session protection disabled targeted peer:表示会话保护注销targeted peer

·     OSPF Remote LFA disabled targeted peer:表示OSPF Remote LFA注销targeted peer

·     IS-IS Remote LFA disabled targeted peer:表示IS-IS Remote LFA注销targeted peer

·     Process deactivated:表示LDP进程降级

·     Failed to receive the initialization message:表示未收到初始化信息

·     Graceful restart reconnect timer expired:表示GR重连定时器超时

·     Failed to recover adjacency by NSR:表示NSR恢复邻接关系失败

·     Failed to upgrade session by NSR:表示NSR升级会话失败

·     Closed the GR session:表示GR会话关闭

·     Keepalive hold timer expired:表示keepalive保持时间超时

·     Hello hold timer expired:表示hello保持时间超时

·     Session reset:表示重启会话

·     TCP connection down:表示TCP连接断开

·     Received a fatal notification message:表示收到致命的通知信息

·     Internal error:表示内部错误

·     Memory in critical state:表示内存达到critical状态

·     Transport address changed on interface:表示接口上的传输地址更改

·     MD5 password changed:表示会话MD5密码变化

 

1.5  MPLS TE一键诊断命令

1.5.1  diagnostic troubleshooting health module te

diagnostic troubleshooting health module te命令用来对MPLS TE模块执行一次健康度诊断。

【命令】

diagnostic troubleshooting health module te

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

本命令用来诊断MPLS TE模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。

请先使用diagnostic troubleshooting health module te enable命令,开启MPLS TE模块健康度一键诊断功能,否则,本命令执行失败。

【举例】

# 对MPLS TE模块执行一次健康度诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting health module te enable

[Sysname] diagnostic troubleshooting health module te

Show TE health events:

--------------------------------------------------------------------------------

Health event                    Detect time                            Description

--------------------------------------------------------------------------------

BSID_ALLOC_FAILED               2022-4-20 10:01:50                     Tunnel 1 allocated

binding-sid label

                                                                       15999 failed.

表1-8 diagnostic troubleshooting health module te命令显示信息描述表

字段

描述

Health event

健康度事件类型,取值为BSID_ALLOC_FAILED,表示MPLS TE隧道申请BSID失败

Detect time

健康度事件发生时间

Description

健康度事件的详细描述

 

【相关命令】

·     diagnostic troubleshooting health module te enable

1.5.2  diagnostic troubleshooting test te-tunnel establish-abnormal

diagnostic troubleshooting test te-tunnel establish-abnormal命令用来执行一次MPLS TE隧道建立异常一键诊断功能。

【命令】

diagnostic troubleshooting test te-tunnel establish-abnormal tunnel tunnel-id [ diagnostic-time diagnostic-time ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

tunnel tunnel-id:对指定MPLS TE隧道执行一次隧道建立异常一键诊断功能。tunnel-id为设备上已创建的Tunnel接口的编号。

diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为10~300,单位为秒,缺省值为120。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time

【使用指导】

请先使用diagnostic troubleshooting test te-tunnel establish-abnormal enable命令,开启MPLS TE隧道建立异常一键诊断功能,否则,本命令执行失败。

开启一键诊断功能并完成MPLS TE配置后,MPLS TE模块会将MPLS TE隧道建立异常的运行数据记录到GOLD模块,以便GOLD模块对MPLS TE隧道建立异常进行一键诊断。记录MPLS TE隧道建立异常的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS TE模块的运行状态,可以关闭MPLS TE隧道建立异常的一键诊断功能,减少对系统性能的影响。

【举例】

# 对Tunnel ID为1的MPLS TE隧道执行一次隧道建立异常一键诊断功能。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test te-tunnel establish-abnormal enable

[Sysname] diagnostic troubleshooting test te-tunnel establish-abnormal tunnel 1

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

(M): Modify LSP

--------------------------------------------------------------------------------

Tunnel Name: Tunnel1

 Ingress LSR ID: 1.1.1.1         Egress LSR ID: 3.3.3.3

 LSP type      : Main            Detect time: 2022-4-20 10:01:50

  Reason: RSVP not configured on interface HGE1/0/1 with IP address 10.1.1.1 on LSR 1.1.1.1.

 LSP type      : Hot-standby     Detect time: 2022-4-20 10:01:52

  Reason: CSPF computation failed.

--------------------------------------------------------------------------------

表1-9 diagnostic troubleshooting te-tunnel establish-abnormal命令显示信息描述表

字段

描述

Tunnel Name

隧道名称

Ingress LSR ID

隧道头结点的LSR ID

Egress LSR ID

隧道尾结点的LSR ID

LSP type

LSP类型,取值包括:

·     Main:主路径

·     Hot-standby:热备份路径

·     (M):表示MBB方式生成的LSP

Detect Time

得出诊断结果的时间

Reason

隧道建立失败原因,取值包括:

·     Establish success:LSP建立成功,没有异常

·     The destination not configured:隧道目的地址未配置

·     The MPLS LSR-ID not configured:未配置MPLS LSR ID

·     The MPLS TE not configured:未全局开启MPLS TE功能

·     The tunnel has been shut down:隧道处于shutdown状态

·     LSPM isn't running:LSP管理功能未运行

·     SRM isn't running:Segment Routing管理功能未运行

·     RSVP isn't running:RSVP协议未运行

·     PCE isn't running:PCEP协议未运行

·     No out segment of the SR label:SR首标签没有出方向

·     Segment routing path compute failed:SRLSP路径计算失败

·     Segment routing path verification failed:SRLSP路径校验失败

·     Equal-cost backup LSP not supported:不支持等价备份路径

·     Backup LSP is the same as main LSP:SRLSP主备同路

·     SR path compute element not respond:SRLSP路径计算单元无响应

·     Backup LSP sharing the same SRLG with the main LSP:SRLSP备份路径与主路径属于同一个SRLG

·     Main and backup LSPs can't be equal-cost paths:SRLSP主路径等价情况下,备路径不能建立

·     SR out segment is tunnel itself:SR路径出接口包含隧道本身

·     SR out segment is too deep:SR路径标签栈深度超过限制

·     Modify unchanged:Modify LSP与主路径相同

·     RSVP path compute failed:RSVP路径计算失败

·     RSVP not configured on interface HGE1/0/1 of LSR 1.1.1.1:节点上的接口没有开启RSVP能力

·     RSVP signaling error(24,1) occurred on the LSR 1.1.1.1:RSVP路径建立过程中产生RSVP协议错误

·     RSVP LSP can't be established with nextsid in explicit-path:RSVP信令建立的隧道不能使用显式路径方式指定下一跳标签

·     RSVP downstream is not responding:RSVP路径下游设备无响应

·     RSVP busy:RSVP协议繁忙,无响应

·     Unreferenced to any static CRLSP or SRLSP:Static信令下未配置静态CRLSP名称Static CRLSP is down:静态CRLSP处于Down状态

·     Static CRLSP busy:静态CRLSP繁忙,无响应

·     LSP or tunnel BFD down:LSP关联的BFD Down

·     Delegated tunnel without PCE update:隧道托管给PCE,但是PCE未更新

·     Minor memory-threshold:设备处于一级内存门限

·     Critical memory-threshold:设备处于三级内存门限

·     Unknown error:未知错误

·     Backup LSP is the same as main LSP:主备同路

 

【相关命令】

·     diagnostic troubleshooting test te-tunnel establish-abnormal enable

1.5.3  diagnostic troubleshooting test te-tunnel lsp-event

diagnostic troubleshooting test te-tunnel lsp-event命令用来对MPLS TE隧道震荡和路径切换事件进行一键诊断。

【命令】

diagnostic troubleshooting test te-tunnel lsp-event [ flap | switch ] tunnel tunnel-id

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

flap:对MPLS TE隧道震荡事件进行一键诊断。

switch:对MPLS TE隧道路径切换事件进行一键诊断。

tunnel tunnel-id:对指定MPLS TE隧道执行一次一键诊断功能。tunnel-id为设备上已创建的Tunnel接口的编号。

【使用指导】

执行本命令时,如果没有指定flapswitch参数,则表示对MPLS TE隧道震荡和路径切换事件进行一键诊断。

请先使用diagnostic troubleshooting test te-tunnel lsp-event enable命令,开启MPLS TE隧道震荡和路径切换事件一键诊断功能,否则,本命令执行失败。

执行本命令后,设备会显示MPLS TE隧道最近5次由up变为down的事件信息、MPLS TE隧道最近5次路径切换的事件信息,帮助用户定位MPLS TE隧道震荡和路径切换问题。

本命令仅支持对采用Segment Routing协议建立的MPLS TE隧道进行一键诊断。

开启一键诊断功能并完成MPLS TE配置后,MPLS TE模块会将MPLS TE隧道震荡和路径切换的运行数据记录到GOLD模块,以便GOLD模块对MPLS TE隧道震荡和路径切换进行一键诊断。

记录MPLS TE隧道震荡和路径切换的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS TE模块的运行状态,可以关闭MPLS TE隧道震荡和路径切换的一键诊断功能,减少对系统性能的影响。

【举例】

# 对Tunnel ID为1的MPLS TE隧道执行一次隧道震荡和路径切换事件一键诊断功能。

<Sysname>system-view

[Sysname] diagnostic troubleshooting test te-tunnel lsp-event enable

[Sysname] diagnostic troubleshooting test te-tunnel lsp-event tunnel 1

Tunnel Name:Tunnel1

IngressLSRID:1.1.1.1         EgressLSRID:3.3.3.3

Admin state: Normal     Tunnel state: Up

Path state:

  Main path info  : 1.1.1.1/1/61103  State: Active

  Backup path info: 1.1.1.1/1/61104  State: Up

--------------------------------------------------------------------------------

Last five lsp-flap events:

 LSP type:Main            Down time:2022-4-20 10:01:50

  Reason: The interface with IP address 10.1.1.1 went down.

 LSP Type:Hot-standby     Down Time: 2022-4-20 10:01:52

  Reason:Configuration changed.[shutdown]

--------------------------------------------------------------------------------

Last five lsp-switch events:

Switch type : Main LSP recovered      Switch time: 2021-8-14 14:30:29.734

Reason      : Main LSP up

 Path details:

  Old path  : 16010 - 2371 - 17030

  New path  : 16010 – 1802

Switch type : Backup LSP inused       Switch time: 2021-8-14 14:30:29.734

Reason      : Main LSP down

 Path detail:

  Old path  : 16010 – 1802

  New path  : 16010 - 2371 - 17030

表1-10 diagnostic troubleshooting test te-tunnel lsp-event命令显示信息描述表

字段

描述

Tunnel Name

隧道名称

IngressLSRID

隧道头结点的LSR ID

EgressLSRID

隧道尾结点的LSR ID

Admin state

隧道接口的管理状态,取值包括:

·     Normal:未通过shutdown命令关闭隧道接口

·     Shutdown:通过shutdown命令关闭隧道接口

Tunnel state

隧道的运行状态,取值包括Down和Up

Path state

路径状态,即隧道内每条LSP的状态

Main path info

主路径信息,取值为Ingress LSR ID/Tunnel ID/LSP ID

Backup path info

备路径信息,取值为Ingress LSR ID/Tunnel ID/LSP ID

State

路径状态,取值包括:

·     Active:表示SRLSP建立成功且当前使用该SRLSP转发流量

·     Up:表示SRLSP建立成功

·     Down:表示SRLSP未建立或者建立失败

Last five times lsp-flap record

最近5次隧道震荡事件记录

LSP type

LSP类型,取值包括:

·     Main:隧道主路径

·     Hot-standby:隧道备份路径

Down time

隧道震荡发生时间。

Reason

隧道震荡原因,取值包括:

·     No out segment:SID对应的表项没有出接口信息

·     IGP calculated path failed:IGP计算路径失败

·     SRLG check failed:SRLG校验失败

·     Configuration changed:配置修改

·     PCE state recover:PCE状态回退

Last five times lsp-switch record

最近5次隧道路径切换事件记录

Switch Type

路径切换类型,取值包括:

·     Backup LSP inused :由于主路径故障,流量切换到备路径进行转发

·     Main LSP recovered :由于主路径故障恢复,流量回切到主路径转发

·     Main LSP make-before-break:配置修改等导致的主MBB

Switch Time

隧道路径切换时间

Reason

路径切换的原因,取值包括:

·     Main LSP down:主路径down

·     Main LSP up:主路径up

·     Main LSP BFD down:BFD检测到主路径down

·     Main LSP BFD up:BFD检测到主路径up

·     Configuration changed:配置修改

Path detail

路径详细信息

Old path

切换前的路径信息,显示为从栈顶到栈底的标签栈信息

New path

切换后的路径信息,显示为从栈顶到栈底的标签栈信息

 

【相关命令】

·     diagnostic troubleshooting test te-tunnel lsp-event enable

1.6  MPLS L2VPN一键诊断命令

1.6.1  diagnostic troubleshooting health module l2vpn

diagnostic troubleshooting health module l2vpn命令用来对MPLS L2VPN模块执行一次健康度诊断。

【命令】

diagnostic troubleshooting health module l2vpn

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

本命令用来诊断MPLS L2VPN模块当前的运行状态是否健康。执行本命令会显示模块的不健康信息,供用户查看。

请先使用diagnostic troubleshooting health module l2vpn enable命令,开启MPLS L2VPN模块健康度一键诊断功能,否则,本命令执行失败。

【举例】

# 对MPLS L2VPN模块执行一次健康度诊断。

<Sysname> system

[Sysname] diagnostic troubleshooting health module l2vpn enable

[Sysname] diagnostic troubleshooting health module l2vpn

Show L2VPN health events:

--------------------------------------------------------------------------------

Health event                            Detect time                            Description

LABEL_NOT_ALLOCATED                     04-15 07:37:06                         ESI failed to apply for the label.

                                       (IfName=Vpna)

LABEL_NOT_ALLOCATED    04-15 07:37:06  Upwesi failed to apply for the

label.(VsiName=Vpna,PwId=200)

LABEL_NOT_ALLOCATED    04-15 07:37:06  EVPN VPLS failed to apply for the

label.(VsiName=Vpna)

LABEL_NOT_ALLOCATED    04-15 07:37:06  EVPN VPWS failed to apply for the

label.(XcgName=Xpna)

VN_EXCEED              04-15 07:38:16  Too many VNs.(

VsiName=Vpna,IpAaddr=1.1.1.1,PwId=200)

SRV6SID_NOT_ALLOCATED  04-15 07:38:16  SRv6 SID alloc failed.(VsiName=Vpna)

CONNECT_FAIL           04-15 07:38:16  The connection between l2vpn and l3vpn

failed. (ModeName=L3vpn)

AC_VIBRATE             04-15 07:38:16  AC flapping.(Minute=10,DataNum=20,

OscillationNum=30)

PW_VIBRATE             04-15 07:38:16  PW flapping.(Minute=10,DataNum=20,

OscillationNum=30)

COMMUNICATION_FAIL     04-15 07:38:16  RIB tunnel exception.(IpAddr=

10.1.1.2)

SMOOTH_SUCCESS         04-15 07:38:16  After l2vpn and ldp are smoothed,10 pwm

data are aged.(DataType=Ldp,Uismooth=10)

SMOOTH_EXCEED          04-15 07:38:16  L2vpn timed out for 60 minutes waiting for

ldp smooth end.(DataType=Ldp)

HA_RECOVER_FAIL        04-15 07:38:16  VSI vpna link ID HA recovery failed.

表1-11 diagnostic troubleshooting health module l2vpn命令显示信息描述表

字段

描述

Diag_Type

健康度事件类型,取值包括:

·     LABEL_NOT_ALLOCATED:标签申请失败

·     LINKID_NOT_ALLOCATED:linkid申请失败

·     VN_EXCEED:VN超规格

·     SRV6SID_NOT_ALLOCATED:SRv6 SID申请失败

·     CONNECT_FAIL:建立连接失败

·     COMMUNICATION_FAIL:通信失败

·     HA_RECOVER_FAIL:从HA恢复失败

·     SMOOTH_EXCEED:平滑超过60分钟

·     SMOOTH_SUCCESS:平滑成功

·     PW_VIBRATE:PW震荡

·     AC_VIBRATE:AC震荡

Detect-Time

发现异常的时间

Description

健康度事件的详细描述

 

【相关命令】

·     diagnostic troubleshooting health module l2vpn enable

1.6.2  diagnostic troubleshooting test l2vpn-pw establish-abnormal

diagnostic troubleshooting test l2vpn-pw establish-abnormal命令用来对PW建立失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test l2vpn-pw establish-abnormal { vsi vsi-name | xconnect-group-name group-name connection connection-name } peer ip-address pw-id pw-id

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

vsi vsi-name:对指定VSI内的PW建立失败事件进行一键诊断。vsi-name表示VSI的名称,为1~31个字符的字符串,区分大小写。

xconnect-group-name group-name connection connection-name:对指定交叉连接内的PW建立失败事件进行一键诊断。group-name表示交叉连接组的名称,为1~31个字符的字符串,区分大小写;connection-name表示交叉连接的名称,为1~20个字符的字符串,不能包含字符“-”,区分大小写。

peer ip-address:指定PW远端PE的LSR ID。ip-address表示为远端PE的LSR ID。

pw-id pw-id:指定PW的PW ID。pw-id为PW的PW ID,取值范围为1~4294967295。

【使用指导】

请先使用diagnostic troubleshooting test l2vpn-pw establish-abnormal enable命令,开启PW建立失败事件一键诊断功能,否则,本命令执行失败。

开启一键诊断功能并完成MPLS L2VPN配置后,MPLS L2VPN模块会将PW建立失败的运行数据记录到GOLD模块,以便GOLD模块对PW建立失败进行一键诊断。

记录PW建立失败的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS L2VPN模块的运行状态,可以关闭PW建立失败的一键诊断功能,减少对系统性能的影响。

【举例】

# 对VSI名称为vpna内的PW建立失败事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test l2vpn-pw establish-abnormal enable

[Sysname] diagnostic troubleshooting test l2vpn-pw establish-abnormal vsi vpna peer 1.1.1.9 pw-id 1

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

--------------------------------------------------------------------------------

Peer IP      PW ID      PW Type         Reason(All need resolved)

1.1.1.9      1          vlan            MTU not match

--------------------------------------------------------------------------------

表1-12 diagnostic troubleshooting test l2vpn-pw establish-abnormal命令显示信息描述表

字段

描述

Peer IP

远端PE的IP地址

PW ID

PW的标识

PW Type

PW的数据封装类型,取值包括Ethernet、VLAN和“-”。“-”表示未指定PW的数据封装类型

Reason

PW建立失败的原因,取值包括:

·     BFD session for PW down:用来检测PW的BFD会话状态为down

·     BGP RD was deleted:BGP的RD被删除

·     BGP RD was empty:未配置BGP的RD

·     Control word not match:PW两端控制字功能配置不一致

·     Encapsulation not match:PW两端封装类型不一致

·     Label not allocated:标签未分配

·     LDP interface parameter not match:PW两端接口LDP协商参数不一致

·     Local and remote LDP PWs have different TAIIs:本端携带的SAII与对端携带的TAII不同

·     Non-existent remote LDP PW:对端设备已删除LDP PW

·     Local AC Down:本地AC状态为down

·     Local AC was non-existent:未配置本地AC

·     Local LDP PW VN defect:本地LDP PW存在VN缺陷

·     Local LDP PW was not sent mapping message:本端未发送LDP mapping消息

·     Local VSI Down:本地VSI状态为down

·     MTU not match:PW两端MTU不一致

·     Remote AC Down:对端AC状态down

·     Remote LDP PW VN defect:远端LDP PW存在VN缺陷

·     PW down after created:创建PW后,PW的初始状态为down

·     Tunnel Down:承载PW的隧道down

 

【相关命令】

·     diagnostic troubleshooting test l2vpn-pw establish-abnormal enable

1.6.3  diagnostic troubleshooting test l2vpn-pw flap

diagnostic troubleshooting test l2vpn-pw flap命令用来对PW震荡事件进行一键诊断。

【命令】

diagnostic troubleshooting test l2vpn-pw flap { vsi vsi-name | xconnect-group-name group-name connection connection-name } peer ip-address pw-id pw-id

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

vsi vsi-name:对指定VSI内的PW震荡事件进行一键诊断。vsi-name表示VSI的名称,为1~31个字符的字符串,区分大小写。

xconnect-group-name group-name connection connection-name:对指定交叉连接内的PW震荡事件进行一键诊断。group-name表示交叉连接组的名称,为1~31个字符的字符串,区分大小写;connection-name表示交叉连接的名称,为1~20个字符的字符串,不能包含字符“-”,区分大小写。

peer ip-address:指定PW远端PE的LSR ID。ip-address表示为远端PE的LSR ID。

pw-id pw-id:指定PW的PW ID。pw-id为PW的PW ID,取值范围为1~4294967295。

【使用指导】

请先使用diagnostic troubleshooting test l2vpn-pw flap enable命令,开启PW震荡事件一键诊断功能,否则,本命令执行失败。

开启一键诊断功能并完成MPLS L2VPN配置后,MPLS L2VPN模块会将PW震荡的运行数据记录到GOLD模块,以便GOLD模块对PW震荡进行一键诊断。

记录PW震荡的运行数据会消耗设备资源,影响系统性能。如果用户不关心MPLS L2VPN模块的运行状态,可以关闭PW震荡的一键诊断功能,减少对系统性能的影响。

【举例】

# 对VSI名称为vpna内的PW震荡事件进行一键诊断。

<Sysname> system

[Sysname] diagnostic troubleshooting test l2vpn-vsi-pw flap vsi vpna peer 1.1.1.9 pw-id 1

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

----------------------------------------------------------------------------------------Peer IP          PW ID      PW type          State       Change time          Reason

1.1.1.9          1          vlan             Down->Up    2018/08/01 07:33:22  Tunnel Up

1.1.1.9          1          vlan             Up->Down    2018/08/01 07:29:58  Tunnel Down

表1-13 diagnostic troubleshooting test l2vpn-pw flap命令显示信息描述表

字段

描述

Peer IP

远端PE的IP地址

PW ID

PW的标识

PW type

PW的数据封装类型,取值包括Ethernet、VLAN、Unknown和“-”。“-”表示未指定PW的数据封装类型

State

PW状态切换

Change time

PW状态切换的时间

Reason

PW震荡的原因,取值包括:

·     BFD session for PW down:用来检测PW的BFD会话状态为down

·     BGP RD was deleted:BGP的RD被删除

·     BGP RD was empty:未配置BGP的RD

·     Control word not match:PW两端控制字功能配置不一致

·     Encapsulation not match:PW两端封装类型不一致

·     Label not allocated:标签未分配

·     LDP interface parameter not match:PW两端接口LDP协商参数不一致

·     Local and remote LDP PWs have different TAIIs:本端携带的SAII与对端携带的TAII不同

·     Non-existent remote LDP PW:对端设备已删除LDP PW

·     Local AC Down:本地AC状态为down

·     Local AC was non-existent:未配置本地AC

·     Local LDP PW VN defect:本地LDP PW存在VN缺陷

·     Local LDP PW was not sent mapping message:本端未发送LDP mapping消息

·     Local VSI Down:本地VSI状态为down

·     MTU not match:PW两端MTU不一致

·     Remote AC Down:对端AC状态down

·     Remote LDP PW VN defect:远端LDP PW存在VN缺陷

·     PW down after created:创建PW后,PW的初始状态为down

·     Tunnel Down:承载PW的隧道down

 

【相关命令】

·     diagnostic troubleshooting test l2vpn-pw flap enable

1.7  Ping一键诊断命令

1.7.1  diagnostic troubleshooting test ping failed-reason

diagnostic troubleshooting test ping failed-reason命令用来对Ping失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test ping failed-reason [ -a source-ip | -f | -i interface-type interface-number | -s packet-size | -t timeout ] [ vpn-instance vpn-instance-name ] { ip-address ipv4-address | ipv6-address ipv6-address }

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

-a source-ip:指定ICMP回显请求(ECHO-REQUEST)报文的源IP地址。该地址必须是设备上已配置的IP地址。不指定该参数时,ICMP回显请求报文的源IP地址是该报文出接口的主IP地址。

-f:将长度大于出接口MTU的报文直接丢弃,即不允许对发送的ICMP回显请求报文进行分片。

-i interface-type interface-number:指定发送ICMP回显请求报文的接口的类型和编号。不指定该参数时,将根据目的IP查找路由表或者转发表来确定发送ICMP回显请求报文的接口。

-s packet-size指定发送的ICMP回显请求报文的长度(不包括IP和ICMP报文头),取值范围为20~9600,单位为字节,缺省值为56。

-t timeout:指定ICMP回显应答(ECHO-REPLY)报文的超时时间,发送ICMP回显请求报文timeout时长后还没有收到ICMP回显应答报文,源端则认为ICMP回显应答报文超时。取值范围为0~65535,单位为毫秒,缺省值为2000。

vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。

ip-address ipv4-address:对目的地址为指定地址的IPv4 Trap报文进行一键诊断。ipv4-address表示IPv4地址。

ipv6-address ipv6-address:对目的地址为指定地址的IPv6 Trap报文进行一键诊断。ipv4-address表示IPv6地址。

【使用指导】

工作机制

执行本命令时,设备会使用命令行中指定的参数,Ping指定的IP地址,并显示Ping结果。如果Ping失败,还会显示失败原因,帮助用户定位Ping失败的问题。

Ping相关介绍请参见“网络管理和监控配置指导”中的“Ping和Tracert”。

注意事项

请先使用diagnostic troubleshooting test ping failed-reason enable命令,开启Ping失败事件一键诊断功能,否则,本命令执行失败。(Ping失败事件一键诊断功能缺省处于开启状态。)

【举例】

# 对目的地址2.1.1.1进行Ping一键诊断,Ping报文出接口为Gigabitethernet1/0/1。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test ping fail-reason –i gigabitethernet 1/0/1 ip 2.1.1.1

Diagnosis report:

  Ping failed.

  Failure reason: An incorrect outgoing interface was specified.

# 对目的地址1.1.1.1进行Ping一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test ping fail-reason ip-address 1.1.1.1

Diagnosis report:

  Ping succeeded.

表1-14 diagnostic troubleshooting test ping fail-reason命令诊断报告描述表

字段

描述

Diagnosis report

诊断报告

Ping succeeded

Ping成功

Ping failed

Ping失败

Failure reason

Ping失败的原因,取值请参见表1-15

 

表1-15 Ping失败原因描述表

字段

描述

The link transmission delay is too long.

链路传输时延过长

The ping packet is too large and discarded.

Ping报文过大而被丢弃

An incorrect outgoing interface was specified.

指定了错误的出接口,出接口没有到达目的地的链路

No reachable routes exist between the source and destination IPs.

源IP和目的IP之间没有可到达的路由

The specified destination VPN is incorrect.

指定的目的端VPN不正确

No APR entry to the destination exists.

不存在到达目的端的ARP表项

No FIB entry to the destination exists.

不存在到达目的端的FIB表项

ICMP packets are discarded due to ICMP attack defense.

因为ICMP防攻击功能导致ICMP报文被丢弃

Unknown reason.

未知原因

 

【相关命令】

·     diagnostic troubleshooting enable

1.8  SNMP一键诊断命令

1.8.1  diagnostic troubleshooting test snmp-agent packet-process-failure

diagnostic troubleshooting test snmp-agent packet-process-failure命令用来对SNMP报文处理失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test snmp-agent packet-process-failure [ ip-address ipv4-address | ipv6-address ipv6-address ] [ vpn-instance vpn-instance-name ] [ diagnose-time diagnostic-time ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

ip-address ipv4-address:表示IPv4地址。对于设备收到的SNMP报文,该地址用来过滤SNMP报文的源地址;对于设备发送的SNMP报文,该地址用来过滤SNMP报文的目的地址。

ipv6-address ipv6-address:表示IPv6地址。对于设备收到的SNMP报文,该地址用来过滤SNMP报文的源地址;对于设备发送的SNMP报文,该地址用来过滤SNMP报文的目的地址。

vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。

diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为60~1800,单位为秒,缺省值为300。本参数为诊断预计持续的时间,如果业务模块在该时间内未收集到足够多的数据,则诊断实际需要的时间可能比该时间稍长,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time

【使用指导】

工作机制

执行本命令后,设备会记录诊断持续时间内,SNMP发送以及接收失败的报文的信息。待诊断持续时间到达时,汇总并显示这些记录信息,帮助用户定位SNMP报文处理失败的问题。

SNMP功能的基本配置请参见“网络管理和监控配置指导”中的“SNMP”。

注意事项

请先使用diagnostic troubleshooting test snmp-agent packet-process-failure enable命令,开启SNMP报文处理失败事件一键诊断功能,否则,本命令执行失败。(SNMP报文处理失败事件一键诊断功能缺省处于开启状态。)

【举例】

# 对SNMP报文处理失败事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test snmp-agent packet-process-failure ip-address 1.1.1.1

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait.....................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

  SNMP global statistics

  SNMP packets received: 4

  SNMP packets sent: 4

Receiving failure detailed information:

  RecvTime        : 2022-06-07, 15:20:38:230

  ReqID           : 0

  SourceIP/VPN    : 10.1.1.1/--

  Verison/PDU type: v3/--

  FailReason      : Unknown user name.

  Solution        : Please check the corresponding configuration.

 

  RecvTime        : 2022-06-07, 15:20:38:230

  ReqID           : 0

  SourceIP/VPN    : 10.1.1.1/--

  Verison/PDU type: v3/--

  FailReason      : Unknown username.

  Solution        : Please check the corresponding configuration.

 

  RecvTime        : 2022-06-07, 15:20:38:230

  ReqID           : 0

  SourceIP/VPN    : 10.1.1.1/--

  Verison/PDU type: v3/--

  FailReason      : Unknown username.

  Solution        : Please check the corresponding configuration.

 

Sending failure detailed information:

  SendTime         : 2022-06-10, 19:30:35:288

  ReqID            : 1683

  DestIP/VPN       : 10.1.1.15/vpn1

  Verison/PDU type : v3/--

  FailReason       : SNMP PDUs had OuttooBig error-status.

  Solution         : Please check the corresponding configuration.

 

  SendTime         : 2022-06-10, 19:30:35:288

  ReqID            : 1683

  DestIP/VPN       : 10.1.1.15/vpn1

  Verison/PDU type : v3/--

  FailReason       : SNMP PDUs had OuttooBig error-status.

  Solution         : Please check the corresponding configuration.

表1-16 diagnostic troubleshooting test snmp-agent packet-process-failure命令显示信息描述表

字段

描述

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait.....................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

一键诊断开始的时间,诊断预计需要花费的时间

(诊断进行中)请等待……

一键诊断结束的时间,诊断实际花费的时间

Diagnosis report

诊断报告

SNMP global statistics

SNMP全局统计信息

SNMP packets received

诊断时间内SNMP接收到的报文数量

SNMP packets sent

诊断时间内SNMP发送出去的报文数量

Receiving failure detailed information

SNMP报文接收失败信息记录

Sending failure detailed information

SNMP报文发送失败信息记录

RecvTime

SNMP报文接收时的系统时间

SendTime

SNMP报文发送时的系统时间

ReqID

SNMP报文中携带的Request ID

SourceIP/VPN

设备接收的SNMP报文中的源IP地址/VPN信息

DestIP/VPN

设备发送的SNMP报文中的目的IP地址/VPN信息

FailReason

SNMP报文处理失败原因,取值请参见表1-17

Solution

针对该失败原因,提出的建议解决方案,取值为:

Please check the corresponding configuration:请检查对应的配置

 

表1-17 SNMP报文处理失败原因列表

字段

描述

Unknown securitymodel

未知的安全模式

Invalid messages

无效的消息

Unknown PDU handlers

未知的报文

Unsupported security level

不支持的安全等级

Message is not in the time window

消息不在时间窗口内

Unknown username

未知的用户名

Unknown engine IDs

未知的引擎号

Wrong digests

错误的摘要信息

Decryption error

解密错误

Unsupported version

不支持的版本

ASN.1 or BER errors in the process of decoding

在解码过程中发生ASN.1(Abstract Syntax Notation dot one,抽象记法1)或BER(Basic Encoding Rules,基本编码规则)错误

Unknown SNMP community name

未知的SNMP团体名

Operation not supported by the community

团体不支持的非法操作

SNMP PDUs had an IntooBig error

SNMP报文有IntooBig错误

SNMP PDUs had an InnoSuchName error

SNMP报文有noSuchName错误

SNMP PDUs had an InBadValue error

SNMP报文有InBadValue错误

SNMP PDUs had an IngenErr error

SNMP报文有IngenErr错误

SNMP PDUs had an OuttooBig erro

SNMP报文有OuttooBig错误

SNMP PDUs had an OutnoSuchName error

SNMP报文有OutnoSuchName错误

SNMP PDUs had an OutBadValue error

SNMP报文有OutBadValue错误

SNMP PDUs had an OutgenErr error

SNMP报文有OutgenErr错误

Alternate response class PDUs dropped silently

响应报文被静默丢弃

Forwarded confirmed class PDUs dropped silently

数据转发报文被静默丢弃

Unavailable contexts

不可用的上下文内容

Unknown contexts

未知的上下文内容

 

【相关命令】

·     diagnostic troubleshooting enable

1.8.2  diagnostic troubleshooting test snmp-agent packet-process-time

diagnostic troubleshooting test snmp-agent packet-process-time命令用来对SNMP报文处理耗时事件进行一键诊断。

【命令】

diagnostic troubleshooting test snmp-agent packet-process-time [ ip-address ipv4-address | ipv6-address ipv6-address ] [ vpn-instance vpn-instance-name ] [ diagnose-time diagnostic-time ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

ip-address ipv4-address:表示IPv4地址,收到的IPv4 SNMP报文中的源地址。

ipv6-address ipv6-address:表示IPv6地址,收到的IPv6 SNMP报文中的源地址。

vpn-instance vpn-instance-name:指定IP地址所属的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示IP地址位于公网中。

diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为60~1800,单位为秒,缺省值为300。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2*diagnostic-time

【使用指导】

工作机制

执行本命令后,设备会记录诊断持续时间内,SNMP处理每个报文需要的时间信息。待诊断持续时间到达时,汇总并显示这些记录信息,帮助用户定位SNMP报文处理耗时过长的问题。

SNMP功能的基本配置请参见“网络管理和监控配置指导”中的“SNMP”。

注意事项

请先使用diagnostic troubleshooting test snmp-agent packet-process-time enable命令,开启SNMP报文处理耗时事件一键诊断功能,否则,本命令执行失败。(SNMP报文处理耗时事件一键诊断功能缺省处于开启状态。)

【举例】

# 对SNMP报文处理耗时事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting snmp-agent packet-process-time

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

Diagnosis report:

  SNMP global statistics

  SNMP packets received   : 2

    RecvTime        : 2022-06-08, 09:07:20:568

    ReqID           : 1121      

    SourceIP/VPN    : 10.1.1.1/-

    Version/PDU type: v2c/get-next

    SNMPTime (ms)   : 0         

    APPTime (ms)    : 0         

    TotalTime (ms)  : 0         

    VBNum           : 3                      

    VB              : sysUpTime.0(1.3.6.1.2.1.1.3.0)=1008561,  sysName.0(1.3.6.1.2.1.1.5.0)=Sysname, sysServices.0(1.3.6.1.2.1.1.7.0)=86

 

    RecvTime        : 2022-06-08, 10:25:20:568

    ReqID           : 1650      

    SourceIP/VPN    : 10.1.1.5/-

    Version/PDU type: v1/get-next

    SnmpTime(ms)    : 0         

    AppTime(ms)     : 0         

    TotalTime(ms)   : 0         

    VBNum           : 3                      

    VB              : sysUpTime.0(1.3.6.1.2.1.1.3.0)=100881,  sysName.0(1.3.6.1.2.1.1.5.0)=Sysname, sysServices.0(1.3.6.1.2.1.1.7.0)=65

表1-18 diagnostic troubleshooting test snmp-agent packet-process-time命令显示信息描述表

字段

描述

Started at: 2022-06-29 07:08:38, estimated duration: 30 seconds.

Please wait......................

Ended at: 2022-06-29 07:09:08, actual duration: 30 seconds.

一键诊断开始的时间,诊断预计需要花费的时间

(诊断进行中)请等待……

一键诊断结束的时间,诊断实际花费的时间

Diagnosis report

诊断报告

SNMP global statistics

SNMP全局统计信息

SNMP packets received

诊断时间内SNMP接收到的报文数量

RecvTime

SNMP报文接收时的系统时间

ReqID

SNMP报文中携带的Request ID

SourceIP/VPN

SNMP报文中的源IP地址/VPN信息

Version/PDU type

SNMP报文中的版本号/操作类型

SNMPTime (ms)

SNMP插件处理耗时,单位是毫秒

APPTime (ms)

SNMP进程处理耗时,单位是毫秒

TotalTime (ms)

SNMP报文处理总耗时时间,单位是毫秒

VBNum

SNMP报文携带的绑定变量个数

VB

SNMP报文携带的绑定变量内容,最多显示8个

 

【相关命令】

·     diagnostic troubleshooting enable

1.8.3  diagnostic troubleshooting test snmp-agent trap-send-failure

diagnostic troubleshooting test snmp-agent trap-send-failure命令用来对SNMP Trap发送失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test snmp-agent trap-send-failure [ ip-address ipv4-address | ipv6-address ipv6-address ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

ip-address ipv4-address:表示IPv4地址,对目的地址为指定地址的IPv4 Trap报文进行一键诊断。

ipv6-address ipv6-address:表示IPv6地址,对目的地址为指定地址的IPv6 Trap报文进行一键诊断。

【使用指导】

工作机制

开启SNMP Trap发送失败事件一键诊断功能后,当SNMP Trap发送失败,SNMP会将Trap发送失败事件的相关信息记录下来。执行本命令时,设备会显示这些记录的信息,帮助用户定位SNMP Trap发送失败的问题。

SNMP Trap相关配置请参见“网络管理和监控配置指导”中的“SNMP”。

注意事项

请先使用diagnostic troubleshooting test snmp-agent trap-send-failure enable命令,开启SNMP Trap发送失败事件一键诊断功能,否则,本命令执行失败。(SNMP Trap发送失败事件一键诊断功能缺省处于开启状态。)

【举例】

# 查看SNMP Trap发送失败的统计信息。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test snmp-agent trap-send-failure

Trap name: coldStart

Target host:

Host 1:

  IP address     : 192.168.1.1

  SendTime       : 2022-06-08 15:50:31:296

  SecurityName   : abc

  Version        : v3

  VBNum          : 2

  VB             : sysUpTime.0=286976,snmpTrapOID.0=1.3.6.1.6.3.1.1.5.1

 

Host 2:

  IP address     : 192.168.1.35

  SendTime       : 2022-06-08 15:55:32:368

  SecurityName   : def

  Version        : v2c

  VBNum          : 2

  VB             : sysUpTime.0=365898, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.1

 

Trap name : warmStart

Target host:

Host 1:

  IP address     : 192.168.1.1

  SendTime       : 2022-06-08 15:55:36:259  

  SecurityName   : abc

  Version        : v2c

  VBNum          : 2

  VB             : sysUpTime.0=687682, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.2

Host 2:

  IP address     : 192.168.1.35

  SendTime           : 2022-06-08 16:15:12:566 

  SecurityName   : def

  Version        : v3

  VBNum          : 2

  VB             : sysUpTime.0=351528, snmpTrapOID.0=1.3.6.1.6.3.1.1.5.2

表1-19 diagnostic troubleshooting test snmp-agent trap-send-failure命令显示信息描述表

字段

描述

Trap Name

Trap的名字

Target host

接受SNMP Trap的设备的信息

Host[n]

接收Trap的目的主机的信息,n表示目的主机信息的编号

IP address

目的主机IP地址

SendTime

发送trap时的系统时间

Securityname

SNMP报文中的安全字

Version

SNMP报文中的版本号

Version/PDU type

SNMP报文中的版本号/操作类型

VBNum

SNMP报文携带的绑定变量个数

VB

SNMP报文携带的绑定变量内容,最多显示8个

 

【相关命令】

·     diagnostic troubleshooting enable

1.9  BGP一键诊断命令

1.9.1  diagnostic troubleshooting health module bgp

diagnostic troubleshooting health module bgp命令用来为BGP模块执行一次健康度诊断。

【命令】

diagnostic troubleshooting health module bgp

【视图】

系统视图

【缺省用户角色】

network-admin

【使用指导】

请先使用diagnostic troubleshooting health module bgp enable命令,开启BGP模块的健康度一键诊断功能,否则,本命令执行失败。(缺省情况下,BGP模块的健康度一键诊断功能处于开启状态)

本命令用来诊断BGP模块当前的运行状态是否健康。执行本命令后,终端会显示BGP模块的不健康信息,包括不健康信息记录的时间、不健康的类型以及造成不健康的原因,供用户查看。

系统正在执行一个模块的健康度诊断时,不允许同时执行其他模块的健康度诊断。

【举例】

# 查看BGP模块的健康度信息。

<Sysname> system-view

[Sysname] diagnostic troubleshooting health module bgp

Start diagnose at 2022-11-21 08:08:44

please wait.Done.

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

PADS_Type          Time                Reason

OPEN_ERROR         01-27 20:23:30      wrong AS number(Instance=bgp1, peer=1.1.1.1, VPN

instance=vpn1)

HEADER_ERROR       01-27 20:23:30      bad message length(Instance=bgp1, peer=2.1.1.1,

VPN instance=vpn1)

表1-20 diagnostic troubleshooting health module bgp命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44

开始健康度诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒

please wait.Done.

健康度诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束健康度诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及健康度诊断持续的实际时间

PADS_Type

模块不健康的类型,包括:

·     HEADER_ERROR:接收的BGP消息头错误

·     OPEN_ERROR:接收的Open消息错误

·     UPDATE_ERROR:接收的Update消息错误

·     FSM_ERROR:BGP状态机错误

·     SESSION_CEASE:BGP会话中止

Time

记录BGP模块不健康信息的时间

Reason

BGP模块不健康的原因,以及造成该原因的BGP会话信息。会话信息的格式为(Instance=instance, peer=peer, VPN instance=instance-name)。instance表示BGP会话所属BGP实例;peer表示BGP会话的对等体IP地址;instance-name表示BGP会话所属VPN实例,BGP会话处于公网时,instance-name显示为空;reason包括:

·     HEADER_ERROR类型对应的不健康原因:

¡     invalid Marker field:BGP消息头中的Marker字段不为全f

¡     bad message length:BGP消息头长度过长或过短

¡     bad message type:BGP消息头的类型错误

·     OPEN_ERROR类型对应的不健康原因:

¡     version unsupported:BGP版本不支持

¡     wrong AS number:BGP对等体的AS号错误

¡     BGP identifier conflicted:对端的Router ID与本端的Router ID相同导致冲突

¡     unsupported optional parameter:不支持的可选参数

¡     authentication failure:BGP会话的安全认证失败

¡     unacceptable hold time:Open消息中携带的会话保持时间不是协商后的时间

¡     unsupported capability type:可选参数中的capability类型不支持

·     UPDATE_ERROR类型对应的不健康原因:

¡     malformed attribute list:属性列表格式错误

¡     unrecognized well known attribute:对等体发送的Update消息中携带不支持的公认属性

¡     well known attribute missing:对等体发送的Update消息中缺少必须的公认属性

¡     attribute flags error:对等体发送的Update消息中携带的路由属性标志错误

¡     attribute length error:对等体发送的Update消息中携带的路由属性长度错误

¡     invalid NEXT HOP Attribute:对等体发送的Update消息中携带无效的下一跳属性

¡     optional attribute error:对等体发送的Update消息中携带的可选属性错误

¡     invalid destination network:对等体发送的Update消息中携带错误的目的网络地址

¡     malformed AS path attribute:对等体发送的Update消息中AS路径属性的形式错误

·     FSM_ERROR类型对应的不健康原因:

¡     receive unexpected message in OpenSent state:BGP会话处于OpenSent状态时,本端设备收到了不应收到的消息类型

¡     receive unexpected message in OpenConfirm state:BGP会话处于OpenConfirm状态时,本端设备收到了不应收到的消息类型

¡     receive unexpected message in Established state:BGP会话处于Established状态时,本端设备收到了不应收到的消息类型

·     SESSION_CEASE类型对应的不健康原因:

¡     maximum number of prefixes reached:从对等体接收到的路由数量超过了可以接收的最大数量

¡     administrative shutdown:手工复位了本端设备与BGP对等体的会话

¡     address family deleted:BGP会话所在的地址族被删除

¡     administrative reset:手工复位了本端设备与所有BGP对等体的会话

¡     connection rejected:BGP会话连接被拒绝

¡     other configuration change:其他配置变化

¡     connection collision resolution:BGP会话连接冲突

¡     insufficient of resources:系统资源不足

 

【相关命令】

·     diagnostic troubleshooting health enable

1.9.2  diagnostic troubleshooting test establish-abnormal bgp

diagnostic troubleshooting test establish-abnormal bgp命令用来对指定实例下所有BGP会话建立失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test establish-abnormal bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话建立失败事件进行一键诊断。

vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话建立失败事件进行一键诊断。

【使用指导】

请先使用diagnostic troubleshooting test establish-abnormal bgp enable命令,开启BGP会话建立失败事件一键诊断功能,否则,本命令执行失败。(BGP会话建立失败事件一键诊断功能缺省处于开启状态)

BGP会话建立失败事件一键诊断功能处于开启状态时,设备会自动将BGP会话建立失败的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话建立失败诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话建立失败的原因。

有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。

系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。

【举例】

# 对default实例下的所有公网对等体进行BGP会话建立失败事件一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test peer-establish-abnormal bgp

Start diagnose at 2022-11-21 08:08:44

please wait.Done.

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

BGP local router ID: 10.1.1.1

IPv4-family for VPN instance vpn1:

Peer           Time               State               Reason

1.1.1.1        01-27 20:23:30     OpenConfirm         memory threshold was reached

2.1.1.1        01-27 20:23:30     OpenConfirm         bad message head

表1-21 diagnostic troubleshooting test peer-establish-abnormal bgp命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44

开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒

please wait.Done.

一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间

BGP local router ID

本地的路由器ID

IPv4-family for public

公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv6-family for public

公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv4-family for VPN instance vpn-instance-name

VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

IPv6-family for VPN instance vpn-instance-name

VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

Peer

对等体的IP地址

Time

BGP会话建立失败的时间。格式为MM-DD hh:mm:ss,其中MM为月、DD为日、hh为小时、mm为分钟、ss为秒

State

发生BGP会话建立失败事件时,BGP会话所处的状态

Reason

BGP会话建立失败的原因,包括:

·     router ID missing:Router ID缺失

·     memory threshold was reached:系统内存达到门限

·     peer limit was reached:BGP对等体的数量超过限制

·     peer not exist:指定的对等体不存在

·     direct EBGP session source interface check failed:不存在与直连EBGP对等体建立连接的UP状态物理接口

·     source interface update failed upon TCP reconnection:重新建立TCP连接时,TCP连接的源接口更新失败

·     TCP connection-socket bind failed:TCP连接绑定套接字失败

·     TCP connection failed:TCP连接失败

·     TCP connection info not exist:BGP会话的TCP连接信息不存在

·     send buffer full:BGP会话发送缓冲区已满

·     bad message head:本地设备收到无效的BGP消息头

·     bad message length:本地设备接收的BGP消息长度无效

·     bad message type:本地设备接收的BGP消息类型无效

·     received messages not matching the FSM state:收到了与当前BGP会话状态不对应的报文

·     inconsistent BGP version or holdtime:对等体的BGP版本或者会话保持时间与本端不一致

·     failed to parse optional parameters in open message:BGP Open消息中的可选参数解析失败

·     not enabled peer in correct address family:对等体没有在正确的地址族下使能

·     inconsistent AS number:对端设备的AS号与本端指定的对等体AS号不一致

·     conflicting router id:对等体的Router ID与本端设备发送冲突

·     keepalive message sending failed:Keepalive消息发送失败

·     failed to obtain TCP connection info in openconfirm state:在Openconfim状态下获取TCP连接的信息失败

·     failed to create keepalive timer:Keepalive消息定时器创建失败

 

【相关命令】

·     diagnostic troubleshooting enable

1.9.3  diagnostic troubleshooting test flap bgp

diagnostic troubleshooting test flap bgp命令用来对指定实例下所有BGP对等体的会话断开事件进行一键诊断。

【命令】

diagnostic troubleshooting test flap bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话断开事件进行一键诊断。

vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话断开事件进行一键诊断。

【使用指导】

请先使用diagnostic troubleshooting test flap bgp enable命令,开启BGP会话断开事件一键诊断功能,否则,本命令执行失败。(BGP会话断开事件一键诊断功能缺省处于开启状态)

BGP会话断开事件一键诊断功能处于开启状态时,设备会自动将BGP会话断开的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话断开诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话断开的原因。

有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。

系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。

【举例】

# 对default实例下所有公网BGP对等体的断开事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test flap bgp

Start diagnose at 2022-11-21 08:08:44

please wait.Done.

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

BGP local router ID: 10.1.1.1

IPv4-family for VPN instance vpn1:

Peer            Time                State                  Reason

1.1.1.1         01-27 20:23:30      Established->Idle      address family deleted

表1-22 diagnostic troubleshooting test peer-flap bgp命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44

开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒

please wait.Done.

一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间

BGP local router ID

本地的路由器ID

IPv4-family for public

公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv6-family for public

公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv4-family for VPN instance vpn-instance-name

VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

IPv6-family for VPN instance vpn-instance-name

VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

Peer

对等体的IP地址

Time

BGP会话断开的时间。格式为MM-DD hh:mm:ss,其中MM为月、DD为日、hh为小时、mm为分钟、ss为秒

State

BGP会话断开后,BGP会话的状态变化

Reason

BGP会话断开的原因,包括:

·     connection not synchronized:连接不同步,目前实现为收到的BGP消息头前16字节不全为F

·     bad message length:本地设备接收到的BGP消息长度无效

·     bad message type:本地设备接收到的BGP消息类型无效

·     withdrawn message too long:Update撤销消息的长度过长

·     route attribute length too long:Update消息中携带的路由属性长度过长

·     route attribute appears multiple times:同一路由属性在同一Update消息中出现了多次

·     route attribute length field shorter than 2 bytes:在Update消息中,描述路由属性长度的字段不足2字节

·     extended attribute length field shorter than 2 bytes:在Update消息中,路由属性的长度可扩展,但描述路由属性长度的字段不足2字节

·     attribute length field shorter than 1 byte:在Update消息中,路由属性的长度为正常长度,但描述路由属性长度的字段不足1字节

·     link-state attribute error:Update消息中的链路状态属性形式错误

·     unrecognized well-known attribute:Update消息中携带本端不支持的公认属性

·     attribute-type attribute missed:Update消息中必须携带的路由属性丢失,attribute-type表示丢失的路由属性,取值包括:

¡     ORIGIN:源属性

¡     AS_PATH:AS路径属性

¡     LOCAL_PREF:本地优先级属性

¡     NEXT_HOP:下一跳属性

·     attribute flags error:Update消息中携带的路由属性标志位错误

·     attribute-type attribute length error:Update消息中携带的路由属性长度错误,attribute-type表示长度错误的路由属性,取值包括:

¡     AS_PATH:包含2字节AS号的AS路径属性

¡     AS4_PATH:包含4字节AS号的AS路径属性

¡     CLUSTER_LIST:集群ID列表属性

¡     AGGREGATOR:包含2字节AS号的聚合者属性

¡     AS4_AGGREGATOR:包含4字节AS号的聚合者属性

¡     ORIGIN:源属性

¡     NEXT_HOP:下一跳属性

¡     MED:多出口区分属性

¡     LOCAL_PREF:本地优先级属性

¡     ATOMIC_AGGREGATE:原子聚合属性

¡     ORIGINATOR_ID:起源者ID属性

¡     MP_REACH_NLRI:多协议可达NLRI属性

¡     COMMUNITY:团体属性

¡     EXT-COMMUNITY:扩展团体属性

·     attribute length exceeded the limit:Update消息中携带的路由属性长度超出限制

·     invalid ORIGIN attribute:Update消息中携带的源属性无效

·     invalid NEXT_HOP attribute:Update消息中携带的下一跳属性无效

·     invalid next hop length in MP_REACH_NLRI (address-family):在Update消息中,MP_REACH_NLRI属性的下一跳长度错误,address-family为发生下一跳长度错误的MP_REACH_NLRI属性所属的地址族,取值包括:

¡     4u:IPv4单播地址族

¡     MPLS:MPLS地址族

¡     VPNv4:VPNv4地址族

¡     6u:IPv6单播地址族

¡     VPNv6:VPNv6地址族

¡     L2VPN:L2VPN地址族

·     the length of MP_UNREACH_NLRI attribute is less than 3 bytes:Update消息中携带的MP_UNREACH_NLRI属性长度小于3字节

·     the length of MP_REACH_NLRI or MP_UNREACH_NLRI attribute exceeds the limit:Update消息中携带的MP_REACH_NLRI 或MP_UNREACH_NLRI属性长度超过限制

·     erroneous MP_REACH_NLRI or MP_UNREACH_NLRI attribute end position:Update消息中携带的MP_REACH_NLRI或MP_UNREACH_NLRI属性结束位置错误

·     invalid network field:目的网络地址字段无效

·     malformed AS_PATH:AS路径属性形式错误

·     hold timer expiration caused by local device:由本端设备造成的会话保持定时器超时

·     hold timer expiration caused by peer device:由对端设备造成的会话保持定时器超时

·     connect retry timer expired:会话重建定时器超时

·     TCP_CR_Acked event received:收到了TCP_CR_Acked事件

·     TCP_Connection_Confirmed event received:收到了TCP_Connection_Confirmed事件

·     open message received:收到Open消息

·     manualstop event received:收到manualstop事件

·     physical interface configuration changed:物理接口配置改变

·     BFD session down event received:收到BFD会话DOWN事件,BGP也断开相应的BGP会话

·     physical interface configuration changed:物理接口配置改变

·     maximum number of prefixes reached:从对等体收到的路由数量超过peer route-limit命令配置的最大数量

·     maximum number of prefixes reached in address-family:在指定地址族内,从对等提接收到的路由数量超过peer route-limit命令配置的最大数量,address-family为地址族名称,取值包括:

¡     IPv4 unicast:BGP IPv4单播地址族

¡     IPv6 unicast:BGP IPv6单播地址族

¡     VPNv4:BGP VPNv4地址族

¡     VPNv6:BGP VPNv6地址族

¡     The peer is configured with the peer ignore command:指定对等体配置了peer ignore命令来禁止与该对等体建立会话

·     address family deleted:建立BGP会话的地址族被删除

·     peer disabled:禁止本端设备与对等体交换路由信息

·     administrative reset:复位BGP会话或者BGP会话相关的配置改变导致BGP会话重新建立

·     connection rejected:TCP连接被对端拒绝

·     other configuration change:其他对等体的配置变化导致本端设备与当前对等体的会话断开

·     connection collision resolution:连接冲突

·     two connections exist and one uses MD5:存在两个连接,且其中一个配置了MD5认证

·     no memory to parse the attribute:解析路由属性时系统内存不足

·     no memory for the route:生成路由或者标签块信息时,获取不到内存

·     no memory to generate unreachable NLRI:封装不可达NLRI属性时申请不到内存

·     no memory for message encapsulation:封装BGP消息时申请不到内存

·     can’t get the VPN RD:解析前缀时获取不到RD

·     can’t get the VPN routing table:解析前缀时获取不到VPN路由表

·     can’t get the attributes:解析前缀时获取不到路由属性

·     entered severe memory state:进入二级门限告警

·     entered critical memory state:进入三级门限告警

 

【相关命令】

·     diagnostic troubleshooting enable

1.9.4  diagnostic troubleshooting test peer-establish-abnormal bgp

diagnostic troubleshooting test peer-establish-abnormal bgp命令用来对指定对等体的BGP会话建立失败事件进行一键诊断。

【命令】

diagnostic troubleshooting test peer-establish-abnormal bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ] peer { ip-address ipv4-address | ipv6-address ipv6-address } [ diagnostic-time diagnostic-time ]

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话建立失败事件进行一键诊断。

vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话建立失败事件进行一键诊断。

peer ip-address ipv4-address:对指定对等体的BGP会话建立失败事件进行一键诊断,ipv4-address为对等体的IPv4地址。

peer ipv6-address ipv6-address:对指定对等体的BGP会话建立失败事件进行一键诊断,ipv6-address为对等体的IPv6地址。

diagnostic-time diagnostic-time:诊断的预计持续时间,取值范围为1~60,单位为秒,缺省值为30。本参数为诊断预计持续的时间,诊断实际需要的时间和该时间可能不同,请以实际情况为准,但诊断实际需要的时间肯定小于等于2×diagnostic-time

【使用指导】

请先使用diagnostic troubleshooting test peer-establish-abnormal bgp enable命令,开启BGP会话建立失败事件一键诊断功能,否则,本命令执行失败。(BGP会话建立失败事件一键诊断功能缺省处于开启状态)

执行本命令后,设备会在指定的诊断持续时间内,重新尝试与未能成功建立BGP会话的对等体建立连接,并记录和显示在持续时间内BGP会话建立失败的诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话建立失败的原因。

系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。

【举例】

# 对default实例下的公网对等体1.1.1.1进行BGP会话建立失败事件一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test peer-establish-abnormal bgp peer ip-address 1.1.1.1 diagnostic-time 20

Start diagnose at 2022-11-21 08:08:44, Estimated time:20 seconds.

please wait.....................Done.

End diagnose at 2022-11-21 08:09:05,Actual time:21 seconds.

Diagnosis report:

BGP local router ID: 10.1.1.1

IPv4-family for VPN instance vpn1:

Peer             Time                 State                Reason

1.1.1.1          01-27 20:23:30       OpenConfirm          memory threshold was reached

表1-23 diagnostic troubleshooting test peer-establish-abnormal bgp peer命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44, Estimated time:20 seconds.

开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒。以及一键诊断预计的持续时间

please wait.....Done.

一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒。以及一键诊断持续的实际时间

Diagnosis report

诊断报告

BGP local router ID

本地的路由器ID

IPv4-family for public

公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv6-family for public

公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv4-family for VPN instance vpn-instance-name

VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

IPv6-family for VPN instance vpn-instance-name

VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

Peer

对等体的IP地址

Time

BGP会话建立失败的时间。格式为MM-DD hh:mm:ss,其中MM为月,DD为日,hh为小时,mm为分钟,ss为秒

State

发生BGP会话建立失败事件时,BGP会话所处的状态

Reason

BGP会话建立失败的原因,包括:

·     router ID missing:Router ID缺失

·     memory threshold was reached:系统内存达到门限

·     peer limit was reached:BGP对等体的数量超过限制

·     session not exist:指定的对等体不存在

·     direct EBGP session source interface check failed:不存在与直连EBGP对等体建立连接的UP状态物理接口

·     source interface update failed upon TCP reconnection:重新建立TCP连接时,TCP连接的源接口更新失败

·     TCP connection-socket bind failed:TCP连接绑定套接字失败

·     TCP connection failed:TCP连接失败

·     TCP connection info not exist:BGP会话的TCP连接信息不存在

·     send buffer full:BGP会话发送缓冲区已满

·     bad message head:本地设备收到无效的BGP消息头

·     bad message length:本地设备接收的BGP消息长度无效

·     bad message type:本地设备接收的BGP消息类型无效

·     received messages not matching the FSM state:收到了与当前BGP会话状态不对应的报文

·     inconsistent BGP version or holdtime:对等体的BGP版本或者会话保持时间与本端不一致

·     failed to parse optional parameters in open message:BGP Open消息中的可选参数解析失败

·     not enabled peer in correct address family:对等体没有在正确的地址族下使能

·     inconsistent AS number:对端设备的AS号与本端指定的对等体AS号不一致

·     conflicting router id:对等体的Router ID与本端设备发送冲突

·     keepalive message sending failed:Keepalive消息发送失败

·     failed to obtain TCP connection info in openconfirm state:在Openconfim状态下获取TCP连接的信息失败

·     failed to create keepalive timer:Keepalive消息定时器创建失败

 

【相关命令】

·     diagnostic troubleshooting enable

1.9.5  diagnostic troubleshooting test peer-flap bgp

diagnostic troubleshooting test peer-flap bgp命令用来对指定BGP对等体的会话断开事件进行一键诊断。

【命令】

diagnostic troubleshooting test peer-flap bgp [ instance instance-name ] [ vpn-instance vpn-instance-name ] peer { ip-address ipv4-address | ipv6-address ipv6-address }

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP会话断开事件进行一键诊断。

vpn-instance vpn-instance-name:指定的VPN实例。vpn-instance-name表示MPLS L3VPN的VPN实例名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则表示对公网中的BGP会话断开事件进行一键诊断。

peer ip-address ipv4-address:对指定对等体的BGP会话断开事件进行一键诊断,ipv4-address为对等体的IPv4地址。

peer ipv6-address ipv6-address:对指定对等体的BGP会话断开事件进行一键诊断,ipv6-address为对等体的IPv6地址。

【使用指导】

请先使用diagnostic troubleshooting test peer-flap bgp enable命令,开启BGP会话断开事件一键诊断功能,否则,本命令执行失败。(BGP会话断开事件一键诊断功能缺省处于开启状态)

BGP会话断开事件一键诊断功能处于开启状态时,设备会自动将BGP会话断开的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP会话断开诊断信息。诊断信息包括产生诊断信息的时间、产生诊断信息的原因等,帮助用户定位BGP会话断开的原因。

有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。

系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。

【举例】

# 对default实例下公网BGP对等体1.1.1.1进行断开事件的一键诊断。

<Sysname> system-view

[Sysname] diagnostic troubleshooting test peer-flap bgp peer ip-address 1.1.1.1

Start diagnose at 2022-11-21 08:08:44

please wait.Done.

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

BGP local router ID: 10.1.1.1

IPv4-family for VPN instance vpn1:

Peer            Time                State                  Reason

1.1.1.1         01-27 20:23:30      Established->Idle      address family deleted

表1-24 diagnostic troubleshooting test peer-flap bgp命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44

开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒

please wait.Done.

一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间

BGP local router ID

本地的路由器ID

IPv4-family for public

公网IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv6-family for public

公网IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息

IPv4-family for VPN instance vpn-instance-name

VPN实例IPv4地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

IPv6-family for VPN instance vpn-instance-name

VPN实例IPv6地址族下指定BGP对等体的BGP会话建立失败诊断信息,vpn-instance-name表示VPN实例的名称

Peer

对等体的IP地址

Time

BGP会话断开的时间。格式为MM-DD hh:mm:ss,其中MM为月,DD为日,hh为小时,mm为分钟,ss为秒

State

BGP会话断开后,BGP会话的状态变化

Reason

BGP会话断开的原因,包括:

·     connection not synchronized:连接不同步,目前实现为收到的BGP消息头前16字节不全为F

·     bad message length:本地设备接收到的BGP消息长度无效

·     bad message type:本地设备接收到的BGP消息类型无效

·     withdrawn message too long:Update撤销消息的长度过长

·     route attribute length too long:Update消息中携带的路由属性长度过长

·     route attribute appears multiple times:同一路由属性在同一Update消息中出现了多次

·     route attribute length field shorter than 2 bytes:在Update消息中,描述路由属性长度的字段不足2字节

·     extended attribute length field shorter than 2 bytes:在Update消息中,路由属性的长度可扩展,但描述路由属性长度的字段不足2字节

·     attribute length field shorter than 1 byte:在Update消息中,路由属性的长度为正常长度,但描述路由属性长度的字段不足1字节

·     link-state attribute error:Update消息中的链路状态属性形式错误

·     unrecognized well-known attribute:Update消息中携带本端不支持的公认属性

·     attribute-type attribute missed:Update消息中必须携带的路由属性丢失,attribute-type表示丢失的路由属性,取值包括:

¡     ORIGIN:源属性

¡     AS_PATH:AS路径属性

¡     LOCAL_PREF:本地优先级属性

¡     NEXT_HOP:下一跳属性

·     attribute flags error:Update消息中携带的路由属性标志位错误

·     attribute-type attribute length error:Update消息中携带的路由属性长度错误,attribute-type表示长度错误的路由属性,取值包括:

¡     AS_PATH:包含2字节AS号的AS路径属性

¡     AS4_PATH:包含4字节AS号的AS路径属性

¡     CLUSTER_LIST:集群ID列表属性

¡     AGGREGATOR:包含2字节AS号的聚合者属性

¡     AS4_AGGREGATOR:包含4字节AS号的聚合者属性

¡     ORIGIN:源属性

¡     NEXT_HOP:下一跳属性

¡     MED:多出口区分属性

¡     LOCAL_PREF:本地优先级属性

¡     ATOMIC_AGGREGATE:原子聚合属性

¡     ORIGINATOR_ID:起源者ID属性

¡     MP_REACH_NLRI:多协议可达NLRI属性

¡     COMMUNITY:团体属性

¡     EXT-COMMUNITY:扩展团体属性

·     attribute length exceeded the limit:Update消息中携带的路由属性长度超出限制

·     invalid ORIGIN attribute:Update消息中携带的源属性无效

·     invalid NEXT_HOP attribute:Update消息中携带的下一跳属性无效

·     invalid next hop length in MP_REACH_NLRI (address-family):在Update消息中,MP_REACH_NLRI属性的下一跳长度错误,address-family为发生下一跳长度错误的MP_REACH_NLRI属性所属的地址族,取值包括:

¡     4u:IPv4单播地址族

¡     MPLS:MPLS地址族

¡     VPNv4:VPNv4地址族

¡     6u:IPv6单播地址族

¡     VPNv6:VPNv6地址族

¡     L2VPN:L2VPN地址族

·     the length of MP_UNREACH_NLRI attribute is less than 3 bytes:Update消息中携带的MP_UNREACH_NLRI属性长度小于3字节

·     the length of MP_REACH_NLRI or MP_UNREACH_NLRI attribute exceeds the limit:Update消息中携带的MP_REACH_NLRI 或MP_UNREACH_NLRI属性长度超过限制

·     erroneous MP_REACH_NLRI or MP_UNREACH_NLRI attribute end position:Update消息中携带的MP_REACH_NLRI或MP_UNREACH_NLRI属性结束位置错误

·     invalid network field:目的网络地址字段无效

·     malformed AS_PATH:AS路径属性形式错误

·     hold timer expiration caused by local device:由本端设备造成的会话保持定时器超时

·     hold timer expiration caused by peer device:由对端设备造成的会话保持定时器超时

·     connect retry timer expired:会话重建定时器超时

·     TCP_CR_Acked event received:收到了TCP_CR_Acked事件

·     TCP_Connection_Confirmed event received:收到了TCP_Connection_Confirmed事件

·     open message received:收到Open消息

·     manualstop event received:收到manualstop事件

·     physical interface configuration changed:物理接口配置改变

·     BFD session down event received:收到BFD会话DOWN事件,BGP也断开相应的BGP会话

·     physical interface configuration changed:物理接口配置改变

·     maximum number of prefixes reached:从对等体收到的路由数量超过peer route-limit命令配置的最大数量

·     maximum number of prefixes reached in address-family:在指定地址族内,从对等提接收到的路由数量超过peer route-limit命令配置的最大数量,address-family为地址族名称,取值包括:

¡     IPv4 unicast:BGP IPv4单播地址族

¡     IPv6 unicast:BGP IPv6单播地址族

¡     VPNv4:BGP VPNv4地址族

¡     VPNv6:BGP VPNv6地址族

¡     The peer is configured with the peer ignore command:指定对等体配置了peer ignore命令来禁止与该对等体建立会话

·     address family deleted:建立BGP会话的地址族被删除

·     peer disabled:禁止本端设备与对等体交换路由信息

·     administrative reset:复位BGP会话或者BGP会话相关的配置改变导致BGP会话重新建立

·     connection rejected:TCP连接被对端拒绝

·     other configuration change:其他对等体的配置变化导致本端设备与当前对等体的会话断开

·     connection collision resolution:连接冲突

·     two connections exist and one uses MD5:存在两个连接,且其中一个配置了MD5认证

·     no memory to parse the attribute:解析路由属性时系统内存不足

·     no memory for the route:生成路由或者标签块信息时,获取不到内存

·     no memory to generate unreachable NLRI:封装不可达NLRI属性时申请不到内存

·     no memory for message encapsulation:封装BGP消息时申请不到内存

·     can’t get the VPN RD:解析前缀时获取不到RD

·     can’t get the VPN routing table:解析前缀时获取不到VPN路由表

·     can’t get the attributes:解析前缀时获取不到路由属性

·     entered severe memory state:进入二级门限告警

·     entered critical memory state:进入三级门限告警

 

【相关命令】

·     diagnostic troubleshooting enable

1.9.6  diagnostic troubleshooting test route-record bgp flowspec

diagnostic troubleshooting test route-record bgp flowspec命令用来对BGP Flowspec路由增删事件进行一键诊断。

【命令】

diagnostic troubleshooting test route-record bgp [ instance instance-name ] flowspec

【视图】

系统视图

【缺省用户角色】

network-admin

【参数】

instance instance-name:指定的BGP实例。instance-name表示BGP实例的名称,为1~31个字符的字符串,区分大小写。如果未指定本参数,则对default实例下的BGP Flowspec路由增删事件进行一键诊断。

【使用指导】

请先使用diagnostic troubleshooting test test route-record bgp enable命令,开启BGP Flowspec路由增删事件一键诊断功能,否则,本命令执行失败。(BGP Flowspec路由增删事件一键诊断功能缺省处于开启状态)

BGP Flowspec路由增删事件一键诊断功能处于开启状态时,设备会自动将BGP Flowspec路由的添加和删除信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的内存中。执行本命令后,设备会显示GOLD模块内存中记录的BGP Flowspec路由增删事件诊断信息。诊断信息包括产生诊断信息的时间、添加和删除的BGP Flowspec路由的详细信息等。

有关GOLD的详细介绍,请参见“网络管理和监控配置指导”中的“GOLD”。

系统正在对某一事件进行一键诊断时,不允许同时对其他事件进行一键诊断。

【举例】

# 对default实例BGP IPv4 Flowspec地址族下的路由增删事件进行一键诊断。

<Sysname> system-view

[Sysname] diagnose trouble-shooting test route-record bgp flowspec

 

  ChangeType : ADD

  Time : 2022-02-21 18:24:36

  VPN-Instance Name : vpn1

  From : 10.1.1.1

  Network:

    Source IP : 10.10.1.0/24

    Protocol : =0|=1|=6

    Dest.Port : =1000

    Src.Port : =179

    ICMP Type : =10

    ICMP Code : =200|=300

    TCPFlags : =255

    Length : =1024

    DSCP : =6|=2

    Frag : =4/528

  Ext-Community :

    CO-Flag : Color(01:1)

    FLOWSPEC RATE : 324 Bps

    FLOWSPEC ACTION : 32

 

  ChangeType : DEL

  Time : 2022-02-21 18:24:36

  VPN-Instance Name : vpn2

  From : 11.1.1.1

  Network:

    Source IP : 11.10.1.0/24

    Protocol : =0|=1|=6

    Dest.Port : =1000

    Src.Port : =179

    ICMP Type : =10

    ICMP Code : =200|=300

    TCPFlags : =255

    Length : =1024

    DSCP : =6|=2

    Frag : =4/528

  Ext-Community :

    CO-Flag : Color(01:1)

    FLOWSPEC RATE : 324 Bps

    FLOWSPEC ACTION : 32

表1-25 命令显示信息描述表

字段

描述

Start diagnose at 2022-11-21 08:08:44

开始一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒

please wait.Done.

一键诊断过程中的打印信息,打印该信息时请耐心等待诊断完成

End diagnose at 2022-11-21 08:08:45,Actual time:1 seconds.

结束一键诊断的时间,格式为YYYY-MM-DD hh:mm:ss,其中YYYY为年、MM为月、DD为日、hh为时、mm为分、ss为秒,以及一键诊断持续的实际时间

ChangeType

路由的事件类型,包括:

·     ADD:路由被添加到BGP Flowspec路由表

·     DEL:路由从BGP Flowspec路由表中删除

Time

路由增删事件发生的时间

VPN-Instance Name

路由所属的VPN实例

Public-instance

路由属于公网实例

From

发送该BGP Flowspec路由的对等体IP地址

Network

BGP Flowspec路由的前缀信息

Ext-Community

BGP Flowspec路由携带的扩展团体属性

 

【相关命令】

·     diagnostic troubleshooting enable

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们