24-一键诊断配置
本章节下载: 24-一键诊断配置 (275.59 KB)
目 录
一键诊断是设备提供的一种智能诊断功能,可以24小时不间断、全方位地对各业务模块故障进行自动发现、自动诊断。用户可根据需要开启或关闭一键诊断功能。
一键诊断主要包括以下两个方面的功能:
· 业务模块健康度的一键诊断
该功能用于诊断业务模块能否正常提供服务。如果业务模块功能异常,或者运行状态错误,导致业务模块无法正常提供服务,系统会判定业务模块发生了不健康事件,并记录不健康事件的相关信息,便于用户了解业务模块的运行状态。
· 业务功能的一键诊断
该功能用于诊断业务模块的功能是否运行正常,帮助用户定位业务功能异常问题。例如SNMP Trap发送失败一键诊断用于诊断是否出现过SNMP Trap发送失败事件以及失败的原因。
本章节内容适用于业务功能的一键诊断。业务模块健康度的一键诊断是使用业务模板的当前运行数据判断业务模块当前是否运行正常,是否健康。
Comware研发团队基于日常网络维护经验,并结合客户历史申报的故障进行大数据分析,总结出典型的故障模式,设计出专业的测试用例(以下简称测试例)、测试项,提供常见故障诊断。其中:
· 测试例为设备启动软件包中携带的脚本文件,用来对设备硬件和软件功能进行检测。
· 测试例中可能包含多个测试项,每个测试项代表设备硬件中的某个部件或者功能点。
图1-1 测试例和测试项示意图
用户自行在设备上执行测试项,设备运行测试项对应的脚本,自动采样设备的运行数据,获取设备、业务的运行状态,自动对这些数据进行分析、诊断,给出诊断结论和处理建议,对指定的故障进行一键诊断。
一键诊断是GOLD(Generic OnLine Diagnostics,通用在线诊断)模块的子功能。业务模块和GOLD模块配合可以实现针对业务模块的一键诊断功能。为满足不同业务模块故障诊断的需要,设备支持以下方式的一键诊断:
· 仅根据历史数据进行一键诊断
· 仅根据当前运行数据进行一键诊断
· 根据历史数据或者当前数据进行一键诊断
· 执行一次性动作,并根据动作执行结果来进行一键诊断
部分测试项会根据业务模块的历史运行数据,进行本模块功能的一键诊断。如图1-2所示,根据历史数据进行一键诊断的处理流程如下:
(1) 用户开启测试项的一键诊断功能并完成业务模块的配置后,业务模块按周期对测试项监控的对象进行采样,并将采样值记录到GOLD模块的数据库。
不同诊断功能的采样对象以及采样周期可能不同。采样对象以及采样周期已经在测试脚本中明确,不支持命令行配置。
(2) 用户执行一键诊断命令。
(3) GOLD模块从数据库中获取该测试例对应的历史数据,测试例对获取到的历史数据进行分析,并获得诊断结果。
(4) 设备通过命令行界面输出诊断结果。
例如,开启SNMP Trap发送失败事件一键诊断功能后,设备运行过程中,SNMP Trap发送失败测试项会将SNMP Trap发送失败事件的相关信息(NMS的IP地址、Trap的发送时间、使用的安全字等信息)保存到GOLD模块。当进行SNMP Trap发送失败事件一键诊断时,设备会显示GOLD模块保存的所有Trap发送失败事件的信息,帮助用户定位SNMP Trap发送失败的问题。
部分业务功能仅关注当前运行状态,这些业务功能的测试项会从开启诊断功能开始,持续收集一段时间的运行数据,并根据这些数据进行本模块功能的一键诊断。如图1-3所示,根据当前运行数据进行一键诊断的处理流程如下:
(1) 用户开启测试项的一键诊断功能并完成业务模块的配置后,业务模块会和GOLD模块建立LIPC(Leopard Inter-process Communication,Leopard版本进程间通信)连接。LIPC连接为一种设备内部进程间的通信通道。
(2) 用户执行一键诊断命令。
(3) GOLD模块通知业务模块开始诊断,并告知诊断持续时间等诊断参数。
(4) 业务模块会按周期对测试项监控的对象进行采样,并将采样值记录到GOLD模块的数据库。(采样周期的取值由业务模块在出厂时固定,不同功能使用的采样周期可能不同)
(5) 等待诊断预计持续时间到达,GOLD模块通知业务模块诊断结束。
(6) 测试例通知GOLD模块去数据库取业务模块记录的数据,并对获取到的数据进行分析,获得诊断结果。
(7) 设备通过命令行界面输出诊断结果。
部分测试项提供的诊断非常灵活,用户可通过命令行参数,选择使用历史数据一键诊断历史故障,也可以根据当前运行数据一键诊断当前故障。
部分业务模块的一键诊断功能无需周期采样,也无需存储采样数据。用户执行一键诊断命令行,就会触发业务模块执行一次性动作(一次性动作是指一个或一组命令行),并根据动作执行结果来进行故障分析和诊断。
例如,执行Ping失败事件一键诊断,设备会使用命令行指定的参数Ping指定的IP地址,显示Ping操作的执行结果。如果Ping失败,设备还会显示失败原因,帮助用户定位Ping失败的问题。
支持业务功能一键诊断的业务模块包括:NETCONF、SNMP、CPU、MEMORY、OSPF等,可通过执行diagnostic troubleshooting test ?命令来获取支持一键诊断的业务模块,执行diagnostic troubleshooting test test-name ?命令来获取支持一键诊断的业务功能。
支持健康度一键诊断功能的业务模块包括VXLAN等,可通过执行diagnostic troubleshooting health module ?命令来获取支持一键诊断的业务模块。
仅缺省MDC支持配置一键诊断功能,非缺省MDC不支持执行一键诊断模块的所有命令。关于MDC的详细介绍请参见“虚拟化技术配置指导”中的“MDC”。
本文中描述的一键诊断配置任务均为可选配置,请根据运维需要选择配置。
直连Ping不通事件一键诊断功能处于开启状态的情况下,设备会自动将ping不通信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块。执行本命令后,设备会显示GOLD模块内存中记录的ping不通的诊断信息,其中包括产生此类信息的时间、原因等内容,帮助用户定位直连ping不通原因。
本功能仅支持在业务层面来诊断直连Ping不通原因。
(1) 进入系统视图。
system-view
(2) 开启直连ping不通事件一键诊断功能。
diagnostic troubleshooting test drvdiag ping enable
缺省情况下,直连ping不通事件一键诊断功能处于开启状态。
(3) 对直连ping不通异常事件进行一键诊断。
(分布式设备-独立运行模式)(集中式IRF设备)
diagnostic troubleshooting test drvdiag ping [ vpn-instance vpn-instance ][ source-ip ip-address | source-ipv6 ipv6-address] [ dest-ip ip-address | dest-ipv6 ipv6-address] [ interface interface-type interface-number ] [ -t time ] [ -brief ] [ slot slot-number ]
(分布式设备-IRF模式)
diagnostic troubleshooting test drvdiag ping [ vpn-instance vpn-instance ][ source-ip ip-address | source-ipv6 ipv6-address] [ dest-ip ip-address | dest-ipv6 ipv6-address] [ interface interface-type interface-number ] [ -t time ] [ -brief ] [ chassis chassis-number slot slot-number ]
ARP表项学习异常事件一键诊断功能处于开启状态的情况下,设备会自动将ARP表项学习异常的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块。执行本命令后,设备会显示GOLD模块内存中记录的ARP表项变化的诊断信息,其中包括产生此类信息的时间、原因等内容,帮助用户定位ARP表项学习异常的原因。
对于S12500G-AF系列交换机,本功能仅在SF系列接口板和SG系列接口板上生效。
本功能仅支持在业务层面来诊断ARP表项学习异常原因。
(1) 进入系统视图。
system-view
(2) 开启ARP表项学习异常事件一键诊断功能。
diagnostic troubleshooting test drvdiag arp enable
缺省情况下,ARP表项学习异常事件一键诊断功能处于开启状态。
(3) 对ARP表项学习异常事件进行一键诊断。
(独立运行模式)
diagnostic troubleshooting test drvdiag arp [ source-ip ip-address ] [ dest-ip ip-address ] [ source-mac mac-address ] [ dest-mac mac-address ] [ vlan vlan-id ] [ interface interface-type interface-number ] [ -t time ] [ slot slot-number ]
(IRF模式)
diagnostic troubleshooting test drvdiag arp [ source-ip ip-address ] [ dest-ip ip-address ] [ source-mac mac-address ] [ dest-mac mac-address ] [ vlan vlan-id ] [ interface interface-type interface-number ] [ -t time ] [ chassis chassis-number slot slot-number ]
ND表项学习异常事件一键诊断功能处于开启状态的情况下,设备会自动将ND表项学习异常的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块。执行本命令后,设备会显示GOLD模块内存中记录的ND表项变化的诊断信息,其中包括产生此类信息的时间、原因等内容,帮助用户定位ND表项学习异常的原因。
对于S12500G-AF系列交换机,本功能仅在SF系列接口板和SG系列接口板上生效。
本功能仅支持在业务层面来诊断ND表项学习异常原因。
(1) 进入系统视图。
system-view
(2) 开启ND表项学习异常事件一键诊断功能。
diagnostic troubleshooting test drvdiag nd enable
缺省情况下,ND表项学习异常事件一键诊断功能处于开启状态。
(3) 对ND表项学习异常事件进行一键诊断。
(独立运行模式)
diagnostic troubleshooting test drvdiag nd [ source-ip ipv6-address ] [ dest-ip ipv6-address ] [ source-mac mac-address ] [ dest-mac mac-address ] [ vlan vlan-id ] [ interface interface-type interface-number ] [ -t time ] [ slot slot-number ]
(IRF模式)
diagnostic troubleshooting test drvdiag nd [ source-ip ipv6-address ] [ dest-ip ipv6-address ] [ source-mac mac-address ] [ dest-mac mac-address ] [ vlan vlan-id ] [ interface interface-type interface-number ] [ -t time ] [ chassis chassis-number slot slot-number ]
ARP表项学习异常事件一键诊断功能处于开启状态的情况下,设备会自动将ARP表项学习异常的信息记录到GOLD(Generic OnLine Diagnostics,通用在线诊断)模块。执行本命令后,设备会显示GOLD模块内存中记录的ARP表项变化的诊断信息,其中包括产生此类信息的时间、原因等内容,帮助用户定位ARP表项学习异常的原因。
(1) 进入系统视图。
system-view
(2) 开启MAC地址无法学习事件的一键诊断功能。
diagnostic troubleshooting test drvdiag mac enable
缺省情况下,MAC地址无法学习事件的一键诊断功能处于开启状态。
(3) 对MAC地址无法学习事件进行一键诊断。
(独立运行模式)
diagnostic troubleshooting test drvdiag mac interface interface-type interface-number [ source-mac mac-address ] [ vlan vlan-id ] [ -t time ] [ slot slot-number ]
(IRF模式)
diagnostic troubleshooting test drvdiag mac interface interface-type interface-number [ source-mac mac-address ] [ vlan vlan-id ] [ -t time ] [ chassis chassis-number slot slot-number ]
在执行一键诊断操作过程中,键入<Ctrl+C>可终止当前诊断操作。
关闭一键诊断功能后,设备将不再收集业务模块的诊断数据,不能对业务功能进行一键诊断。
(1) 进入系统视图。
system-view
(2) 关闭业务功能的一键诊断功能。
undo diagnostic troubleshooting [ test test-name test-item ] enable
缺省情况下,业务功能的一键诊断功能处于开启状态。
可在任意视图下执行以下命令,显示测试例的内容。
(独立运行模式)
display diagnostic content [ slot slot-number ] [ verbose ]
(IRF模式)
display diagnostic content [ chassis chassis-number [ slot slot-number ] ] [ verbose ]
关于display diagnostic content命令的详细介绍请参见“智能运维命令参考”中的“GOLD”。
可在任意视图下执行以下命令,显示测试例的执行结果。
(独立运行模式)
display diagnostic result [ slot slot-number [ test test-name ] ] [ verbose ]
(IRF模式)
display diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] [ verbose ]
关于display diagnostic result命令的详细介绍请参见“智能运维命令参考”中的“GOLD”。
请在用户视图下执行以下命令,清除诊断测试结果。
(独立运行模式)
reset diagnostic result [ slot slot-number [ test test-name ] ]
(IRF模式)
reset diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ]
关于reset diagnostic result命令的详细介绍请参见“智能运维命令参考”中的“GOLD”。
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!
