11-GOLD配置
本章节下载: 11-GOLD配置 (190.55 KB)
目 录
目前,仅网板支持配置GOLD功能。
GOLD(Generic OnLine Diagnostics,通用在线诊断)通过在设备上执行诊断测试例,来发现硬件故障,并进行问题报告。GOLD检查的硬件故障主要包括:端口、内存、芯片、连接、转发路径以及控制路径是否正常等。
监控诊断(Monitoring Diagnostics):设备在运行过程中按照一定的时间间隔执行测试例,来周期检测系统中的硬件是否故障并记录诊断结果。监控诊断只能执行非破坏性的测试例。
GOLD使用测试例来描述诊断(测试)的内容。测试例的内容(参数)包括测试的名称、诊断的类型、描述信息、属性(破坏性的/非破坏性的等)、缺省是否执行以及执行的时间等。测试例的部分参数用户可以使用本文中提供的命令行修改,其它参数则不能修改。测试例压缩在System包中,和System包一起发布、安装。所有测试例开启后,均在后台执行,用户可以通过相应的display命令查看测试结果或者日志信息来判断设备是否出现了硬件故障。
对于缺省开启的监控诊断测试例,在设备启动后会自动执行;对于缺省没有开启的监控诊断测试例,需通过diagnostic monitor enable命令开启监控诊断功能。
开启监控诊断测试例后,测试例会按照一定的时间间隔执行。用户可以通过diagnostic monitor interval命令配置监控诊断测试例的执行时间间隔,但用户配置的时间间隔不能小于监控诊断测试例要求的最小值。监控诊断测试例要求的最小值可通过携带verbose参数的display diagnostic content命令中的Min interval字段获知。
表1-1 配置监控诊断(独立运行模式)
| 操作 | 命令 | 说明 | 
| 进入系统视图 | system-view | - | 
| 开启监控诊断功能 | diagnostic monitor enable slot slot-number-list [ test test-name ] | 缺省情况下,未开启监控诊断测试例 | 
| 配置监控诊断测试例的执行时间间隔 | diagnostic monitor interval slot slot-number-list [ test test-name ] time time | 缺省情况下,监控诊断测试例时间间隔为10秒 | 
表1-2 配置监控诊断(IRF模式)
| 操作 | 命令 | 说明 | 
| 进入系统视图 | system-view | - | 
| 开启监控诊断功能 | diagnostic monitor enable chassis chassis-number slot slot-number-list [ test test-name ] | 缺省情况下,未开启监控诊断测试例 | 
| 配置监控诊断测试例的执行时间间隔 | diagnostic monitor interval chassis chassis-number slot slot-number-list [ test test-name ] time time | 缺省情况下,监控诊断测试例时间间隔为10秒 | 
用户通过diagnostic simulation命令设置诊断的执行方式为模拟方式后,当测试例满足执行条件时(由测试例当前参数决定),在执行测试例的时候只执行部分代码就直接生成测试结果,也不会触发硬件纠正行为(如重启、主备倒换等)。该功能用于判断GOLD模块框架功能是否正常。
表1-3 模拟诊断结果
| 操作 | 命令 | 说明 | 
| 设置诊断的执行方式为模拟方式(独立运行模式) | diagnostic simulation slot slot-number-list test test-name { failure | random-failure | success } | 缺省情况下,诊断为非模拟方式。即启动测试例后,系统会真正执行该测试例 | 
| 设置诊断的执行方式为模拟方式(IRF模式) | diagnostic simulation chassis chassis-number slot slot-number-list test test-name { failure | random-failure | success } | 缺省情况下,诊断为非模拟方式。即启动测试例后,系统会真正执行该测试例 | 
GOLD会自动生成日志,用于记录测试例的执行结果等信息。用户可以通过display diagnostic event-log命令查看这些日志。
表1-4 配置GOLD日志存储参数
| 操作 | 命令 | 说明 | 
| 进入系统视图 | system-view | - | 
| 配置可存储的GOLD日志的最大条数 | diagnostic event-log size number | 缺省情况下,可存储的GOLD日志的最大条数为512条 当产生的日志条数超过用户配置的最大条数时,GOLD会自动删除最老日志信息 | 
在完成上述配置后,在任意视图下执行display命令可以显示配置后GOLD的运行情况,通过查看显示信息验证配置的效果。
在用户视图下执行reset命令可以清除GOLD日志信息和诊断测试结果。
表1-5 GOLD显示和维护
| 操作 | 命令 | 
| 显示测试例的内容(独立运行模式) | display diagnostic content [ slot slot-number ] [ verbose ] | 
| 显示测试例的内容(IRF模式) | display diagnostic content [ chassis chassis-number [ slot slot-number ] ] [ verbose ] | 
| 显示GOLD日志的信息 | |
| 显示测试例的统计信息(独立运行模式) | display diagnostic result [ slot slot-number [ test test-name ] ] [ verbose ] | 
| 显示模拟诊断的配置信息(IRF模式) | display diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] [ verbose ] | 
| 显示模拟诊断的配置信息(独立运行模式) | display diagnostic simulation [ slot slot-number ] | 
| 显示模拟诊断的配置信息(IRF模式) | display diagnostic simulation [ chassis chassis-number [ slot slot-number ] ] | 
| 清除GOLD日志 | reset diagnostic event-log | 
| 清除诊断测试结果(独立运行模式) | reset diagnostic result [ slot slot-number [ test test-name ] ] | 
| 清除诊断测试结果(IRF模式) | reset diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] | 
在10号单板上,开启监控诊断测试例HGMonitor并配置测试例的时间间隔为1分钟。
# 查看10号单板上监控诊断测试例的缺省开启状态和时间间隔。
<Sysname> display diagnostic content slot 10 verbose
Diagnostic test suite attributes:
#B/*: Bootup test/NA
#O/*: Ondemand test/NA
#M/*: Monitoring test/NA
#D/*: Disruptive test/Non-disruptive test
#P/*: Per port test/NA
#A/I/*: Monitoring test is active/Monitoring test is inactive/NA
Slot 10:
Test name : HGMonitor
Test attributes : **M*PI
Test interval : 00:00:10
Min interval : 00:00:10
Correct-action : -NA-
Description : A Real-time test, disabled by default that checks link status between ports.
# 开启10号单板上监控诊断测试例HGMonitor。
<Sysname> system-view
[Sysname] diagnostic monitor enable slot 10 test HGMonitor
# 配置10号单板上监控诊断测试例HGMonitor的时间间隔为1分钟。
[Sysname] diagnostic monitor interval slot 10 test HGMonitor time 0:1:0
# 查看配置的结果。
[Sysname] display diagnostic content slot 10 verbose
Diagnostic test suite attributes:
#B/*: Bootup test/NA
#O/*: Ondemand test/NA
#M/*: Monitoring test/NA
#D/*: Disruptive test/Non-disruptive test
#P/*: Per port test/NA
#A/I/*: Monitoring test is active/Monitoring test is inactive/NA
Slot 10:
Test name : HGMonitor
Test attributes : **M*PA
Test interval : 00:01:00
Min interval : 00:00:10
Correct-action : -NA-
Description : A Real-time test, disabled by default that checks link status between ports.
# 查看10号单板监控诊断测试例的执行结果。
[Sysname] display diagnostic result slot 10 verbose
Slot 10:
Test name : HGMonitor
Total run count : 3
Total failure count : 0
Consecutive failure count: 0
Last execution time : Fri Jul 26 16:28:10 2013
First failure time : -NA-
Last failure time : -NA-
Last pass time : Fri Jul 26 16:28:10 2013
Last execution result : Success
Last failure reason : -NA-
Next execution time : Fri Jul 26 16:29:10 2013
在1号成员设备10号单板上,开启监控诊断测试例HGMonitor并配置测试例的时间间隔为1分钟。
# 查看1号成员设备10号单板上监控诊断测试例的缺省开启状态和时间间隔。
<Sysname> display diagnostic content chassis 1 slot 10 verbose
Diagnostic test suite attributes:
#B/*: Bootup test/NA
#O/*: Ondemand test/NA
#M/*: Monitoring test/NA
#D/*: Disruptive test/Non-disruptive test
#P/*: Per port test/NA
#A/I/*: Monitoring test is active/Monitoring test is inactive/NA
Chassis 1 Slot 10:
Test name : HGMonitor
Test attributes : **M*PI
Test interval : 00:00:10
Min interval : 00:00:10
Correct-action : -NA-
Description : A Real-time test, disabled by default that checks link status between ports.
# 开启1号成员设备10号单板上的监控诊断测试例HGMonitor。
<Sysname> system-view
[Sysname] diagnostic monitor enable chassis 1 slot 10 test HGMonitor
# 配置1号成员设备10号单板上监控诊断测试例HGMonitor的时间间隔为1分钟。
[Sysname] diagnostic monitor interval chassis 1 slot 10 test HGMonitor time 0:1:0
# 查看配置的结果。
[Sysname] display diagnostic content chassis 1 slot 10 verbose
Diagnostic test suite attributes:
#B/*: Bootup test/NA
#O/*: Ondemand test/NA
#M/*: Monitoring test/NA
#D/*: Disruptive test/Non-disruptive test
#P/*: Per port test/NA
#A/I/*: Monitoring test is active/Monitoring test is inactive/NA
Chassis 1 Slot 10:
Test name : HGMonitor
Test attributes : **M*PA
Test interval : 00:01:00
Min interval : 00:00:10
Correct-action : -NA-
Description : A Real-time test, disabled by default that checks link status between ports.
# 查看监控诊断测试例的执行结果。
[Sysname] display diagnostic result chassis 1 slot 10 verbose
Chassis 1 Slot 10:
Test name : HGMonitor
Total run count : 3
Total failure count : 0
Consecutive failure count: 0
Last execution time : Fri Jul 26 16:28:10 2013
First failure time : -NA-
Last failure time : -NA-
Last pass time : Fri Jul 26 16:28:10 2013
Last execution result : Success
Last failure reason : -NA-
Next execution time : Fri Jul 26 16:29:10 2013
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!
