• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

11-网络管理和监控配置指导

目录

15-GOLD配置

本章节下载 15-GOLD配置  (145.89 KB)

15-GOLD配置


1 GOLD

GOLD(Generic OnLine Diagnostics,通用在线诊断)通过在设备上执行诊断测试例,来发现硬件故障,并进行问题报告。GOLD检查的硬件故障主要包括:端口、内存、芯片、连接、转发路径以及控制路径是否正常等。GOLD支持的诊断类型包括:

·            监控诊断(Monitoring Diagnostics):设备在运行过程中按照一定的时间间隔执行测试例,来周期检测系统中的硬件是否故障并记录诊断结果。监控诊断只能执行非破坏性的测试例。

·            按需诊断(On-Demand Diagnostics):在设备运行过程中,当用户怀疑硬件故障时,可以手工启动/停止某些测试例对设备进行诊断,这种诊断称为按需诊断。

GOLD使用测试例来描述诊断(测试)的内容。测试例的内容(参数)包括测试的名称、诊断的类型、描述信息、属性(破坏性的/非破坏性的等)、缺省是否执行以及执行的时间等。设备支持哪些测试例以及测试例内容的缺省值与设备的型号以及启动软件包版本有关,由开发人员根据产品需求在软件开发阶段指定。测试例的部分参数用户可以使用本文中提供的命令行修改,其它参数则不能修改。测试例压缩在System包中,和System包一起发布、安装。所有测试例开启后,均在后台执行,用户可以通过相应的display命令查看测试结果或者日志信息来判断设备是否出现了硬件故障。

1.1  配置监控诊断

对于缺省开启的监控诊断测试例,在设备启动后会自动执行;对于缺省没有开启的监控诊断测试例,需通过diagnostic monitor enable命令开启监控诊断功能。

开启监控诊断测试例后,测试例会按照一定的时间间隔执行。用户可以通过diagnostic monitor interval命令配置监控诊断测试例的执行时间间隔,但用户配置的时间间隔不能小于监控诊断测试例要求的最小值。监控诊断测试例要求的最小值可通过携带verbose参数的display diagnostic content命令中的Min interval字段获知。

表1-1 配置监控诊断(独立运行模式)

操作

命令

说明

进入系统视图

system-view

-

开启监控诊断功能

diagnostic monitor enable slot slot-number-list [ test test-name ]

缺省情况下,监控诊断功能处于开启状态

配置监控诊断测试例的执行时间间隔

diagnostic monitor interval slot slot-number-list [ test test-name ] time interval

不同测试例的缺省执行时间间隔不同,请使用display diagnostic content命令查看

表1-2 配置监控诊断(IRF模式)

操作

命令

说明

进入系统视图

system-view

-

开启监控诊断功能

diagnostic monitor enable chassis chassis-number slot slot-number-list [ test test-name ]

缺省情况下,监控诊断功能处于开启状态

配置监控诊断测试例的执行时间间隔

diagnostic monitor interval chassis chassis-number slot slot-number-list [ test test-name ] time interval

不同测试例的缺省执行时间间隔不同,请使用display diagnostic content命令查看

1.2  配置按需诊断

按需诊断由设备管理维护人员根据设备当前状态开始或者停止运行,所有配置的diagnostic ondemand关键字开头的命令行只在设备的本次运行过程中生效,设备重启后这些命令将恢复到缺省情况。

1.2.1  执行按需诊断对设备进行初始化检查

设备以出厂配置启动,且各业务端口不能连接电缆和光模块。在该情况下,使用本功能,系统软件会自动对设备进行初始化检查,并进行问题报告。

需要注意的是:

·            仅独立运行模式下支持本功能。

·            使用本功能后,必须整机重启设备。

表1-3 执行按需诊断对设备进行初始化检查

操作

命令

说明

执行按需诊断对设备进行初始化检查

diagnostic start test test-name

该命令在用户视图下执行

 

1.2.2  设备运行过程中使用按需诊断

设备运行过程中使用按需诊断,何时停止执行,受三条命令的限制:

·            使用diagnostic ondemand stop命令可立即停止执行该测试例。

·            如果某测试例的执行次数达到diagnostic ondemand repeating命令中指定的值,则系统会自动停止执行该测试例。

·            如果某测试例累计失败的执行次数已达到diagnostic ondemand failure命令中指定的值,则系统会自动停止执行该测试例。

用户可以通过display diagnostic ondemand configuration命令查看当前生效的按需诊断的配置信息。

表1-4 设备运行过程中使用按需诊断(独立运行模式)

操作

命令

说明

配置按需诊断的重复执行次数

diagnostic ondemand repeating repeating-number

缺省情况下,按需类型诊断测试例重复执行的次数为1次,表示执行一次就结束

本命令对当前已经启动、执行的按需诊断测试例不生效,只对后续启动的测试例生效

配置按需诊断的累计失败执行次数

diagnostic ondemand failure failure-number

缺省情况下,不限制按需测试例的累计失败执行次数的最大值

配置时,failure-number的值必须小于等于repeating-number的值

本命令对当前已经启动、执行的按需诊断测试例不生效,只对后续启动的测试例生效

启动按需类型诊断

diagnostic ondemand start slot slot-number-list test { test-name | non-disruptive } [ para parameters ]

若没有进行前两个配置操作,启动时按默认配置启动

(可选)停止按需类型诊断

diagnostic ondemand stop slot slot-number-list test { test-name | non-disruptive }

用户可以手动停止所有的按需类型测试例

表1-5 设备运行过程中使用按需诊断(IRF模式)

操作

命令

说明

配置按需诊断的重复执行次数

diagnostic ondemand repeating repeating-number

缺省情况下,按需类型诊断测试例重复执行的次数为1次,表示执行一次就结束

本命令对当前已经启动、执行的按需诊断测试例不生效,只对后续启动的测试例生效

配置按需诊断的累计失败执行次数

diagnostic ondemand failure failure-number

缺省情况下,不限制按需测试例的累计失败执行次数的最大值

配置时,failure-number的值必须小于等于repeating-number的值

本命令对当前已经启动、执行的按需诊断测试例不生效,只对后续启动的测试例生效

启动按需诊断

diagnostic ondemand start chassis chassis-number slot slot-number-list test { test-name | non-disruptive } [ para parameters ]

缺省情况下,所有的按需类型测试例都需要用户手动启动

(可选)停止按需类型诊断

diagnostic ondemand stop chassis chassis-number slot slot-number-list test { test-name | non-disruptive }

-

1.3  模拟诊断结果

用户通过diagnostic simulation命令设置诊断的执行方式为模拟方式后,当测试例满足执行条件时(由测试例当前参数决定),在执行测试例的时候只执行部分代码就直接生成测试结果,也不会触发硬件纠正行为(如重启、主备倒换等)。该功能用于判断GOLD模块框架功能是否正常。

表1-6 模拟诊断结果

操作

命令

说明

设置诊断的执行方式为模拟方式(独立运行模式)

diagnostic simulation slot slot-number-list test test-name { failure | random-failure | success }

缺省情况下,诊断为非模拟方式。即启动测试例后,系统会真正执行该测试例

本命令在用户视图下执行

设置诊断的执行方式为模拟方式(IRF模式)

diagnostic simulation chassis chassis-number slot slot-number-list test test-name { failure | random-failure | success }

缺省情况下,诊断为非模拟方式。即启动测试例后,系统会真正执行该测试例

本命令在用户视图下执行

 

1.4  配置GOLD日志存储参数

GOLD会自动生成日志,用于记录测试例的执行结果等信息。用户可以通过display diagnostic event-log命令查看这些日志。

表1-7 配置GOLD日志存储参数

操作

命令

说明

进入系统视图

system-view

-

配置可存储的GOLD日志的最大条数

diagnostic event-log size number

缺省情况下,可存储的GOLD日志的最大条数为512条

当产生的日志条数超过用户配置的最大条数时,GOLD会自动删除最老日志信息

 

1.5  GOLD显示和维护

在完成上述配置后,在任意视图下执行display命令可以显示配置后GOLD的运行情况,通过查看显示信息验证配置的效果。

在用户视图下执行reset命令可以清除GOLD日志信息和诊断测试结果。

表1-8 GOLD显示和维护(独立运行模式)

操作

命令

显示测试例的内容

display diagnostic content [ slot slot-number ] [ verbose ]

显示GOLD日志的信息

display diagnostic event-log [ error | info ]

显示按需诊断的配置信息

display diagnostic ondemand configuration

显示测试例的统计信息

display diagnostic result [ slot slot-number [ test test-name ] ] [ verbose ]

显示与报文相关的测试例的统计信息

display diagnostic result [ slot slot-number [ test test-name ] ] statistics

显示模拟诊断的配置信息

display diagnostic simulation [ slot slot-number ]

清除GOLD日志

reset diagnostic event-log

清除诊断测试结果

reset diagnostic result [ slot slot-number [ test test-name ] ]

表1-9 GOLD显示和维护(IRF模式)

操作

命令

显示测试例的内容

display diagnostic content [ chassis chassis-number [ slot slot-number ] ] [ verbose ]

显示GOLD日志的信息

display diagnostic event-log [ error | info ]

显示按需诊断的配置信息

display diagnostic ondemand configuration

显示测试例的统计信息

display diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] [ verbose ]

显示与报文相关的测试例的统计信息

display diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] statistics

显示模拟诊断的配置信息

display diagnostic simulation [ chassis chassis-number [ slot slot-number ] ]

清除GOLD日志

reset diagnostic event-log

清除诊断测试结果

reset diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ]

1.6  GOLD典型配置举例(独立运行模式)

1. 组网需求

在slot 1上,开启监控诊断测试例PortMonitor并配置测试例的时间间隔为1分钟。

2. 配置步骤

# 查看slot 1上监控诊断测试例的缺省开启状态和时间间隔。

<Sysname> display diagnostic content slot 1 verbose

Diagnostic test suite attributes:

#B/*: Bootup test/NA

#O/*: Ondemand test/NA

#M/*: Monitoring test/NA

#D/*: Disruptive test/Non-disruptive test

#P/*: Per port test/NA

#A/I/*: Monitoring test is active/Monitoring test is inactive/NA

 

Slot 1 cpu 0:

Test name        : PortMonitor

Test attributes  : **M*PI

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description       : A Real-time test, disabled by default that checks link status between ports.

# 开启slot 1上的监控诊断测试例PortMonitor。

<Sysname> system-view

[Sysname] diagnostic monitor enable slot 1 test PortMonitor

# 配置slot 1上的监控诊断测试例PortMonitor的时间间隔为1分钟。

[Sysname] diagnostic monitor interval slot 1 test PortMonitor time 0:1:0

3. 验证配置

# 查看配置的结果。

[Sysname] display diagnostic content slot 1 verbose

Diagnostic test suite attributes:

#B/*: Bootup test/NA

#O/*: Ondemand test/NA

#M/*: Monitoring test/NA

#D/*: Disruptive test/Non-disruptive test

#P/*: Per port test/NA

#A/I/*: Monitoring test is active/Monitoring test is inactive/NA

 

Slot 1 cpu 0:

Test name        : PortMonitor

Test attributes  : **M*PA

Test interval    : 00:01:00

Min interval     : 00:00:10

Correct-action   : -NA-

Description       : A Real-time test, disabled by default that checks link status between ports.

# 查看slot 1上监控诊断测试例的执行结果。

[Sysname] display diagnostic result slot 1 verbose

Slot 1 cpu 0:

  Test name                : PortMonitor

  Total run count          : 1247

  Total failure count      : 0

  Consecutive failure count: 0

  Last execution time      : Tue Dec 25 18:09:21 2012

  First failure time       : -NA-

  Last failure time        : -NA-

  Last pass time           : Tue Dec 25 18:09:21 2012

  Last execution result    : Success

  Last failure reason      : -NA-

  Next execution time      : Tue Dec 25 18:10:21 2012

  Port link status : Normal

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们