• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

12-网络管理和监控配置指导

目录

13-GOLD配置

本章节下载 13-GOLD配置  (184.78 KB)

docurl=/cn/Service/Document_Software/Document_Center/Switches/Catalog/S7000/S7000X/Configure/Operation_Manual/H3C_S7000X_CG-R7736PXX-6W100/12/202012/1363019_30005_0.htm

13-GOLD配置


1 GOLD

1.1  GOLD简介

GOLD(Generic OnLine Diagnostics,通用在线诊断)通过在设备上执行诊断测试例,来发现硬件故障,并进行问题报告。GOLD检查的硬件故障主要包括:端口、内存、芯片、连接、转发路径以及控制路径是否正常等。

1.1.1  诊断类型

GOLD目前仅支持监控诊断。

监控诊断(Monitoring Diagnostics):设备在运行过程中按照一定的时间间隔执行测试例,来周期检测系统中的硬件是否故障并记录诊断结果。监控诊断只能执行非破坏性的测试例。

1.1.2  测试例

GOLD使用测试例来描述诊断(测试)的内容。测试例的内容(参数)包括测试的名称、诊断的类型、描述信息、属性(破坏性的/非破坏性的等)、缺省是否执行以及执行的时间等。测试例的部分参数用户可以使用本文中提供的命令行修改,其它参数则不能修改。测试例压缩在System包中,和System包一起发布、安装。所有测试例开启后,均在后台执行,用户可以通过相应的display命令查看测试结果或者日志信息来判断设备是否出现了硬件故障。

1.2  GOLD配置限制和指导

目前监控诊断仅支持BoardStatusMonitor测试例。

1.3  GOLD配置任务简介

GOLD配置任务如下:

(1)     配置监控诊断

(2)     (可选)模拟诊断结果

(3)     (可选)配置GOLD日志存储参数

1.4  配置监控诊断

1. 功能简介

对于缺省开启的监控诊断测试例,在设备启动后会自动执行;对于缺省没有开启的监控诊断测试例,需通过diagnostic monitor enable命令开启监控诊断功能。

开启监控诊断测试例后,测试例会按照指定的时间间隔执行。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     开启监控诊断功能。

(独立运行模式)

diagnostic monitor enable slot slot-number-list [ test test-name ]

(IRF模式)

diagnostic monitor enable chassis chassis-number slot slot-number-list [ test test-name ]

不同监控诊断测试例的功能开启情况不尽相同,请以在设备通过命令display diagnostic content显示的具体监控诊断测试例的开启情况为准。

(3)     配置监控诊断测试例的执行时间间隔。

(独立运行模式)

diagnostic monitor interval slot slot-number-list [ test test-name ] time interval

(IRF模式)

diagnostic monitor interval chassis chassis-number slot slot-number-list [ test test-name ] time interval

缺省情况下,不同测试例的执行时间间隔不同,请使用display diagnostic content命令查看。

interval的值不能小于监控诊断测试例要求的最小值。执行携带verbose参数的display diagnostic content命令,通过显示信息中的Min interval字段可获知监控诊断测试例要求的最小值。

1.5  模拟诊断结果

1. 功能简介

用户可通过将监控诊断测试例的执行方式设置为模拟方式来判断GOLD模块框架功能是否正常。在该方式下,当测试例满足执行条件时,系统会执行测试例的部分代码并生成测试结果,但是不会进行硬件纠错操作,例如重启或者主备倒换。

2. 配置步骤

请在用户视图下执行以下命令,设置诊断的执行方式为模拟方式。

(独立运行模式)

diagnostic simulation slot slot-number-list test test-name { failure | random-failure | success }

(IRF模式)

diagnostic simulation chassis chassis-number slot slot-number-list test test-name { failure | random-failure | success }

缺省情况下,诊断为非模拟方式。即启动测试例后,系统会真正执行该测试例。

1.6  配置GOLD日志存储参数

1. 功能简介

GOLD会自动生成日志,用于记录测试例的执行结果等信息。用户可以通过display diagnostic event-log命令查看这些日志。

2. 配置步骤

(1)     进入系统视图。

system-view

(2)     配置可存储的GOLD日志的最大条数。

diagnostic event-log size number

缺省情况下,可存储的GOLD日志的最大条数为512条。

当产生的日志条数超过用户配置的最大条数时,GOLD会自动删除最老日志。

1.7  GOLD显示和维护

在完成上述配置后,在任意视图下执行display命令可以显示配置后GOLD的运行情况,通过查看显示信息验证配置的效果。

在用户视图下执行reset命令可以清除GOLD日志信息和诊断测试结果。

表1-1 GOLD显示和维护

操作

命令

显示测试例的内容

(独立运行模式)

display diagnostic content [ slot slot-number ] [ verbose ]

(IRF模式)

display diagnostic content [ chassis chassis-number [ slot slot-number ] ] [ verbose ]

显示GOLD日志的信息

display diagnostic event-log [ error | info ]

显示测试例的执行结果

(独立运行模式)

display diagnostic result [ slot slot-number [ test test-name ] ] [ verbose ]

(IRF模式)

display diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ] [ verbose ]

显示模拟诊断的配置信息

(独立运行模式)

display diagnostic simulation [ slot slot-number ]

(IRF模式)

display diagnostic simulation [ chassis chassis-number [ slot slot-number ] ]

清除GOLD日志

reset diagnostic event-log

清除诊断测试结果

(独立运行模式)

reset diagnostic result [ slot slot-number [ test test-name ] ]

(IRF模式)

reset diagnostic result [ chassis chassis-number [ slot slot-number [ test test-name ] ] ]

 

1.8  GOLD典型配置举例

1.8.1  GOLD基本配置举例

1. 组网需求

在slot 0上,开启监控诊断测试例BoardStatusMonitor并配置测试例的时间间隔为1分钟。

2. 配置步骤

# 查看slot 0上监控诊断测试例的缺省开启状态和时间间隔。

<Sysname> display diagnostic content slot 0 verbose

Diagnostic test suite attributes:

#B/*: Bootup test/NA

#O/*: Ondemand test/NA

#M/*: Monitoring test/NA

#D/*: Disruptive test/Non-disruptive test

#P/*: Per port test/NA

#A/I/*: Monitoring test is active/Monitoring test is inactive/NA

 

slot 0:

Test name        : IPCMonitor

Test attributes  : **M*PA

Test interval    : 00:01:00

Min interval     : 00:01:00

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks ipc between

 switch units.

Exec             : -NA-

 

Test name        : TaskMonitor

Test attributes  : **M*PA

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks the import

tasks.

Exec             : -NA-

 

Test name        : PortMonitor

Test attributes  : **M*PA

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks port status

 for each inner port.

Exec             : -NA-

 

Test name        : ComponentMonitor

Test attributes  : **M*PA

Test interval    : 00:00:30

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks component s

tatus.

Exec             : -NA-

 

Test name        : HGMonitor

Test attributes  : **M*PI

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks link status

 between ports.

Exec             : -NA-

 

Test name        : BoardStatusMonitor

Test attributes  : **M*PA

Test interval    : 00:00:06

Min interval     : 00:00:06

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks board statu

s between local master and other local boards.

Exec             : -NA-

# 因测试例BoardStatusMonitor缺省已开启,故本步骤可选。如未开启则可通过本配置开启slot 0上的监控诊断测试例BoardStatusMonitor。

<Sysname> system-view

[Sysname] diagnostic monitor enable slot 0 test BoardStatusMonitor

# 配置slot 0上的监控诊断测试例BoardStatusMonitor的时间间隔为1分钟。

[Sysname] diagnostic monitor interval slot 0 test BoardStatusMonitor time 0:1:0

3. 验证配置

# 查看配置的结果。

[Sysname] display diagnostic content slot 0 verbose

Diagnostic test suite attributes:

#B/*: Bootup test/NA

#O/*: Ondemand test/NA

#M/*: Monitoring test/NA

#D/*: Disruptive test/Non-disruptive test

#P/*: Per port test/NA

#A/I/*: Monitoring test is active/Monitoring test is inactive/NA

 

slot 0:

Test name        : IPCMonitor

Test attributes  : **M*PA

Test interval    : 00:01:00

Min interval     : 00:01:00

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks ipc between

 switch units.

Exec             : -NA-

 

Test name        : TaskMonitor

Test attributes  : **M*PA

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks the import

tasks.

Exec             : -NA-

 

Test name        : PortMonitor

Test attributes  : **M*PA

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks port status

 for each inner port.

Exec             : -NA-

 

Test name        : ComponentMonitor

Test attributes  : **M*PA

Test interval    : 00:00:30

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks component s

tatus.

Exec             : -NA-

 

Test name        : HGMonitor

Test attributes  : **M*PI

Test interval    : 00:00:10

Min interval     : 00:00:10

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks link status

 between ports.

Exec             : -NA-

 

Test name        : BoardStatusMonitor

Test attributes  : **M*PA

Test interval    : 00:01:00

Min interval     : 00:00:06

Correct-action   : -NA-

Description      : A Real-time test, disabled by default that checks board statu

s between local master and other local boards.

Exec             : -NA-                                                        

# 查看slot 0上查看BoardStatusMonitor监控诊断测试例的执行结果。

[Sysname] display diagnostic result slot 0 test BoardStatusMonitor verbose

slot 0:

  Test name                : BoardStatusMonitor

  Total run count          : 68

  Total failure count      : 0

  Consecutive failure count: 0

  Last execution time      : Sat Apr 23 06:11:17 2078

  First failure time       : -NA-

  Last failure time        : -NA-

  Last pass time           : Sat Apr 23 06:11:17 2078

  Last execution result    : Success

  Last failure reason      : -NA-

  Next execution time      : Sat Apr 23 06:12:17 2078

  Slot  check status : Normal

 

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们