08-设备管理配置
本章节下载: 08-设备管理配置 (633.93 KB)
通过设备管理功能,用户能够查看设备当前的工作状态,配置设备运行的相关参数,实现对设备的日常维护和管理。
非缺省vSystem不支持本特性的所有功能,仅支持display cpu-usage configuration和display memory-threshold命令。有关vSystem的详细介绍请参见“虚拟化技术配置指导”中的“vSystem”。
在系统处于未稳态的情况下,请尽量不要对设备进行任何操作(比如主备倒换、重启设备等)。可通过display system stable state命令查看系统是否处于稳态。
设备管理的所有配置任务均为可选配置,配置时无先后顺序要求,请根据实际需要选择配置。设备管理配置任务如下:
· 配置设备的基本参数
¡ 配置设备名称
¡ 配置设备网元信息
¡ 配置系统时间
¡ 配置欢迎信息
· 配置设备的安全参数
¡ 配置密码恢复功能
· 调整设备的能力
· 监控设备
¡ 监控CPU利用率
¡ 监控CPU状态
¡ 配置内存告警门限
¡ 配置触发设备重启的内存门限
¡ 监控资源使用情况
¡ 监控资源剩余情况
¡ 配置温度告警门限
· 管理设备上的资源
· 维护设备
¡ 定位设备
¡ 重启设备
¡ 恢复出厂状态
设备名称用于在网络中标识某台设备,在系统内部,设备名称对应于命令行接口的提示符,如设备的名称为Sysname,则用户视图的提示符为<Sysname>。
(1) 进入系统视图。
system-view
(2) 配置设备名称。
sysname sysname
缺省情况下,设备的名称为H3C。
设备的网元信息可用于表示设备的位置信息、功能信息、用户自定义的名字标记等。
(1) 进入系统视图。
system-view
(2) 配置设备的网元信息。
sysid system-id
缺省情况下,未配置设备的网元信息。
为了保证与其它设备协调工作,为了更好的监控和维护设备,请确保设备的系统时间是准确的。
设备可通过以下方式获取系统时间:
· 命令行配置。用户通过命令行指定系统时间后,设备会使用内部晶体震荡器产生的时钟信号继续计时。
· 网络时钟同步。设备周期性的同步NTP服务器的UTC(Coordinated Universal Time,国际协调时间)时间,并用同步得到的UTC时间和设备上配置的本地时区、夏令时参数运算,得出当前的系统时间。关于NTP的详细介绍,请参见“网络管理和监控配置指导”中的“NTP”。
从网络时钟源获取的时间比命令行配置的时间更精准,推荐使用。
通过命令行配置系统时间时,不管当前是否已经配置夏令时和时区,clock datetime命令中指定的时间即为当前的系统时间。
设备通过命令行配置或者网络同步获取到系统时间后,如果再修改夏令时或者时区,设备会用修改后的夏令时和时区重新计算系统时间,计算后得到的系统时间可通过display clock命令查看。
仅缺省Context支持本功能,非缺省Context不支持。设备上所有Context使用相同的系统时间。
系统时间的配置任务如下:
(1) 配置系统时间的获取方式。请选择其中一项进行配置。
(2) 配置时区
请将所有网络设备的时区和当地地理时区保持一致。
(3) (可选)配置夏令时
请将所有网络设备的夏令时和当地夏令时保持一致。
(1) 进入系统视图。
system-view
(2) 通过命令行配置系统时间。
clock protocol none
缺省情况下,从缺省Context通过NTP协议获取时间。
多次执行clock protocol命令,最后一次执行的命令生效,可能会导致系统时间被修改。
(3) 返回用户视图。
quit
(4) 配置系统时间。
clock datetime time date
缺省情况下,设备的系统时间为UTC时间2011年1月1日零点。
执行本命令会修改设备的系统时间,会影响和系统时间相关特性的执行(例如定时执行任务功能),以及和其他设备的协同操作(例如日志上报和统计),请谨慎执行。
(1) 进入系统视图。
system-view
(2) 通过网络协议获取UTC时间。
clock protocol ntp context context-id
缺省情况下,从缺省Context通过NTP协议获取时间。
多次执行clock protocol命令,最后一次执行的命令生效,可能会导致系统时间被修改。
(3) 配置NTP的相关参数。关于NTP的配置,请参见“网络管理和监控配置指导”中的“NTP”。
(1) 进入系统视图。
system-view
(2) 配置系统所在的时区。
clock timezone zone-name { add | minus } zone-offset
缺省情况下,系统所在的时区为GMT+08:00时区,即北京时间。
(1) 进入系统视图。
system-view
(2) 配置夏令时。
clock summer-time name start-time start-date end-time end-date add-time
缺省情况下,未配置夏令时。
开启版权信息显示功能后,使用Telnet或SSH方式登录设备时会显示版权信息,使用Console口登录设备再退出用户视图时,由于设备会自动再次登录,因此也会显示版权信息,其它情况不显示版权信息。
禁止版权信息显示功能后,在任何情况下都不会显示版权信息。
(1) 进入系统视图。
system-view
(2) 开启版权信息显示功能。
copyright-info enable
缺省情况下,版权信息显示功能处于开启状态。
欢迎信息是用户在连接到设备后、进入CLI配置界面前系统显示的一段提示信息。管理员可以根据需要,配置欢迎信息。
系统支持如下几种欢迎信息:
· legal欢迎信息。系统在用户登录前会给出一些版权或者授权信息。
· MOTD(Message Of The Day,每日提示)欢迎信息。
· login欢迎信息。只有用户界面下配置了password或者scheme认证方式时,才显示该欢迎信息。
· shell欢迎信息。用户登录时显示shell欢迎信息。
以上几种欢迎信息的显示顺序为:legal欢迎信息、MOTD欢迎信息、login欢迎信息或shell欢迎信息。
欢迎信息可以单行或多行输入。
· 单行输入
该方式下,命令关键字与欢迎信息的所有内容在同一行中输入,输入内容text的第一个字符和最后一个字符分别作为起始符和结束符,起始符和结束符可以为任意可见字符但两者必须相同,且不属于欢迎信息的内容。此时包括命令关键字、起始符和结束符在内,一共可以输入511个字符。在该方式下输入欢迎信息过程中不能回车(按<Enter>键)。例如,配置shell欢迎信息为“Have a nice day.”,可参照如下步骤:
<System> system-view
[System] header shell %Have a nice day.%
单行输入方式配置的欢迎信息本身不能包含换行符。
· 多行输入
该方式下,通过回车键将欢迎信息分多行输入。如果输入的内容中包括换行,则换行算两个字符。多行输入又分三种方式:
¡ 命令关键字后直接回车,输入欢迎信息并以“%”作为欢迎信息的结束符结束配置,“%”不属于欢迎信息的内容。该方式,不包括起始符但包括结束符在内,一共可以输入1999个字符。例如,配置的欢迎信息为“Have a nice day.”,可参照如下步骤:
<System> system-view
[System] header shell
Please input banner content, and quit with the character '%'.
Have a nice day.%
¡ 命令关键字后输入一个字符后回车,以这个字符作为欢迎信息的起始符和结束符,输入完欢迎信息以后,以结束符结束配置。起始符和结束符不属于欢迎信息的内容。该方式,不包括起始符但包括结束符在内,一共可以输入1999个字符。例如,配置的欢迎信息为“Have a nice day.”,可参照如下步骤:
<System> system-view
[System] header shell A
Please input banner content, and quit with the character 'A'.
Have a nice day.A
¡ 命令关键字后输入多个字符(首尾不相同)后回车,以命令关键字后的第一个字符作为欢迎信息的起始符和结束符,输入完欢迎信息以后,以结束符结束配置。起始符和结束符不属于欢迎信息的内容。该方式,包括起始符和结束符在内,一共可以输入2002个字符。例如,配置的欢迎信息为“Have a nice day.”,可参照如下步骤:
<System> system-view
[System] header shell AHave a nice day.
Please input banner content, and quit with the character 'A'.
多行输入方式配置的欢迎信息本身可以包含换行符。配置欢迎信息内容时键入的回车,即对应最终显示的欢迎信息中的换行。
(1) 进入系统视图。
system-view
(2) 配置欢迎信息。请至少选择其中一项进行配置。
¡ 配置legal欢迎信息。
header legal text
¡ 配置MOTD欢迎信息。
header motd text
¡ 配置login欢迎信息。
header login text
¡ 配置shell欢迎信息。
header shell text
使能密码恢复功能后,当用户忘记Console口认证密码或者登录认证失败,导致无法使用Console口登录设备时,可通过Console口连接设备,硬件重启设备,并在启动过程中根据提示按<Ctrl+B>进入BootWare菜单,再选择对应的BootWare菜单选项来修复这个问题。关闭密码恢复功能后,设备将处于一个安全性更高的状态,即当出现上述情况时,若想继续使用Console口登录设备,只能通过BootWare菜单选择将设备恢复为出厂配置之后方可继续操作,这样可以有效地防止非法用户获取启动配置文件。
BootWare菜单的详细描述,请参见产品的版本说明书。
仅缺省Context支持本功能,非缺省Context不支持。
清除认证密码的操作必须在主用主控板的启动过程中进入BootWare菜单进行。
在IRF组网环境中,直接使用password-recovery enable命令进行密码恢复时将不生效。这时需要先将IRF分裂,然后再通过BootWare菜单清除该认证密码,成功进入系统后再重新组建IRF。有关IRF的详细介绍,请参见“虚拟化技术配置指导”中的“IRF”。
(1) 进入系统视图。
system-view
(2) 使能密码恢复功能。
password-recovery enable
缺省情况下,密码恢复功能处于使能状态。
缺省情况下,在系统启动过程中,用户在指定时间内按组合键Ctrl+B可以进入BootWare菜单,以便完成系统软件的加载和对存储介质的管理等操作。为防止非法用户访问BootWare菜单,用户可以配置禁止访问BootWare菜单。配置禁止访问BootWare菜单后,在系统启动过程中按组合键Ctrl+B不会进入BootWare菜单,而直接进入命令行配置界面。
仅缺省Context支持本功能,非缺省Context不支持。
请在用户视图下执行本命令,禁止访问BootWare菜单。
undo bootrom-access enable
缺省情况下,在系统启动过程中允许访问BootWare菜单。
仅缺省Context支持本功能,非缺省Context不支持。
如果多次执行fabric load-sharing mode命令,最后一次执行的命令生效。
(1) 进入系统视图。
system-view
(2) 配置接口板或网板的负载分担类型。
(独立运行模式)
fabric load-sharing mode { { destination-ip | destination-mac | ingress-port | source-ip | source-mac } * | flexible } slot slot-number
(IRF模式)
fabric load-sharing mode { { destination-ip | destination-mac | ingress-port | source-ip | source-mac } * | flexible } chassis chassis-number slot slot-number
本命令的缺省情况与设备的接口板或网板型号有关,建议使用缺省值,如需修改请联系技术支持。
在开启环路检测功能或生成树协议的网络中,某些协议模块(比如STP等)会自动关闭某个端口。在协议自动关闭端口的同时,系统会启动一个检测端口状态的定时器。当定时器超时,如果该端口仍处于关闭状态,则系统自动将端口恢复到真实的物理状态。本功能用于配置系统检测端口状态定时器的时长。
(1) 进入系统视图。
system-view
(2) 配置端口状态检测定时器的时长。
shutdown-interval time
缺省情况下,端口状态检测定时器时长为30秒。
开启本功能后,如果大量流量上送至业务板的CPU,可能会造成逻辑上的报文丢包,需要综合分析是否需要关闭逻辑高优先级报文优先上送功能。
请在用户视图下执行本命令,开启逻辑高优先级报文优先上送CPU功能。
(独立运行模式)
archer high-priority to-cpu enable chip chip-number slot slot-number subslot-number cpu cpu-number
(IRF模式)
archer high-priority to-cpu enable chip chip-number chassis chassis-number slot slot-number subslot-number cpu cpu-number
缺省情况下,逻辑高优先级报文优先上送功能处于开启状态。
· CPU告警功能
系统每隔1分钟会对CPU的利用率进行采样,并将采样值和用户配置的CPU利用率阈值/CPU利用率恢复阈值比较:
¡ 当采样值大于或等于CPU利用率阈值时,则认为CPU利用率过高。
¡ 当采样值回落,小于或等于CPU利用率恢复阈值时,则认为CPU利用率已经恢复到正常范围。
当CPU利用率从过高变成正常或者从正常变为过高,均会发送Trap报文,并通知业务模块进行相应处理。
图1-1 CPU告警示意图(支持恢复门限的设备)
· CPU利用率历史记录功能
开启CPU利用率历史记录功能后,系统会每隔一定时间(可通过monitor cpu-usage interval命令配置)对CPU的利用率进行采样,并把采样结果保存到历史记录区。这些记录可通过display cpu-usage history命令查看,以便用户监控设备近期的运行情况。
(1) 进入系统视图。
system-view
(2) 配置CPU利用率阈值。
(独立运行模式)
monitor cpu-usage threshold severe-threshold recovery-threshold recovery-threshold [ slot slot-number [ cpu cpu-number ] ]
(IRF模式)
monitor cpu-usage threshold severe-threshold recovery-threshold recovery-threshold [ chassis chassis-number slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU利用率阈值为70%,CPU利用率恢复门限为30%。
CPU利用率高级别告警门限如果设置过低,可能导致设备提前进入门限状态,不再进行正常业务处理。
(3) 配置CPU利用率历史记录的采样周期。
(独立运行模式)
monitor cpu-usage interval interval [ slot slot-number [ cpu cpu-number ] ]
(IRF模式)
monitor cpu-usage interval interval [ chassis chassis-number slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU使用率历史记录采样周期为1分钟。
(4) 开启CPU利用率历史记录功能。
(独立运行模式)
monitor cpu-usage enable [ slot slot-number [ cpu cpu-number ] ]
(IRF模式)
monitor cpu-usage enable [ chassis chassis-number slot slot-number [ cpu cpu-number ] ]
缺省情况下,CPU使用率历史记录功能处于开启状态。
系统按5秒周期对CPU核的利用率进行采样,然后对统计周期内的采样值进行计算,并将计算值和用户配置的CPU核利用率的阈值比较。当计算值大时,则认为CPU核利用率过高,设备会发送告警信息并记录日志。
统计周期建议配置为5的整数倍,不是整数倍时,最接近且小于配置值的、5的整数倍数生效。例如统计周期配置为18秒,实际生效的统计周期为15秒。
(1) 进入系统视图。
system-view
(2) 配置CPU核利用率统计周期。
(独立运行模式)
monitor cpu-usage statistics-interval interval slot slot-number cpu cpu-number core core-id-list
(IRF模式)
monitor cpu-usage statistics-interval interval chassis chassis-number slot slot-number cpu cpu-number core core-id-list
缺省情况下,CPU核利用率统计周期为60秒。
(3) 配置发送CPU核告警的间隔。
(独立运行模式)
monitor resend cpu-usage core-interval core-interval [ slot slot-number [ cpu cpu-number ] ]
(IRF模式)
monitor resend cpu-usage core-interval core-interval [ chassis chassis-number slot slot-number [ cpu cpu-number ] ]
缺省情况下,发送CPU核告警的间隔为300秒。
开启CPU发送/接收方向和PCI链路状态监控后,可以监控CPU发送/接收报文和PCI链路是否正常,如果发生错误则会记录相关日志和告警。
(1) 进入系统视图
system-view
(2) 开启CPU发送方向状态监控
monitor cpu-tx-status
缺省情况下,CPU发送方向状态监控处于关闭状态。
(3) 开启CPU接收方向状态监控
monitor cpu-rx-status
缺省情况下,CPU接收方向状态监控处于关闭状态。
(4) 开启PCI链路状态监控功能
monitor cpu-pci-status
缺省情况下,PCI链路监控功能处于关闭状态。
系统实时监控系统剩余空闲内存大小,当条件达到一级、二级、三级告警门限或者恢复正常状态门限时,就产生相应的告警/告警解除通知,通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。
一级(minor)、二级(severe)和三级(critical)门限,对应的系统剩余空闲内存越来越少,紧急程度越来越严重。
· 当剩余空闲内存值从大于变成小于一级告警门限时,产生一级告警。
· 当剩余空闲内存值从大于变成小于二级告警门限时,产生二级告警。
· 当剩余空闲内存值从大于变成小于三级告警门限时,产生三级告警。
· 当剩余空闲内存值从小于变成大于二级告警门限时,产生三级告警解除通知。
· 当剩余空闲内存值从小于变成大于一级告警门限时,产生二级告警解除通知。
· 当剩余空闲内存值小于变成大于正常内存大小时,产生一级告警解除通知。
同一级别的告警/告警解除通知是交替进行的:当系统剩余空闲内存小于某级告警门限,设备产生相应级别的告警,后续只有该告警解除了,系统剩余空闲内存再次小于某级告警门限时,才会再次生成该级别的告警。
当系统的剩余空闲内存大小如图1-2中曲线所示时,会生成如图1-2所示的告警和解除告警通知。
仅缺省Context支持本功能,非缺省Context不支持。
当设备出现内存告警时,可删除暂时不用的配置或关闭部分功能来释放内存。但因为内存不足,部分配置可能删除失败。
(1) 进入系统视图。
system-view
(2) 配置内存利用率阈值。
(独立运行模式)
memory-threshold [ slot slot-number [ cpu cpu-number ] ] usage memory-threshold
(IRF模式)
memory-threshold [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] usage memory-threshold
缺省情况下,内存利用率阈值为90%。
系统每隔1分钟对内存利用率进行采样,当采样值大于或等于用户配置的内存利用率阈值时,则认为内存利用率过高,设备会发送Trap报文。
(3) 配置空闲内存告警的门限值。
(独立运行模式)
memory-threshold [ slot slot-number [ cpu cpu-number ] ] [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value
(IRF模式)
memory-threshold [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value [ early-warning early-warning-value secure secure-value ]
不同设备空闲内存告警的门限值可能不同,请先使用undo memory-threshold命令恢复缺省情况后,再通过display memory-threshold命令查看设备的缺省温度告警门限。
当入方向流量在持续时间内一直大于或等于带宽告警阈值,则输出告警,且之后会每5秒输出一次告警;直到入方向流量低于带宽告警阈值后,才停止输出告警。
仅缺省Context支持本功能,非缺省Context不支持。
(1) 进入系统视图。
system-view
(2) 配置整机入方向带宽的告警阈值。
monitor resource-usage bandwidth inbound threshold threshold-value [ duration duration-value ]
缺省情况下,未配置整机入方向带宽的告警阈值,不会触发告警。
配置此功能后,当设备上创建的二层聚合接口或三层聚合接口的数量达到告警阈值时,则输出告警信息。之后每3小时输出一次告警,直到设备上创建的二层聚合接口或三层聚合接口的数量低于告警阈值后,才停止输出告警。
(1) 进入系统视图。
system-view
(2) 配置聚合接口数的告警阈值。
monitor resource-usage { bridge-aggregation | route-aggregation } threshold threshold-value
缺省情况下,未配置聚合接口的告警阈值,不会触发告警。
配置此功能后,当内联口的吞吐量达到告警阈值时,则输出告警信息。之后每10分钟输出一次告警,直到内联口的吞吐量低于告警阈值后,才停止输出告警。
仅缺省Context支持本功能,非缺省Context不支持。
(1) 进入系统视图。
system-view
(2) 配置内联口吞吐量的告警阈值。
monitor resource-usage blade-throughput threshold threshold-value
缺省情况下,未配置内联口吞吐量的告警阈值,不会触发告警。
使用本功能既可以监控设备上已创建的Context总个数也可以监控每个安全引擎组中的Context个数。
配置设备上Context个数告警阈值后,当设备上Context的数量达到告警阈值时,则设备立即输出告警并进入告警状态,若该设备一直处于告警状态,为避免告警频繁,后续每6小时输出一次告警,直到该设备上Context个数降至告警阈值以下。
开启安全引擎组中Context个数告警功能后,设备会按周期监测每个安全引擎组中的Context个数:
· 当某个安全引擎组中Context个数从小于变成大于等于一级告警阈值时,设备会立即输出该安全引擎组的一级告警并进入一级告警状态。若该安全引擎组一直处于一级告警状态,为避免告警频繁,后续一级告警会每6小时输出一次,直到该安全引擎组进入二级告警状态或者一级告警状态解除。
· 当某个安全引擎组中Context个数从小于变成大于等于二级告警阈值时,设备会立即输出该安全引擎组的二级告警并进入二级告警状态。若该安全引擎组一直处于二级告警状态,为避免告警频繁,后续二级告警会每6小时输出一次,直到该安全引擎组二级告警状态解除。
· 若某个安全引擎组处于二级告警状态,当Context个数降至二级阈值以下时,则解除二级告警状态,输出二级告警解除日志。
· 若某个安全引擎组处于一级告警状态,当Context个数降至一级阈值以下时,则解除一级告警状态,输出一级告警解除日志。
有关安全引擎组的详细介绍请参见“虚拟化技术配置指导”中的“Context”。
仅缺省Context支持本功能,非缺省Context不支持。
安全引擎组中Context个数告警功能的一级阈值和二级阈值在设备出厂时已固定,不支持修改,可从告警信息中查看。
(1) 进入系统视图。
system-view
(2) 配置设备上Context个数的告警阈值。
monitor resource-usage context threshold threshold-value
缺省情况下,未配置设备上Context个数的告警阈值,不会触发告警。
(3) 开启安全引擎组中Context个数的告警功能。
monitor resource-usage blade-controller-team context
缺省情况下,安全引擎组中Context个数的告警功能处于开启状态。
配置此功能后,当QACL资源使用率的百分比达到告警阈值时,则输出告警信息。之后每3小时输出一次告警,直到QACL资源使用率的百分比低于告警阈值后,才停止输出告警。
仅缺省Context支持本功能,非缺省Context不支持。
(1) 进入系统视图。
system-view
(2) 配置QACL资源使用率的告警阈值。
monitor resource-usage qacl threshold threshold-value
缺省情况下,未配置QACL资源使用率的告警阈值,不会触发告警。
配置此功能后,当设备上创建的安全策略规则的数量达到告警阈值时,则输出告警信息。之后每6小时输出一次告警,直到设备上创建的安全策略规则的数量低于告警阈值后,才停止输出告警。
(1) 进入系统视图。
system-view
(2) 配置安全策略规则数的告警阈值。
monitor resource-usage security-policy { ip | ipv6 } threshold threshold-value
缺省情况下,未配置安全策略规则数的告警阈值,不会触发告警。
配置此功能后,当设备上的会话连接数达到告警阈值时,则输出告警信息。之后每10分钟输出一次告警,直到会话连接数低于告警阈值后,才停止输出告警。
(1) 进入系统视图。
system-view
(2) 配置会话连接数的告警阈值。
(独立运行模式)
monitor resource-usage session-count [ slot slot-number cpu cpu-number ] threshold threshold-value
(IRF模式)
monitor resource-usage session-count [ chassis chassis-number slot slot-number cpu cpu-number ] threshold threshold-value
缺省情况下,未配置会话连接数的告警阈值,不会触发告警。
配置此功能后,当设备上的会话新建速率达到告警阈值时,则输出告警信息。之后每10分钟输出一次告警,直到会话新建速率低于告警阈值后,才停止输出告警。
(1) 进入系统视图。
system-view
(2) 配置会话新建速率的告警阈值。
(独立运行模式)
monitor resource-usage session-rate [ slot slot-number cpu cpu-number ] threshold threshold-value
(IRF模式)
monitor resource-usage session-rate [ chassis chassis-number slot slot-number cpu cpu-number ] threshold threshold-value
缺省情况下,未配置会话新建速率的告警阈值,不会触发告警。
配置本功能后,设备会监测ARP表项等资源的剩余情况,周期采样监测对象的值,并和配置的告警门限进行比较:
· 如果剩余的资源小于或等于低级别告警门限且大于高级别告警门限,则资源进入低级别告警状态,并生成低级别告警通知;
· 如果剩余的资源小于或等于高级别告警门限,则资源进入高级别告警状态,并生成高级别告警通知;
· 如果剩余的资源大于低级别告警门限,则资源进入恢复告警状态,并生成恢复通知。
当资源一直处于低级别告警状态时:
· 开启周期发送低级别资源告警通知功能后,第一次达到低级别告警状态时,会生成低级别告警通知,后续还会周期生成低级别告警通知。当剩余资源达到更高级别告警门限时,将会生成更高级别的告警通知,暂时抑制低级别的告警通知。直到高级别的告警状态解除,再周期输出低级别的告警通知。
· 关闭周期发送低级别资源告警通知功能后,只有第一次达到低级别告警状态时,才生成低级别告警通知,不会连续生成低级别告警通知。
当资源一直处于高级别告警状态时,设备会周期生成高级别告警通知。
资源告警通知可向NETCONF、SNMP和信息中心三个方向输出,通过配置NETCONF、SNMP、信息中心功能,资源告警最终能以NETCONF事件、SNMP Trap或Inform消息、日志的形式发送给用户。NETCONF、SNMP、信息中心的详细介绍请参见“网络管理和监控配置指导”中的“NETCONF”、“SNMP”、“信息中心”。
图1-3 资源监控示意图
仅缺省Context支持本功能,非缺省Context不支持。
(1) 进入系统视图。
system-view
(2) 配置生成资源告警通知的门限。
(独立运行模式)
resource-monitor resource resource-name slot slot-number cpu cpu-number by-percent minor-threshold minor-threshold severe-threshold severe-threshold
(IRF模式)
resource-monitor resource resource-name chassis chassis-number slot slot-number cpu cpu-number by-percent minor-threshold minor-threshold severe-threshold severe-threshold
不同类型资源的缺省情况不同,请使用display resource-monitor命令查看。
(3) 配置资源告警通知的输出方向。
resource-monitor output { netconf-event | snmp-notification | syslog } *
缺省情况下,资源告警通知会同时向NETCONF、SNMP和信息中心三个方向输出。
(4) 开启周期发送低级别资源告警通知功能。
resource-monitor minor resend enable
缺省情况下,周期发送低级别资源告警通知功能处于开启状态。
通过以下配置任务,用户可以根据实际应用的需要配置不同的温度告警门限,来监控设备上不同位置温度传感器的温度。
设备可配置的温度告警门限包括:低温告警门限、一般级(Warning)高温告警门限、严重级(Alarm)高温告警门限。
如果温度低于低温告警门限、高于一般级或严重级高温门限,系统均会生成相应的日志信息和告警信息提示用户,并通过设备面板上的指示灯来告警,以便用户及时进行处理。
本功能仅缺省Context支持。
(1) 进入系统视图。
system-view
(2) 配置设备的温度告警门限。
(独立运行模式)
temperature-limit slot slot-number { hotspot | inflow | outflow } sensor-number lowlimit warninglimit [ alarmlimit ]
(IRF模式)
temperature-limit chassis chassis-number slot slot-number { hotspot | inflow | outflow } sensor-number lowlimit warninglimit [ alarmlimit ]
不同温度传感器的温度门限可能不同,请先使用undo temperature-limit命令恢复缺省情况后,再通过display environment命令查看设备的缺省温度告警门限。
高温告警门限必须大于低温告警门限;Alarm高温告警门限必须大于Warning高温告警门限。
系统实时监控单板交换芯片的表项健康状态,当单板在设置的检测周期内出现奇偶校验错误次数超过阈值时,系统会上报日志、Trap告警以及不健康状态值。
(1) 进入系统视图。
system-view
(2) 配置奇偶校验功能的检测周期和发生奇偶校验错误的阈值。
monitor parity-error period period-value threshold threshold-value
缺省情况下,奇偶校验功能处于开启状态,检测周期为10秒以及发生奇偶校验错误的阈值为800次。
可以通过显示可插拔接口模块的主要特征参数或者电子标签信息来识别可插拔接口模块。
· 可插拔接口模块的主要特征参数包括:模块型号、连接器类型、发送激光的中心波长、信号的有效传输距离、模块生产厂商名称等信息。
· 电子标签信息也可以称为永久配置数据或档案信息,在光模块或者设备的调试、测试过程中被写入到光模块或者设备的存储器件中,包括光模块或者设备的名称、生产序列号、MAC地址、制造商等信息。
另外,当设备上插入的光模块的生产厂商不是H3C时,设备会打印Log信息提醒用户,要求用户更换成H3C的光模块,以便管理和维护光模块。关于Log输出规则的配置请参见“网络管理和监控配置指导”中的“信息中心”。
请在任意视图下执行以下命令。
· 显示可插拔接口模块的主要特征参数。
display transceiver interface [ interface-type interface-number ]
· 显示可插拔接口模块的电子标签信息。
display transceiver manuinfo interface [ interface-type interface-number ]
系统提供故障告警信息描述了可插拔接口模块的故障来源,以便用户诊断和解决故障。系统还提供了数字诊断功能,其原理是对影响光模块工作的关键参数进行监控(这些关键参数包括:温度、电压、激光偏置电流、发送光功率和接收光功率等),当这些参数的值异常时,用户可以采取相应的措施,预防故障发生。
请在任意视图下执行以下命令。
· 显示可插拔接口模块的当前故障告警信息。
display transceiver alarm interface [ interface-type interface-number ]
· 显示可插拔光模块的数字诊断参数的当前测量值。
display transceiver diagnosis interface [ interface-type interface-number ]
当外置bypass设备PFC通过USB连接到Blade板,且设备接口板同PFC光模块相连时,关闭业务板的USB供电可能会造成环路,这种情况下,需要开启业务板的USB供电。
(1) 进入系统视图
system-view
(2) 开启业务板的USB供电
hardware usb power-on
缺省情况下,业务板的USB供电处于开启状态。
默认情况下,一个IRF成员设备的非IRF单板流量哈希到多个交换网板后,网板会把该流量哈希到一个IRF单板。对多个交换网板执行本命令后,网板会把该流量上送多个IRF单板,来实现流量在多个IRF单板的负载分担。
(1) 进入系统视图
system-view
(2) 开启交换网板基于IRF成员设备单板负载分担
stack load-sharing fabric-slot-based chassis chassis-number slot slot-number
缺省情况下,交换网板基于IRF成员设备单板负载分担处于关闭状态。
系统实施监控系统单板健康状态,当单板出现硬件故障时可通过重启尝试恢复。缺省情况下,当单板连续重启三次后故障依然存在,则直接隔离故障单板。每次重启间隔必须小于等于30分钟,才认为单板连续重启恢复失败,隔离单板;否则不会触发隔离。
业务子卡故障时仅支持重启,不支持被隔离。
(1) 进入系统视图。
system-view
(2) 配置Fault monitor检测的故障单板隔离前重启次数。
monitor fault reboot-number reboot-number
缺省情况下,Fault monitor功能处于开启状态,故障单板隔离前重启次数为3次。
当一个接口交换板上存在不同类型的成员端口时,为充分利用高带宽成员口,将高带宽成员口进行拆分。
(1) 进入系统视图
system-view
(2) 开启IRF物理端口拆分功能
stack port split chassis chassis-number slot slot-number
缺省情况下,同一接口交换板上,存在多个不同类型IRF成员端口时,,IRF物理端口不拆分。
通过配置本功能,当业务板HG端口或XE端口连续n次发生每秒CRC检测错误超过阈值的情况后,业务板将执行相应的动作。通过display crc-error configuration命令可查看业务板内联口的相关配置信息。
此功能仅对支持硬件转发芯片的安全业务板上配置生效。
仅支持在Blade V安全业务板上配置XE端口。
(1) 进入系统视图。
system-view
(2) 配置业务板内联口连续发生每秒CRC检测错误超过阈值时的动作。
monitor crc-error { higig-port | xe-port } action { ignore | reboot | isolate }
缺省情况下,业务板连续发生每秒CRC检测错误超过阈值时的动作为重启。
isolate动作不支持在Blade VI安全业务板上配置。
(3) 配置业务板内联口每秒CRC检测错误的阈值。
monitor crc-error { higig-port | xe-port } threshold threshold-value
缺省情况下,每秒CRC检测错误阈值为50。
(4) 配置业务板内联口连续发生每秒CRC检测错误超过阈值的最大次数。
monitor crc-error { higig-port | xe-port } times times
缺省情况下,连续发生每秒CRC检测错误超过阈值的最大次数为300次。
通过配置定时执行任务功能可以让设备在指定时刻或延迟指定时间后,自动执行指定命令,使设备能够在无人值守的情况下完成某些配置。该功能不但增强了设备的自动控制和管理能力,提高了易用性,而且可以起到有效节能的作用。
定时执行任务有两种类型:一次性执行方式和循环执行方式。两种方式都支持在同一任务中执行多条命令。一次性执行的配置任务不能保存到配置文件,设备重启后该任务将取消。循环执行的配置任务能保存到配置文件,等下次时间到达,任务将自动执行。
· 通过command分配的命令行必须是设备上可成功执行的命令行,但不能包括telnet、ftp、ssh2和monitor process。由用户保证配置的正确性,否则,命令行不能自动被执行。
· 如果需要分配的命令(假设为A)是用户视图下的命令,则直接使用command命令分配即可,比如:command 1 display interface;如果需要分配的命令(假设为A)是非用户视图下的命令,则必须先分配进入A所在视图的命令(指定较小的id值),再分配A。比如:要使用Job定时执行shutdown命令,则需执行三次command命令,分别分配system-view、interface、shutdown命令,且各command命令的id值逐渐增大。
· 定时执行任务时,设备不会与用户交互信息。当需要用户交互确认时,系统将自动输入“Y”或“Yes”;当需要用户交互输入字符信息时,系统将自动输入缺省字符串,没有缺省字符串的将自动输入空字符串。
· 系统将在后台定时执行任务,不显示任何输出信息(log、trap、debug等系统信息除外)。
(1) 进入系统视图。
system-view
(2) 创建Job。
scheduler job job-name
(3) 为Job分配命令。
command id command
缺省情况下,没有为Job分配命令。
多次执行该命令可以为Job分配多条命令,命令的执行顺序由id参数的大小决定,数值小的先执行。
(4) 退回系统视图。
quit
(5) 创建Schedule。
scheduler schedule schedule-name
(6) 为Schedule分配Job。
job job-name
缺省情况下,没有为Schedule分配Job。
多次执行该命令可以为Schedule分配多个Job,各个Job之间并发执行。
(7) 配置执行Schedule的定时任务时使用的用户角色。
user-role role-name
缺省情况下,Schedule执行定时任务时使用的用户角色,为创建该Schedule的用户的用户角色。
多次执行本命令可给Schedule配置多个用户角色,系统会使用这些用户角色权限的并集去执行Schedule。
(8) 配置执行Schedule的时间。请选择其中一项进行配置。
¡ 配置在指定时刻执行Schedule。
time at time date
time once at time [ month-date month-day | week-day week-day&<1-7> ]
¡ 配置延迟执行Schedule的时间。
time once delay time
¡ 为Schedule配置循环执行时间。
time repeating at time [ month-date [ month-day | last ] | week-day week-day&<1-7> ]
¡ 为Schedule配置循环执行周期。
time repeating [ at time [date ] ] interval interval
缺省情况下,没有为Schedule配置执行时间。
一个Schedule只能配置一个时间,最后一次执行的命令生效。
(9) (可选)配置Schedule日志文件的大小。
scheduler logfile size value
缺省情况下,Schedule日志文件的大小为16KB。
Schedule日志文件用来记录Job下命令行的执行结果。如果该文件的大小超过了配置值,则系统会删除老日志,来存储新日志。如果要记录的日志信息超长,超过了日志文件的大小,则该日志超出的部分不会记录。
配置locator blink blink-time命令后,指定设备上用于定位的LED灯会以间隔快闪的方式闪烁,并持续指定的时间。用户可根据LED灯的指示来定位设备所在的位置。
blink-time时间到或者执行locator blink stop命令,则定位闪烁的LED灯会恢复正常点亮状态。
仅缺省Context支持本功能,非缺省Context不支持。
请在用户视图下执行本命令,定位设备的位置。
(独立运行模式)
locator blink blink-time
(IRF模式)
locator [ chassis chassis-number ] blink blink-time
请在用户视图下执行本命令,停止定位。
(独立运行模式)
locator blink stop
(IRF模式)
locator [ chassis chassis-number ] blink stop
重启设备的方式有以下几种:
(1) 硬件重启
通过断电后重新上电来重启设备。该方式对设备影响较大,如果对运行中的设备进行强制断电,可能会造成数据丢失。一般情况下,建议不要使用这种方式。
(2) 命令行重启
主要用于远程重启设备,而不需要到设备所在地进行断电/上电重启。设备支持以下配置方式:
· 通过reboot命令行立即重启设备。
· 通过scheduler reboot定时重启设备。该方式效果同执行reboot命令,只是使用该方式用户可以配置时间点,让设备在该时间点自动重启,或者配置一个时延,让设备经过指定时间后自动重启。比“通过reboot命令行立即重启设备”方式灵活。
如果设备在准备重启时,用户正在进行文件操作,为了安全起见,系统将不会执行此次重启操作。
请在任意视图下执行以下命令。
(1) 确认是否配置了正确的下次启动配置文件。
display startup
本命令的详细介绍请参见“基础配置命令参考”中的“配置文件管理”。
(2) 确认是否配置了正确的下次启动文件。
display boot-loader
如果主用启动文件损坏或者不存在,则不允许通过reboot命令重启设备。请指定新的主用启动文件后再重启。
本命令的详细介绍请参见“基础配置命令参考”中的“软件升级”。
(3) 为避免重启后配置丢失,将当前配置保存到下次启动配置文件。
save
请根据需要保存当前配置,以免重启后配置丢失。
本命令的详细介绍请参见“基础配置命令参考”中的“配置文件管理”。
请在用户视图下执行以下命令,重启设备。
(独立运行模式)
reboot [ slot slot-number ] [ force ]
(IRF模式)
reboot [ chassis chassis-number [ slot slot-number ] ] [ force ]
· 重新启动可能会导致业务中断,请谨慎使用该命令。
· 使用force参数时,系统在重启时不会做任何保护性措施。重启后,可能导致文件系统损坏,请谨慎使用该参数。建议在系统故障或无法正常重启时,才使用该参数。
使用该方式配置定时重启后,如果发生主备倒换,则定时重启配置将自动取消。(独立运行模式)
该配置对所有成员设备生效。配置定时重启后,如果发生全局主用主控板和全局备用主控板的主备倒换,则定时重启配置将自动取消。(IRF模式)
当多次执行scheduler reboot命令,最新的配置生效。
请在用户视图下执行本命令,配置重启设备的具体时间或延迟时间。
· scheduler reboot at time [ date ]
· scheduler reboot delay time
缺省情况下,未配置设备重启的时间。
本命令会使设备在将来的某个时间点重新启动,从而导致业务中断,请谨慎使用。
当设备使用场景更改,或者设备出现故障时,可以使用本特性将设备恢复到出厂状态,仅保留“.bin”和License文件。
仅缺省Context支持本功能,非缺省Context不支持。
请在用户视图下执行本命令,将设备恢复到出厂状态。
restore factory-default
使用本命令会将设备恢复到出厂状态,请谨慎使用。
本功能可以将设备上指定检查项的检查结果重置为“Normal(0)”,即健康状态。
(1) 进入系统视图。
system-view
(2) 重置设备上指定检查项的检查结果。
(独立运行模式)
reset-health-value { chip-error | fmea-blade | fmea-port | hg-packet-drop | hg-packet-loss | hg-packet-tamper | hg-port-down | parity-error | port-drop } slot slot-number cpu cpu-number
(IRF模式)
reset-health-value { chip-error | fmea-blade | fmea-port | hg-packet-drop | hg-packet-loss | hg-packet-tamper | hg-port-down | parity-error | port-drop } chassis chassis-number slot slot-number cpu cpu-number
在完成上述配置后,在任意视图下执行display命令可以显示配置后设备的运行情况,通过查看显示信息验证配置的效果。
请在系统视图下执行reset version-update-record命令,在用户视图下执行reset scheduler logfile命令。
display device manuinfo fan、display device manuinfo power、display xbar命令的支持情况与设备型号有关,具体请参见命令参考。
非缺省vSystem不支持部分显示和维护命令,具体情况请参见本特性的命令参考。有关vSystem的详细介绍请参见“虚拟化技术配置指导”中的“vSystem”。
表1-1 设备管理显示和维护
操作 |
命令 |
显示设备的告警信息 |
(独立运行模式) display alarm [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display alarm [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示系统当前的时间、日期、本地时区以及夏令时配置 |
display clock |
显示设备的版权信息 |
display copyright |
显示CPU利用率的统计信息 |
(独立运行模式) display cpu-usage [ summary ] [ slot slot-number [ cpu cpu-number [ core { core-number | all } ] ] ] display cpu-usage [ control-plane | data-plane ] [ summary ] [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display cpu-usage [ summary ] [ chassis chassis-number slot slot-number [ cpu cpu-number [ core { core-number | all } ] ] ] display cpu-usage [ control-plane | data-plane ] [ summary ] [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示CPU利用率监控功能的相关配置 |
(独立运行模式) display cpu-usage configuration [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display cpu-usage configuration [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
以图表方式显示CPU利用率的历史记录 |
(独立运行模式) display cpu-usage history [ job job-id ] [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display cpu-usage history [ job job-id ] [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示设备信息 |
(独立运行模式) display device [ slot slot-number [ cpu cpu-number ] [ subslot subslot-number ] | verbose ] (IRF模式) display device [ chassis chassis-number [ slot slot-number [ cpu cpu-number ] [ subslot subslot-number ] ] | verbose ] |
显示设备的电子标签信息 |
(独立运行模式) display device manuinfo [ slot slot-number [ cpu cpu-number ] [ subslot subslot-number ] ] (IRF模式) display device manuinfo [ chassis chassis-number [ slot slot-number [ cpu cpu-number ] [ subslot subslot-number ] ] ] |
显示指定机框背板的电子标签信息 |
(独立运行模式) display device manuinfo chassis-only (IRF模式) display device manuinfo chassis chassis-number chassis-only |
显示指定风扇的电子标签信息 |
(独立运行模式) display device manuinfo fan fan-id (IRF模式) display device manuinfo chassis chassis-number fan fan-id |
显示指定电源的电子标签信息 |
(独立运行模式) display device manuinfo power power-id (IRF模式) display device manuinfo chassis chassis-number power power-id |
收集诊断信息 |
display diagnostic-information [ hardware | infrastructure | l2 | l3 | service ] [ context context-name ] [ key-info ] [ filename ] |
显示设备的温度信息 |
(独立运行模式) display environment [ slot slot-number ] (IRF模式) display environment [ chassis chassis-number [ slot slot-number ] ] |
显示风扇的工作状态 |
(独立运行模式) display fan [ fan-id ] (IRF模式) display fan [ chassis chassis-number [ fan-id ] ] |
显示设备的内存使用状态 |
(独立运行模式) display memory [ summary ] [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display memory [ summary ] [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示内存告警门限相关信息 |
(独立运行模式) display memory-threshold [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display memory-threshold [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示设备的电源状态 |
(独立运行模式) display power [ power-id ] (IRF模式) display power [ chassis chassis-number [ power-id ] ] |
显示资源监控功能的相关信息 |
(独立运行模式) display resource-monitor [ resource resource-name ] [ slot slot-number [ cpu cpu-number ] ] (IRF模式) display resource-monitor [ resource resource-name ] [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] |
显示Job的配置信息 |
display scheduler job [ job-name ] |
显示Job的执行日志信息 |
display scheduler logfile |
显示定时重启功能的相关配置 |
display scheduler reboot |
显示Schedule的相关信息 |
display scheduler schedule [ schedule-name ] |
显示设备的健康状态 |
(独立运行模式) display system health (IRF模式) display system health [ chassis chassis-number ] |
显示系统健康状态变化的历史信息 |
(独立运行模式) display system health history (IRF模式) display system health history[ chassis chassis-number ] |
显示系统的稳定状态 |
display system stable state [ context { context-id | all } ] |
显示系统版本信息 |
display version |
显示启动软件包版本更新操作的记录 |
display version-update-record |
清除Schedule日志文件的相关信息 |
reset scheduler logfile |
清除启动软件包版本更新操作的记录 |
reset version-update-record |
表1-2 设备管理显示和维护(2)
操作 |
命令 |
显示业务板内联口的配置信息 |
display crc-error { higig-port | xe-port } configuration |
查看CPU接收方向、发送方向和PCI链路的状态监控是否开启 |
display monitor cpu-status |
显示触发设备Fault monitor功能的配置信息 |
display monitor fault |
显示设备奇偶校验功能的配置信息 |
display monitor parity-error |
· 对于display cpu-usage、display cpu-usage configuration、display cpu-usage history、display memory命令,登录Context后执行这些命令,会显示该Context可使用的CPU/内存的相关信息。
· 对于display device命令,在缺省Context和非缺省Context下执行该命令,显示信息相同,且均显示物理设备的对应信息。
以下命令仅缺省Context支持,非缺省Context不支持。
· display alarm
· display bootrom-access
· display device manuinfo chassis-only
· display memory-threshold
· display version-update-record
· reset scheduler logfile
· reset version-update-record
· display xbar
不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!