• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

13-使用U-Center 2.0监控UniServer R4900 G3服务器配置举例

手册下载

13-使用U-Center 2.0监控UniServer R4900 G3服务器配置举例-整本手册.pdf  (2.95 MB)

  • 发布时间:2024/6/11 20:23:25
  • 浏览量:
  • 下载量:

使用U-Center 2.0监控UniServer R4900 G3服务器

配置举例

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:5W114-20230927

 

Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。



特性简介

H3C UniServer R4900 G3H3C自主研发、基于英特尔®至强®可扩展处理器系列或澜起津逮®处理器系列CPU平台的2U2路机架式服务器,可广泛应用于互联网、云计算网、互联网数据中心、企业市场、电信等领域。

本文将对U-Center 2.0监控UniServer R4900 G3服务器的配置过程和监控报表进行介绍。


特性使用指南

2.1  使用场景

U-Center 2.0在数据中心环境下对UniServer R4900 G3服务器进行监控。

2.2  配置前提

·     UniServer R4900 G3服务器安装和配置完成,可以正常启动。

·     U-Center 2.0安装和部署完成。

·     U-Center 2.0服务器UniServer R4900 G3服务器之间能够正常通信。

·     U-Center 2.0在纳管设备时,需要具有IPMI协议权限的用户。请联系服务器管理员获取相应的用户名、密码以及端口号。

¡     验证用户名和密码能否登录HDM,如1所示。

¡     登录成功后,能够查看服务器的各类信息,如2所示。

¡     UniServer R4900 G3服务器使用IPMI服务的默认端口号为623,可在HDM中进行查看或修改,如3所示。查看或修改端口号的方式可能会因HDM版本不同而有所区别,请以实际情况为准。

说明

IPMIInterlligent Platform Management Interface,智能平台管理接口)是一项应用于服务器管理系统的标准,利用此接口标准可以实现对不同类服务器硬件系统的统一管理。IPMI通过主板上一个单独供电的BMCBaseboard Manager Controller,基板管理控制器)芯片及自有的日志系统实现硬件信息读取。由于不同厂商服务器的私有属性,可能需要通过SNMP协议与Rest接口方式对IPMI进行补充,确保信息的全面管理。

 

图1 登录HDM

 

图2 服务器整体概况

 

图3 查看端口

 


配置举例

3.1  组网需求

某公司数据中心有一台UniServer R4900 G3服务器,用于承载企业中的业务需求,如4所示。服务器管理员现在要使用U-Center 2.0UniServer R4900 G3服务器进行监控,组网明细如1所示。

图4 组网

 

表1 组网明细

主机名

IP地址

应用

Server(U-Center 2.0)

192.167.15.44

U-Center IOM 2.0(E0711)

UniServer R4900 G3

112.121.19.4

HDM版本:1.30.19

 

3.2  配置步骤

3.2.1  增加UniServer R4900 G3服务器监控

(1)     登录U-Center 2.0

(2)     选择“监控”页签。

(3)     在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面。

(4)     单击<增加>按钮,在弹出的下拉菜单中选择“H3C Server”分类下的“UniServer R4900 G3”。

(5)     进入增加“H3C Server”监控页面,如5所示。

图5 增加“H3C Server”监控页面

 

(6)     配置基本信息,如6所示。

¡     IP地址:输入UniServer R4900 G3IP地址。本例输入112.121.19.4”。

¡     名称:采用U-Center 2.0自动生成的名称“H3C Server_112.121.19.4”,用户也可按需修改。本中不做修改,保持默认名称。

¡     描述:按需填写应用的描述信息。本例不填写。

图6 配置基本信息

 

(7)     配置监控参数,如7所示。

¡     是否加入监控:增加资源对象时是否加入监控。监控和配置轮询至少需加入一个。默认加入,本例中不做修改。

¡     监控模板:默认使用U-Center 2.0预定义的H3C Server模板,单击<设置>按钮,可以重新选择监控模板或修改监控模板配置。

修改监控模板的相关操作,请参见“3.2.2  配置H3C Server监控模板”。

¡     子型号:待监控服务器的具体型号。单击<计算>按钮,可查看该型号服务器不支持采集的单元指标集。

¡     是否加入配置轮询:默认加入。配置轮询功能需购买CMDB产品的相关License获取数量授权和功能授权,否则页面上将不显示该字段。

¡     选择代理:指定监控的管理站,默认为“local”。若为proxy场景,需使用proxy进行应用纳管,则此处需选择“proxy”。

图7 配置监控参数

 

 

(8)     配置访问参数,如8所示。

¡     监控协议:预置“IPMI”协议。UniServer R4900 G3服务器为纯IPMI管理的设备,不需要配置SNMP参数。

¡     访问参数模板名称:单击<设置>按钮,选择访问参数模板或修改访问参数模板配置。

¡     用户名和密码:输入具有登录服务器HDM口权限用户的用户名和密码,获取方式和验证方式请参见“2.2  配置前提”。

¡     监控端口:UniServer R4900 G3服务器使用IPMI服务的端口号,默认为623。请根据实际情况填写,查看或修改端口号的方式请参见“2.2  配置前提”。本例保持默认。

图8 配置访问参数

 

(9)     配置日志访问参数,如9所示。

¡     是否开启日志监控:是否监控和采集服务器的日志信息,默认为“否”。本例不做修改,保持默认。

¡     是否收集全部日志:只有在开启日志监控后才可设置,默认为否。若选择“是”,收集包括已产生的历史日志在内的全部日志信息;若选择“否”,则仅收集开启日志监控后产生的事件日志。

¡     日志模板:保存了日志访问参数信息,可以帮助用户快速配置服务器日志相关访问参数。单击<设置>按钮,选择日志模板或修改日志模板配置。

¡     轮询时间(分钟):采集服务器日志的轮询时间间隔。

图9 配置日志访问参数

 

(10)     可根据需要为监控的对象配置资源分组,便于资源管理,如10所示。本例不进行配置。

图10 支持配置资源分组

 

(11)     配置“是否探测应用”,默认为“是”,如11所示。本例保持默认。

图11 是否探测应用

 

(12)     单击<测试连通性>按钮,检验配置参数是否正确。

(13)     连通性测试通过后,单击<确定>按钮,增加应用任务。

(14)     在监控列表中会显示新增的监控信息,如12所示。

图12 监控列表

 

3.2.2  配置H3C Server监控模板

U-Center 2.0通过监控模板控制采集指标及其阈值,且预置了大量可直接使用的监控模板。用户还可根据实际需求修改的监控模板,达到个性化监控的目的。

用户可以对关注的指标设置阈值,通过监控资源的告警状态及时了解应用运行状态。常用操作如下:

·     复制监控模板、修改阈值配置,请参见“1. 修改阈值配置”。

·     修改指标采集间隔,请参见“2. 修改指标采集间隔”。

(1)     选择“监控”页签。

(2)     在左导航树中选择[监控选项>监控模板]菜单项,进入监控模板页面,如13所示。

图13 监控模板列表

 

(3)     在页面上方的“选择模板类型”中,选择“服务器>H3C>H3C Server”,查看H3C Server的监控模板,如14所示。操作列提供如下功能:

¡     单击“修改”图标,进入修改对应修改监控模板页面。

¡     单击“复制模板”图标,进入复制监控模板页面。举例,复制监控模板A,将生成监控模板A_copy,用户可在复制监控模板页面对新模板信息进行修改和保存。

¡     单击“修改阈值”图标,进入修改监控模板页面的阈值配置页签。

图14 监控模板

 

(4)     单击某一监控模板对应操作列的“修改”图标,进入修改监控模板页面,如15所示。

图15 修改监控模板

 

1. 修改阈值配置

系统预置的监控模板中的各项指标,不推荐随意修改。涉及多项参数修改时,推荐先复制监控模板,并在复制模板中修改参数,再为应用配置修改后的监控模板。

此处以修改“温度”指标组中“当前值”指标为例进行介绍。

(1)     单击“复制模板”图标,进入复制监控模板页面。

(2)     展开指标配置页签下的“温度”指标组,如16所示。

图16 温度指标组

 

(3)     单击“当前值”指标对应操作列的“阈值”图标,在弹出窗口中设置参数,如17所示。

¡     阈值类型:U-Center 2.0包含普通阈值、复合阈值、规则阈值以及实例丢失阈值类型,不同阈值类型所需配置不同。请按需选择阈值类型,设置判断符并选择阈值等级。部分指标的阈值类型已在U-Center 2.0中预定义,不可修改。

¡     适用时间:包含全部时间和自定义时间。自定义时间,支持周一至周日的任意时间段设置。本例选择全部时间。

¡     阈值配置:对“当前值”指标,本例启用“通知”,并设置阈值和触发次数,判断符使用“大于”。当超过设置的阈值,并达到触发次数时,将产生“通知”级别告警。

图17 修改阈值配置

 

(4)     单击<确定>按钮,保存修改的配置参数。

(5)     单击“阈值配置”页签,即可查看配置的阈值信息,如18所示。

图18 修改阈值配置完成

 

(6)     若无需修改监控模板中的其它参数,请单击页面底部的<确定>按钮,保存修改内容。

(7)     复制的监控模板创建成功,如19所示。

图19 新增监控模板

 

(8)     在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面,替换资源的监控模板并保存,如20所示。系统将在下个采集周期将使用新的监控模板。

图20 修改监控模板

 

2. 修改指标采集间隔

U-Center 2.0通过监控模板控制指标采集间隔,针不同的指标组可采用不同的采集间隔。

(1)     选择“监控”页签。

(2)     在左导航树中选择[监控选项>监控模板]菜单项,进入监控模板页面。

(3)     在页面上方的“选择模板类型”中,选择“服务器>H3C>H3C Server”,如21所示。

图21 监控模板页面

 

(4)     单击模板对应操作列的“修改”图标,进入修改模板页面,如22所示。

列表中显示了该监控模板的监视指标,此处以配置“温度”指标组的采集间隔为例进行介绍。

图22 修改模板页面

 

(5)     勾选“温度”指标组,单击<修改采集间隔>按钮,在弹出窗口中修改采集间隔,如23所示。

图23 修改采集间隔

 

(6)     在“采集间隔”下拉菜单中选择采集间隔时间。本例将采集间隔修改为4分钟。

(7)     单击<确定>按钮,修改完成如24所示。

图24 修改指标阈值完成

 

(8)     在修改模板页面单击<确定>按钮,提示修改监控模板成功。下个采集周期将自动应用修改后的监控模板。

3.3  配置验证

3.3.1  查看监控报表

说明

·     如果指标值超出了对应阈值,则监控报表中的该值的底色变为U-Center 2.0中对应告警级别的颜色。

·     如果同一应用有不同级别的告警被触发,则告警状态中将展示已触发的最高级别告警。

 

(1)     选择“监控”页签。

(2)     在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面。经过一段采集时间,此时告警状态已发生变化,如25所示。

图25 查看监控列表

 

(3)     单击“名称”链接,在弹出的窗口中查看监控报表,如26所示。

图26 监控报表(部分)

 

下面将对使用默认监控模板监控的指标为例,对监控报表概览的各区段进行介绍。

1. 监视器信息区段

图27 监视器信息

 

 

·     型号:服务器的型号。

·     序列号:服务器的序列号。

·     系统状态:服务器的健康状态。

·     机箱电源:是否上电。

·     温度状态:服务器的温度状态。

·     电源状态:服务器的电源状态。

·     风扇状态:服务器的风扇状态。

·     内存状态:服务器的内存状态。

·     存储状态:服务器的存储状态。

·     CPU状态:服务器的CPU状态。

2. 今日可用性区段

图28 今日可用性

 

·     饼图:今日各可用性状态的百分比。将鼠标移至饼图的分片上可以看到相应状态的百分比数据。

·     当前可用性:当前应用的可用性。

¡     正常运行:资源对象可正常连接,且能采集到监控数据。

¡     Ping不可达:监控对象不能Ping通,后续会产生Ping不可达告警。

¡     协议连接失败:无法与被监控对象建立连接,后续会产生监控管理协议连接性告警。

¡     停止采集:资源对象处于停止监控采集状态,此时告警状态为“未知”。

·     时长:

¡     正常运行时长:从今日00:00开始,应用的累计正常运行时长。

¡     Ping不可达时长:从今日00:00开始,应用无法Ping通的时长。

¡     协议连接失败时长:从今日00:00开始,应用的累计协议连接失败时长。

¡     停止采集时长:从用户手动关闭设备的监控采集状态开始,应用的累计停止采集时长。

说明

对于新增加的应用监控,“正常运行”、“协议连接失败”以及“停止采集”从当日应用监控增加成功开始计时,并且时长为0的可用性状态统计数据不显示。

 

·     7天历史:单击<7天历史>按钮,查看应用最近7天的可用性。7天历史以小时为单位统计应用的可用性,用户将鼠标移至相应时段可以查看应用各可用性状态百分比,如29所示。

图29 7天历史

 

·     30天历史:单击<30天历史>按钮,查看应用最近30天的可用性。30天历史以天为单位统计应用的可用性。用户将鼠标移至相应时段可以查看应用各可用性状态百分比,如30所示。

图30 30天历史

 

3. 风扇区段

图31 风扇

 

·     名称:风扇的名称

·     状态:风扇的状态

·     转速:风扇的转速

4. 温度区段

图32 温度

 

·     名称:温度传感器的名称。

·     状态:温度传感器的状态。

·     当前值:温度传感器读取的当前值。

5. CPU区段

图33 CPU

 

·     名称:CPU的名称。

·     型号:CPU的型号。

·     频率:CPU的频率。

·     状态:CPU的状态。

6. 内存区段

图34 内存

 

·     位置:内存的位置。

·     插槽号:内存的插槽号。

·     状态:内存的状态。

·     在位与否:在位与否。

·     内存大小:内存的大小。

7. 供电体区段

图35 供电体

 

·     型号:供电体的型号。

·     序列号:供电体的序列号。

·     是否在位:供电体是否在位。

·     状态:供电体的状态。

8. 电源读取体区段

图36 电源读取体

 

·     当前功率:电源读取体的当前功率。

9. 网卡区段

图37 网卡

 

·     端口:网卡的端口。

·     MAC地址:网卡的MAC地址。

10. 存储控制器区段

图38 存储控制器

 

·     型号:存储控制器的型号。

·     序列号:存储控制器的序列号。

·     状态:存储控制器的状态。

11. 逻辑存储区段

图39 逻辑存储

 

·     类型:逻辑存储的类型。

·     状态:逻辑存储的状态。

·     逻辑磁盘容量:逻辑磁盘的容量。

12. 物理存储区段

图40 物理存储

 

·     位置:物理存储的位置。

·     序列号:物理存储的序列号。

·     状态:物理存储的状态。

·     物理磁盘容量:物理磁盘的容量。

13. HDM版本区段

图41 HDM版本

 

·     HDM版本:HDM的版本。

3.3.2  查看阈值告警

(1)     在资源详情窗口,监控概览页签的表头,会展示监控应用的名称、类型、告警状态以及挂牌状态。如果同一应用触发了不同级别的告警,告警状态将展示已触发的最高级别告警。

根据本例中配置,UniServer R4900 G3将产生“通知”级别的告警,并在告警状态展示该级别的告警,如42所示。

图42 监控概览

 

(2)     单击告警状态信息链接或选择“告警信息”页签,进入告警信息页面,如43所示。

图43 告警信息

 

(3)     单击“告警信息”链接可以查看告警详细信息,如44所示。

图44 告警详细信息

 

(4)     用户收到告警信息后,若确认相关信息无误后,可单击确认状态中的“未确认”链接确认告警,如45所示。

图45 确认告警

 

(5)     修复完环境中存在的问题或重设阈值后,可单击恢复状态列下的“未恢复”链接,恢复告警状态,如46所示。

图46 恢复告警

 

(6)     U-Center 2.0对应用监控是周期性的,如果在下个周期采集到指标值已不满足阈值条件,将自动恢复告警状态并记录新的指标值。

(7)     当所有告警状态恢复后,应用的告警状态也会恢复为正常,如47所示。

图47 告警状态恢复

 

新华三官网
联系我们