手册下载
使用U-Center 2.0监控UniServer R4900 G3服务器
配置举例
资料版本:5W114-20230927
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
H3C UniServer R4900 G3是H3C自主研发、基于英特尔®至强®可扩展处理器系列或澜起津逮®处理器系列CPU平台的2U2路机架式服务器,可广泛应用于互联网、云计算网、互联网数据中心、企业市场、电信等领域。
本文将对U-Center 2.0监控UniServer R4900 G3服务器的配置过程和监控报表进行介绍。
U-Center 2.0在数据中心环境下对UniServer R4900 G3服务器进行监控。
· UniServer R4900 G3服务器安装和配置完成,可以正常启动。
· U-Center 2.0安装和部署完成。
· U-Center 2.0服务器和UniServer R4900 G3服务器之间能够正常通信。
· U-Center 2.0在纳管设备时,需要具有IPMI协议权限的用户。请联系服务器管理员获取相应的用户名、密码以及端口号。
¡ 验证用户名和密码能否登录HDM,如图1所示。
¡ 登录成功后,能够查看服务器的各类信息,如图2所示。
¡ UniServer R4900 G3服务器使用IPMI服务的默认端口号为623,可在HDM中进行查看或修改,如图3所示。查看或修改端口号的方式可能会因HDM版本不同而有所区别,请以实际情况为准。
IPMI(Interlligent Platform Management Interface,智能平台管理接口)是一项应用于服务器管理系统的标准,利用此接口标准可以实现对不同类服务器硬件系统的统一管理。IPMI通过主板上一个单独供电的BMC(Baseboard Manager Controller,基板管理控制器)芯片及自有的日志系统实现硬件信息读取。由于不同厂商服务器的私有属性,可能需要通过SNMP协议与Rest接口方式对IPMI进行补充,确保信息的全面管理。
某公司数据中心有一台UniServer R4900 G3服务器,用于承载企业中的业务需求,如图4所示。服务器管理员现在要使用U-Center 2.0对UniServer R4900 G3服务器进行监控,组网明细如表1所示。
主机名 |
IP地址 |
应用 |
Server(U-Center 2.0) |
192.167.15.44 |
U-Center IOM 2.0(E0711) |
UniServer R4900 G3 |
112.121.19.4 |
HDM版本:1.30.19 |
(1) 登录U-Center 2.0。
(2) 选择“监控”页签。
(3) 在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面。
(4) 单击<增加>按钮,在弹出的下拉菜单中选择“H3C Server”分类下的“UniServer R4900 G3”。
(5) 进入增加“H3C Server”监控页面,如图5所示。
图5 增加“H3C Server”监控页面
(6) 配置基本信息,如图6所示。
¡ IP地址:输入UniServer R4900 G3的IP地址。本例输入“112.121.19.4”。
¡ 名称:采用U-Center 2.0自动生成的名称“H3C Server_112.121.19.4”,用户也可按需修改。本例中不做修改,保持默认名称。
¡ 描述:按需填写应用的描述信息。本例不填写。
(7) 配置监控参数,如图7所示。
¡ 是否加入监控:增加资源对象时是否加入监控。监控和配置轮询至少需加入一个。默认加入,本例中不做修改。
¡ 监控模板:默认使用U-Center 2.0预定义的H3C Server模板,单击<设置>按钮,可以重新选择监控模板或修改监控模板配置。
修改监控模板的相关操作,请参见“3.2.2 配置H3C Server监控模板”。
¡ 子型号:待监控服务器的具体型号。单击<计算>按钮,可查看该型号服务器不支持采集的单元指标集。
¡ 是否加入配置轮询:默认加入。配置轮询功能需购买CMDB产品的相关License获取数量授权和功能授权,否则页面上将不显示该字段。
¡ 选择代理:指定监控的管理站,默认为“local”。若为proxy场景,需使用proxy进行应用纳管,则此处需选择“proxy”。
(8) 配置访问参数,如图8所示。
¡ 监控协议:预置“IPMI”协议。UniServer R4900 G3服务器为纯IPMI管理的设备,不需要配置SNMP参数。
¡ 访问参数模板名称:单击<设置>按钮,选择访问参数模板或修改访问参数模板配置。
¡ 用户名和密码:输入具有登录服务器HDM口权限用户的用户名和密码,获取方式和验证方式请参见“2.2 配置前提”。
¡ 监控端口:UniServer R4900 G3服务器使用IPMI服务的端口号,默认为623。请根据实际情况填写,查看或修改端口号的方式请参见“2.2 配置前提”。本例保持默认。
(9) 配置日志访问参数,如图9所示。
¡ 是否开启日志监控:是否监控和采集服务器的日志信息,默认为“否”。本例不做修改,保持默认。
¡ 是否收集全部日志:只有在开启日志监控后才可设置,默认为否。若选择“是”,收集包括已产生的历史日志在内的全部日志信息;若选择“否”,则仅收集开启日志监控后产生的事件日志。
¡ 日志模板:保存了日志访问参数信息,可以帮助用户快速配置服务器日志相关访问参数。单击<设置>按钮,选择日志模板或修改日志模板配置。
¡ 轮询时间(分钟):采集服务器日志的轮询时间间隔。
(10) 可根据需要为监控的对象配置资源分组,便于资源管理,如图10所示。本例不进行配置。
(11) 配置“是否探测应用”,默认为“是”,如图11所示。本例保持默认。
(12) 单击<测试连通性>按钮,检验配置参数是否正确。
(13) 连通性测试通过后,单击<确定>按钮,增加应用任务。
(14) 在监控列表中会显示新增的监控信息,如图12所示。
U-Center 2.0通过监控模板控制采集指标及其阈值,且预置了大量可直接使用的监控模板。用户还可根据实际需求修改的监控模板,达到个性化监控的目的。
用户可以对关注的指标设置阈值,通过监控资源的告警状态及时了解应用运行状态。常用操作如下:
· 复制监控模板、修改阈值配置,请参见“1. 修改阈值配置”。
(1) 选择“监控”页签。
(2) 在左导航树中选择[监控选项>监控模板]菜单项,进入监控模板页面,如图13所示。
(3) 在页面上方的“选择模板类型”中,选择“服务器>H3C>H3C Server”,查看H3C Server的监控模板,如图14所示。操作列提供如下功能:
¡ 单击“复制模板”图标,进入复制监控模板页面。举例,复制监控模板A,将生成监控模板A_copy,用户可在复制监控模板页面对新模板信息进行修改和保存。
¡ 单击“修改阈值”图标,进入修改监控模板页面的阈值配置页签。
(4) 单击某一监控模板对应操作列的“修改”图标,进入修改监控模板页面,如图15所示。
系统预置的监控模板中的各项指标,不推荐随意修改。涉及多项参数修改时,推荐先复制监控模板,并在复制模板中修改参数,再为应用配置修改后的监控模板。
此处以修改“温度”指标组中“当前值”指标为例进行介绍。
(2) 展开指标配置页签下的“温度”指标组,如图16所示。
(3) 单击“当前值”指标对应操作列的“阈值”图标,在弹出窗口中设置参数,如图17所示。
¡ 阈值类型:U-Center 2.0包含普通阈值、复合阈值、规则阈值以及实例丢失阈值类型,不同阈值类型所需配置不同。请按需选择阈值类型,设置判断符并选择阈值等级。部分指标的阈值类型已在U-Center 2.0中预定义,不可修改。
¡ 适用时间:包含全部时间和自定义时间。自定义时间,支持周一至周日的任意时间段设置。本例选择全部时间。
¡ 阈值配置:对“当前值”指标,本例启用“通知”,并设置阈值和触发次数,判断符使用“大于”。当超过设置的阈值,并达到触发次数时,将产生“通知”级别告警。
图17 修改阈值配置
(4) 单击<确定>按钮,保存修改的配置参数。
(5) 单击“阈值配置”页签,即可查看配置的阈值信息,如图18所示。
(6) 若无需修改监控模板中的其它参数,请单击页面底部的<确定>按钮,保存修改内容。
(7) 复制的监控模板创建成功,如图19所示。
(8) 在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面,替换资源的监控模板并保存,如图20所示。系统将在下个采集周期将使用新的监控模板。
U-Center 2.0通过监控模板控制指标采集间隔,针对不同的指标组可采用不同的采集间隔。
(1) 选择“监控”页签。
(2) 在左导航树中选择[监控选项>监控模板]菜单项,进入监控模板页面。
(3) 在页面上方的“选择模板类型”中,选择“服务器>H3C>H3C Server”,如图21所示。
图21 监控模板页面
(4) 单击模板对应操作列的“修改”图标,进入修改模板页面,如图22所示。
列表中显示了该监控模板的监视指标,此处以配置“温度”指标组的采集间隔为例进行介绍。
(5) 勾选“温度”指标组,单击<修改采集间隔>按钮,在弹出窗口中修改采集间隔,如图23所示。
(6) 在“采集间隔”下拉菜单中选择采集间隔时间。本例将采集间隔修改为4分钟。
(7) 单击<确定>按钮,修改完成如图24所示。
(8) 在修改模板页面单击<确定>按钮,提示修改监控模板成功。下个采集周期将自动应用修改后的监控模板。
· 如果指标值超出了对应阈值,则监控报表中的该值的底色变为U-Center 2.0中对应告警级别的颜色。
· 如果同一应用有不同级别的告警被触发,则告警状态中将展示已触发的最高级别告警。
(1) 选择“监控”页签。
(2) 在左导航树中选择[基础监控>服务器]菜单项,进入服务器页面。经过一段采集时间,此时告警状态已发生变化,如图25所示。
(3) 单击“名称”链接,在弹出的窗口中查看监控报表,如图26所示。
图26 监控报表(部分)
下面将对使用默认监控模板监控的指标为例,对监控报表概览的各区段进行介绍。
图27 监视器信息
· 型号:服务器的型号。
· 序列号:服务器的序列号。
· 系统状态:服务器的健康状态。
· 机箱电源:是否上电。
· 温度状态:服务器的温度状态。
· 电源状态:服务器的电源状态。
· 风扇状态:服务器的风扇状态。
· 内存状态:服务器的内存状态。
· 存储状态:服务器的存储状态。
· CPU状态:服务器的CPU状态。
图28 今日可用性
· 饼图:今日各可用性状态的百分比。将鼠标移至饼图的分片上可以看到相应状态的百分比数据。
· 当前可用性:当前应用的可用性。
¡ 正常运行:资源对象可正常连接,且能采集到监控数据。
¡ Ping不可达:监控对象不能Ping通,后续会产生Ping不可达告警。
¡ 协议连接失败:无法与被监控对象建立连接,后续会产生监控管理协议连接性告警。
¡ 停止采集:资源对象处于停止监控采集状态,此时告警状态为“未知”。
· 时长:
¡ 正常运行时长:从今日00:00开始,应用的累计正常运行时长。
¡ Ping不可达时长:从今日00:00开始,应用无法Ping通的时长。
¡ 协议连接失败时长:从今日00:00开始,应用的累计协议连接失败时长。
¡ 停止采集时长:从用户手动关闭设备的监控采集状态开始,应用的累计停止采集时长。
对于新增加的应用监控,“正常运行”、“协议连接失败”以及“停止采集”从当日应用监控增加成功开始计时,并且时长为0的可用性状态统计数据不显示。
· 7天历史:单击<7天历史>按钮,查看应用最近7天的可用性。7天历史以小时为单位统计应用的可用性,用户将鼠标移至相应时段可以查看应用各可用性状态百分比,如图29所示。
图29 7天历史
· 30天历史:单击<30天历史>按钮,查看应用最近30天的可用性。30天历史以天为单位统计应用的可用性。用户将鼠标移至相应时段可以查看应用各可用性状态百分比,如图30所示。
图30 30天历史
图31 风扇
· 名称:风扇的名称。
· 状态:风扇的状态。
· 转速:风扇的转速。
图32 温度
· 名称:温度传感器的名称。
· 状态:温度传感器的状态。
· 当前值:温度传感器读取的当前值。
图33 CPU
· 名称:CPU的名称。
· 型号:CPU的型号。
· 频率:CPU的频率。
· 状态:CPU的状态。
图34 内存
· 位置:内存的位置。
· 插槽号:内存的插槽号。
· 状态:内存的状态。
· 在位与否:在位与否。
· 内存大小:内存的大小。
图35 供电体
· 型号:供电体的型号。
· 序列号:供电体的序列号。
· 是否在位:供电体是否在位。
· 状态:供电体的状态。
图36 电源读取体
· 当前功率:电源读取体的当前功率。
图37 网卡
· 端口:网卡的端口。
· MAC地址:网卡的MAC地址。
图38 存储控制器
· 型号:存储控制器的型号。
· 序列号:存储控制器的序列号。
· 状态:存储控制器的状态。
图39 逻辑存储
· 类型:逻辑存储的类型。
· 状态:逻辑存储的状态。
· 逻辑磁盘容量:逻辑磁盘的容量。
图40 物理存储
· 位置:物理存储的位置。
· 序列号:物理存储的序列号。
· 状态:物理存储的状态。
· 物理磁盘容量:物理磁盘的容量。
图41 HDM版本
· HDM版本:HDM的版本。
(1) 在资源详情窗口,监控概览页签的表头,会展示监控应用的名称、类型、告警状态以及挂牌状态。如果同一应用触发了不同级别的告警,告警状态将展示已触发的最高级别告警。
根据本例中配置,UniServer R4900 G3将产生“通知”级别的告警,并在告警状态展示该级别的告警,如图42所示。
(2) 单击告警状态信息链接或选择“告警信息”页签,进入告警信息页面,如图43所示。
(3) 单击“告警信息”链接可以查看告警详细信息,如图44所示。
(4) 用户收到告警信息后,若确认相关信息无误后,可单击确认状态中的“未确认”链接确认告警,如图45所示。
(5) 修复完环境中存在的问题或重设阈值后,可单击恢复状态列下的“未恢复”链接,恢复告警状态,如图46所示。
(6) U-Center 2.0对应用监控是周期性的,如果在下个周期采集到指标值已不满足阈值条件,将自动恢复告警状态并记录新的指标值。
(7) 当所有告警状态恢复后,应用的告警状态也会恢复为正常,如图47所示。