• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C UniServer R4960 G3 服务器 故障处理-5W100

01-正文

本章节下载 01-正文  (918.87 KB)

01-正文


概述

本手册介绍了H3C UniServer R4960 G3 服务器的日志信息收集方法,故障现象及对应的诊断、处理方法,巡检指导。

根据本手册您可以进行日常维护,日常维护包括收集日志信息,根据告警和故障现象采取对应措施处理,了解巡检相关事项,进行对应软件升级。

读者对象

本手册主要适用于以下工程师:

l   技术支持工程师

l   维护工程师

符号约定

在本文中可能出现下列标志,它们所代表的含义如下。

符号

说明

表示如不避免则将会导致死亡或严重伤害的具有高等级风险的危害。

表示如不避免则可能导致死亡或严重伤害的具有中等级风险的危害。

表示如不避免则可能导致轻微或中度伤害的具有低等级风险的危害。

用于传递设备或环境安全警示信息。如不避免则可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果。

“须知”不涉及人身伤害。

对正文中重点信息的补充说明。

“说明”不是安全警示信息,不涉及人身、设备及环境伤害信息。


1 安全

通用声明

l   操作设备时,应当严格遵守当地的法规和规范,手册中所描述的安全注意事项仅作为当地安全规范的补充。

l   手册中描述的“危险”、“警告”、“小心”和“注意”事项,只作为所有安全注意事项的补充说明。

l   为保障人身和设备安全,在设备的安装过程中,请严格遵循设备上标识和手册中描述的所有安全注意事项。

l   特殊工种的操作人员(如电工、电动叉车的操作员等)必须获得当地政府或权威机构认可的从业资格证书。

l   此为A级产品,在生活环境中,该产品可能会造成无线电干扰。在这种情况下,可能需要用户对其干扰采取切实可行的措施。

人身安全

l   设备的整个安装过程必须由通过H3C认证的人员或经过H3C认证人员授权的人员来完成。

l   安装人员在安装过程中,如果发现可能导致人身受到伤害或设备受到损坏时,应当立即终止操作,向项目负责人进行报告,并采取行之有效的保护措施。

l   禁止在雷雨天气进行操作,包括但不限于搬运设备、安装机柜、安装电源线等。

l   搬运设备时,不能超过当地法律或法规所允许单人搬运的最大重量。要充分考虑安装人员当时的身体状况,务必不能超越安装人员所能承受的重量。

l   安装人员必须佩戴洁净的劳保手套、穿工作服、戴安全帽、穿劳保鞋,如图1-1所示。

图1-1 安全防护措施

 

l   在接触设备前,应当去除身体上携带的易导电物体(如首饰、手表等),以免被电击或灼伤,如图1-2所示。

图1-2 去除易导电的物体

 

佩戴防静电腕带的方法如图1-3所示。

1.       将手伸进防静电腕带。

2.       拉紧锁扣,确认防静电腕带与皮肤接触良好。

3.       将防静电腕带的接地端插入机柜或机箱(已接地)上的防静电腕带插孔。

图1-3 佩戴防静电腕带

 

l   安装人员使用工具时,务必按照正确的操作方式进行,以免危及人身安全。

l   当设备的安装位置超过安装人员的肩部时,请使用抬高车等工具辅助安装,避免设备滑落导致人员受伤或设备损坏。

l   高压电源为设备的运行提供电力,直接接触或通过潮湿物体间接接触高压电源,会带来致命危险。

l   在接通电源之前设备必须先接地,否则会危及人身安全。

l   安装人员使用梯子时,必须有专人看护,禁止单独作业,以免摔伤。

l   在连接、测试或更换光纤时,禁止裸眼直视光纤出口,以防止激光束灼伤眼睛。

设备安全

l   为了保护设备和人身安全,请使用配套的电源线缆。

l   电源线缆只能用于配套的服务器设备,禁止在其他设备上使用。

l   搬运设备时,应握住设备的手柄或托住设备的底边,而不应握住设备内已安装模块(如电源模块,风扇模块、硬盘或主板)的手柄。

l   为了保证设备运行的可靠性,电源线需要以主备方式连接到不同的PDU(Power distribution unit)上。

设备搬迁注意事项

l   雇用正规的物流公司进行设备搬迁,运输过程必须符合电子设备运输国际标准,避免出现设备倒置、磕碰、潮湿、腐蚀或包装破损、污染等情况。

l   待搬迁的设备应使用原厂包装。

l   机箱形态的设备等重量和体积较大的部件、光模块、PCIe(GPU或SSD)卡等易损部件若没有使用原厂包装,需要分别单独包装。

l   严禁带电搬迁设备,严禁携带可能导致搬迁过程发生危险的物件。

单人允许搬运的最大重量

 

单人所允许搬运的最大重量,请以当地的法律或法规为准,设备上的标识和文档中的描述信息均属于建议。

表1-1中列举了一些组织对于成年人单次所允许搬运的最大重量的规定,供参考。

表1-1 部分组织对于成年人单次所允许搬运的最大重量的规定

组织名称

重量(kg/lb)

CEN(European Committee for Standardization)

25/55.13

ISO(International Organization for Standardization)

25/55.13

NIOSH(National Institute for Occupational Safety and Health)

23/50.72

HSE(Health and Safety Executive)

25/55.13

中华人民共和国国家质量监督检验检疫总局

l  男:15/33.08

l  女:10/22.05


2 处理流程

故障处理是指利用合理的方法,逐步找出故障原因并解决。其指导思想是将由故障可能的原因所构成的一个大集合缩减(或隔离)成若干个小的子集,使问题的复杂度迅速下降,最终找到问题的根本原因,并采取合适的措施进行排除。

故障处理推荐流程如图2-1所示。

图2-1 故障处理流程

 

表2-1 流程图步骤说明表

步骤

说明

3 处理准备

准备故障诊断和处理所需的手册和工具。

4 收集信息

收集完整的、有助于故障诊断定位的信息。

5 诊断和处理故障

利用故障定位方法找到故障根因,制定并实施故障排除措施。

9.1 技术支持

如果在设备维护或故障处理过程中遇到难以确定或难以解决的问题,通过文档的指导仍然不能解决,请联系H3C技术工程师。


3 处理准备

操作场景

在开始故障处理之前,指导用户做好相关的准备工作。

基础技能

进行服务器故障处理操作需要具备以下基础技能:

l   熟悉服务器产品知识。

l   熟悉设备危险标志和等级。

l   熟悉设备硬件架构。

l   熟悉前后面板告警指示。

l   熟悉设备上所运行的系统。

l   熟悉设备正常运行的条件。

l   熟悉硬件的常用操作,如上下电等。

l   熟悉软件的常用操作,如升级等。

l   熟悉维护设备的流程。

必读资料

服务器日常维护前必读资料,如表3-1所示。

表3-1 日常维护必读资料

文档类型

说明

获取

用户指南和维护与服务指南

介绍服务器产品的结构、规格和安装。

请参考《H3C UniServer R4960 G3 服务器 用户指南》和《H3C UniServer R4960 G3 服务器 维护与服务指南》。

告警处理

介绍iBMC所支持的服务器产品各类型告警信息及处理建议。

请参考《H3C UniServer R4960 G3 服务器 iBMC 告警处理》。

机房规范

客户机房日常维护规范,现场维护时必须严格遵守客户机房管理规范。

以实际客户机房规范为准。

 

软件工具

服务器日常维护软件工具,如表3-2所示。

表3-2 日常维护软件工具

名称

支持的服务器及版本要求

说明

PuTTY

支持所有服务器产品和版本。

第三方软件,需自备,远程访问工具。

WinSCP

支持所有服务器产品和版本。

第三方软件,需自备,用于iBMC管理软件或管理模块的文件传输。

 

硬件工具

服务器日常维护硬件工具,如表3-3所示。

表3-3 日常维护硬件工具

名称

说明

浮动螺母安装条

用于牵引浮动螺母,使浮动螺母安装在机柜的固定导槽孔位上。

螺丝刀

用于拆装螺钉,一般为一字、十字、六棱套筒等。

斜口钳

用于剪切绝缘套管、电缆扎线扣等。

万用表

用于测量电阻、电压,检查导通关系等。

防静电腕带

用于接触或操作设备和器件,可防止静电放电。

防静电手套

用于插拔单板、手拿单板或其他精密仪器等,可防止静电放电。

绑线扣

用于绑扎线缆。

梯子

用于高处作业。

PC

自备网线,用于通过网络访问管理网口或业务网口,捕获数据。

串口线

服务器侧串口接口一般为RJ45。

温度计/湿度计

用于监控机房温度、湿度是否满足设备稳定运行环境。

示波器

用于测量电压和时序。


4 收集信息

关于本章

服务器发生故障,需要收集日志信息进行故障诊断。

请在故障发生后的第一时间进行数据收集,保证数据原始性。

4.1  收集基本信息

4.2  收集操作系统日志信息

4.3  收集硬件日志信息

4.1 收集基本信息

客户请求服务之前,应做好相关基本信息收集,具体请按照表4-1收集。

表4-1 服务器故障病历卡

服务器故障病历卡

问题单号

如:123456

问题上报时间

xxxx年xx月xx日xx时xx分xx

客户名称

xxx客户

地址

xx省xx市xx县/镇/街道

客户/ASP姓名

如:张三

联系方式

电话/邮箱

设备型号

如H3C UniServer R4960 G3 服务器

设备序列号(SN/ESN号)

2102310XXXXX

设备硬件配置

若现场改配过CPU、内存、RAID、网卡等,需提供改配的设备配置。没有请填“无”。

OS及业务软件版本

如suse11sp1 64(根据具体问题判断是否需要收集)

故障发生时间

xxxx年xx月xx日xx时xx分xx

故障现象

如安装系统过程自动重启、开机挂起等。

故障前的动作

如修改BIOS、内存扩容、修改网络配置等。

故障后已采取的动作及结果(可选)

如插拔电源线重新安装,故障依旧。

更换光盘,故障依旧。

……

 

4.2 收集操作系统日志信息

当操作系统出现故障时,请收集相关的操作系统日志信息。

l  收集信息前,请先获取客户书面授权,再执行操作。

l  H3C UniServer R4960 G3 服务器支持的具体操作系统信息请联系技术支持获取。

表4-2 操作系统日志收集方法

操作系统

收集方法

Linux(包括CentOS、SLES、Ubuntu、EulerOS等)

使用SSH工具登录操作系统命令行,拷贝“/var/log/”路径下的所有文件。

优先收集“/var/log/boot.log”以及“/var/log/”路径下以syslog(例如syslog、syslog.0)、dmesg和kernel为前缀命名的文件。

说明

操作系统卡住无法登录的情况下,需先收集当时的截图,重启恢复操作系统后再收集日志信息。

 

4.3 收集硬件日志信息

当硬件出现故障时,请收集相关的硬件日志信息。

收集信息前,请先获取客户书面授权,再执行操作。

收集单台服务器硬件信息,可通过iBMC一键收集硬件日志信息,具体请参见8.2 通过iBMC一键收集信息。


5 诊断和处理故障

5.1  诊断原则

5.2  根据告警处理故障

5.3  根据故障码定位故障

5.4  根据指示灯定位故障

5.5  根据现象处理故障

5.1 诊断原则

 

l  收集信息前,请先获取客户书面授权,再执行操作。

l  所有操作需保证业务数据不会丢失或已经备份。

在进行故障诊断时,请遵循以下基本原则:

l   先诊断外部,后诊断内部。

诊断故障时,应先排除外部的可能因素,如电源中断、对接设备故障等。

l   先诊断网络,后诊断网元。

根据网络拓扑图,分析网络环境是否正常、互连设备是否发生故障,尽可能准确定位出是网络中哪个网元发生故障。

l   先高速部分,后低速部分。

从告警信号流中可以看出,高速信号的告警经常会引起低速信号的告警。因此在故障诊断时,应先排除高速部分的故障。

l   先分析高级别告警,后分析低级别告警。

分析告警时,首先分析高级别的告警,如紧急告警、严重告警,然后再分析低级别的告警,如轻微告警。

5.2 根据告警处理故障

根据服务器的管理系统检查告警并进行诊断。请在《H3C UniServer R4960 G3 服务器 iBMC 告警处理》中检索告警码,查询对应的告警处理方法。

5.3 根据故障码定位故障

H3C UniServer R4960 G3 服务器故障诊断数码管的位置请参见《H3C UniServer R4960 G3 服务器 用户指南》,故障诊断数码管的显示状态及含义如表5-1所示。请根据故障诊断数码管上显示的故障码,在《H3C UniServer R4960 G3 服务器 iBMC 告警处理》中查询对应的故障处理方法。

表5-1 故障码

模块名称

显示状态

含义

处理步骤及说明

故障诊断数码管

显示“---”

表示服务器正常。

无需任何操作。

显示故障码

表示服务器有部件故障。

故障码的详细信息请参见《H3C UniServer R4960 G3 服务器 iBMC 告警处理》的“故障码处理”章节。

 

5.4 根据指示灯定位故障

介绍H3C UniServer R4960 G3 服务器指示灯状态对应的含义及处理步骤。

H3C UniServer R4960 G3 服务器指示灯位置请参见《H3C UniServer R4960 G3 服务器 用户指南》。

操作流程

检查指示灯的操作流程如图5-1所示。

图5-1 指示灯检查流程图

 

                           步骤 1     检查设备的总体健康状态指示灯。

表5-2 总体健康状态指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

健康状态指示灯

红色1Hz闪烁

系统有严重告警。

1.    登录iBMC Web界面查看具体告警事件。具体操作方法请参见《H3C UniServer R4960 G3 服务器 iBMC 用户指南》的“Web界面介绍 > 告警与事件”章节。

2.    (可选)查看前面板“故障诊断数码”确认具体故障码。具体可参见5.3 根据故障码定位故障。

红色5Hz闪烁

系统有紧急告警。

绿色常亮

表示设备运转正常。

无需任何操作。

电源开关指示灯

绿色常亮

表示设备已正常上电。

无需任何操作。

黄色闪烁

表示iBMC管理系统正在启动。

黄色常亮

表示设备处于待上电状态。

按PWR键开机,如果无法正常开机,请登录iBMC Web界面排查相关告警。

熄灭

表示设备未上电。

1.    如果iBMC可登录,请查看是否有告警。

2.    如果iBMC无法登录,请检查设备是否正常供电或电源模块是否故障。

UID指示灯

熄灭

表示服务器未被定位。

说明

l  UID按钮/指示灯可方便地定位待操作的服务器,通过手动按UID按钮或者通过iBMC命令远程控制使灯灭或灯亮。

l  长按定位按钮4~6秒钟,复位服务器的iBMC管理系统。

l  对UID按钮/指示灯进行操作不影响业务。

蓝色常亮

表示服务器已被定位。

蓝色闪烁

表示服务器被重点定位。

 

                           步骤 2     根据具体iBMC系统事件日志进行故障定位。

                           步骤 3     检查设备各子部件的状态指示灯。

SAS/SATA硬盘状态指示灯、NVMe硬盘状态指示灯、电源模块状态指示灯和网络端口指示灯的含义以及处理步骤分别如表5-3表5-4表5-5表5-6所示。

表5-3 SAS/SATA硬盘状态指示灯

硬盘Active指示灯

硬盘Fault指示灯

含义

处理步骤及说明

绿色常亮

熄灭

表示硬盘工作正常。

无需任何操作。

绿色闪烁

表示硬盘正在读写数据。

绿色常亮

黄色闪烁

表示硬盘被定位或RAID重构。

绿色闪烁

绿色常亮/熄灭

黄色常亮

表示硬盘故障。

登录iBMC检查硬盘是否存在故障。具体操作方法请参见《H3C UniServer R4960 G3 服务器 iBMC 用户指南》的“Web界面介绍 > 诊断”章节。

熄灭

熄灭

表示硬盘不在位或硬盘故障。

请检查硬盘是否完全接触正常或登录iBMC检查硬盘是否存在故障。

 

表5-4 NVMe硬盘状态指示灯

NVMe硬盘Active指示灯

NVMe硬盘Fault指示灯

含义

处理步骤及说明

绿色常亮

熄灭

NVMe硬盘在位且无故障。

无需任何操作。

绿色2Hz闪烁

NVMe硬盘正在进行读写操作。

熄灭

NVMe硬盘不在位。

绿色常亮/熄灭

黄色常亮

NVMe硬盘故障。

重新插拔后若问题仍未解决则更换NVMe硬盘。

熄灭

黄色2Hz闪烁

NVMe硬盘被定位或正处于热插过程中。

无需任何操作。

黄色0.5Hz闪烁

NVMe硬盘已完成热拔出流程,允许拔出。

拔出NVMe硬盘。

 

表5-5 电源模块状态指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

电源模块指示灯

熄灭

表示无交流电源输入。

请检查电源线是否连接正常或电源模块是否存在故障。

绿色常亮

表示输入和输出正常。

无需任何操作。

橙色常亮

表示输入正常,电源过温保护、电源输出过流/短路、输出过压、短路保护、器件失效(不包括所有的器件失效)等原因导致无输出。

将电源模块拔出,重新安装,检查问题是否解决,若仍橙色常亮,请更换电源模块。

绿色1Hz闪烁

表示输入正常,服务器为Standby状态。

检查外部供电是否正常。

说明

禁止对电源模块进行插拔等操作。

表示输入过欠压。

绿色4Hz闪烁

表示电源Firmware在线升级过程中。

无需任何操作。

说明

禁止断开电源或对电源模块进行插拔等操作。

 

表5-6 网络端口指示灯

模块指示灯

指示灯状态

含义

处理步骤及说明

光口连接状态指示灯/数据传输状态指示灯

绿色常亮

表示网络连接正常。

无需任何操作。

绿色闪烁

表示有数据正在传输。

熄灭

表示网络未连接。

1.    交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

光口速率指示灯

黄色常亮

表示数据传输速率为10Gbit/s。

1.    交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

绿色常亮

表示数据传输速率为25Gbit/s。

无需任何操作。

熄灭

表示网络未连接。

1.    交叉检查交换机、光纤、光模块(类型、速率是否匹配)是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

管理网口数据传输状态指示灯

黄色闪烁

表示有数据正在传输。

无需任何操作。

熄灭

表示当前无数据传输。

1.    交叉检查交换机和网线是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

管理网口连接状态指示灯

绿色常亮

表示网络连接正常。

无需任何操作。

熄灭

表示网络未连接。

1.    交叉检查交换机和网线是否正常。

2.    检查交换机是否UP。

GE电口数据传输状态指示灯

黄色闪烁

表示有数据正在传输。

无需任何操作。

熄灭

表示当前无数据传输。

1.    交叉检查交换机和网线是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

GE电口连接状态指示灯

绿色常亮

表示网络连接正常。

无需任何操作。

熄灭

表示当前网络未连接。

1.    交叉检查交换机和网线是否正常。

2.    检查交换机和网卡端口是否UP。

3.    检查网卡状态是否正常。

灵活网卡在位指示灯(1,2)

说明

1,2:代表两个灵活网卡。

绿色常亮

表示灵活网卡连接正常。

无需任何操作。

熄灭

表示灵活网卡未插或故障。

1.    确认网卡是否插好。

2.    检查单板是否有损坏。如果有,更换单板。

 

----结束

5.5 根据现象处理故障

5.5.1 电源问题

设备状态术语说明如下:

l   通电:设备加电,电源按钮指示灯亮。

l   待机:设备加电,电源按钮指示灯黄色常亮。

l   上电:设备加电,电源按钮指示灯绿色常亮。

l   POST:上电自检。

请根据以下故障现象进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

故障现象

处理步骤

快速恢复方法

单电源模块故障(无输出,健康状态指示灯红色闪烁)

1.    检查电源模块指示灯状态并记录iBMC告警信息。指示灯状态具体请参见5.4 根据指示灯定位故障指示灯。

2.    查看是否存在AC lost告警。

l  是,检查电源线是否插紧,PDU是否有电。

l  否,执行3

3.    更换备件电源模块,查看故障是否解决。

l  是,处理完毕。

l  否,执行4

4.    更换电源背板。无电源背板产品请更换主板,查看故障是否解决。

l  是,处理完毕。

l  否,请联系H3C技术支持工程师处理。

1.    检查当前设备配置和功率是否满足供电冗余。

l  是,说明当前故障不影响业务。

l  否,请联系H3C技术支持工程师处理。

2.    拔出故障电源模块,且禁止再次插入设备,待备件到货后进行更换。

设备不通电(指示灯全灭)

1.    检查外部供电是否正常。

l  是,执行2

l  否,解决外部供电问题。

2.    交叉验证电源模块,即更换正常的电源模块,查看故障是否解决。

l  是,处理完毕。

l  否,执行3

3.    更换主板和电源背板,查看故障是否解决。

l  是,处理完毕。

l  否,请联系H3C技术支持工程师处理。

根据处理步骤进行排查,更换故障模块。

 

5.5.2 KVM登录问题

1.       请根据以下表格中的故障现象进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

2.       若KVM链接登录异常,推荐使用独立远程控制台登录,独立远程控制台工具请联系技术支持获取。

故障现象

处理步骤

快速恢复方法

KVM链接无法打开

1.    使用PuTTY等第三方工具执行telnet IP地址 8208(默认端口号为8208,可通过登录iBMC界面查看服务配置中VMM端口设置获取)命令检查KVM端口是否正常;如果Telnet无法连接,请通过PC直连iBMC排查。

2.    清理浏览器及Java缓存,并关掉所有浏览器;重新打开iBMC。

3.    调节Java安全级别为中或以下,或将KVM地址添加到Java例外站点。

4.    检查客户端OS、Java和浏览器版本,详细参考iBMC帮助文档的运行环境要求;推荐使用firefox 23.0版本。

1.    根据处理步骤进行排查,更换故障模块。

2.    重新启动iBMC,更换客户端PC。

3.    将管理网口不经过交换网络,直接连接客户端PC。

KVM提示异常

l  登录用户超出最大数:可通过iBMC WebUI或CLI确认是否有其他用户正在使用,通过重启iBMC强制清理其它用户。

l  非法用户:清理浏览器及Java缓存,并关掉所有浏览器,重启/iBMC。

l  输入信号超出范围:检查操作系统分辨率是否超出KVM最大范围1280*1024。

KVM可登录,但使用有异常

l  键盘鼠标不能使用但业务正常:复位USB,检查问题是否解决。

      是,处理完毕。

      否,重启业务系统,清除CMOS,配套升级iBMC和BIOS。

l  挂载虚拟光驱报错:Telnet远程登录检查虚拟光驱端口是否正常,检查升级iBMC和BIOS版本。

 

5.5.3 POST阶段异常

请根据以下故障现象进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

故障现象

处理步骤

快速恢复方法

待机不能上电(电源按钮指示灯黄色常亮)

1.    收集iBMC日志,查询CPLD寄存器确认是否电源故障。

2.    排查主板(集成CPU)和内存是否安装正确。

1.    拆卸NIC等PCIe外部设备。查看故障是否解决。

l  是,处理完毕。

l  否,执行2

2.    仅保留服务器最小化配置,即仅保留单个CPU、主板和单根内存。查看故障是否解决。

l  是,处理完毕。

l  否,执行3

3.    排查CPU、主板和内存是否故障,确认故障部件后进行更换。

上电即掉电

1.    收集iBMC日志,查询CPLD寄存器确认是否电源故障。

说明

OS掉电后,先进行BMC日志收集,不要拔出AC电源或进行重启操作,否则CPLD寄存器记录的故障信息bit位会被清除。

2.    排查电源背板和主板是否存在故障。

1.    检查外部供电环境是否正常,包括PDU或电源插排、电源模块和电源线。更换故障部件,查看故障是否解决。

l  是,处理完毕。

l  否,执行2

2.    更换主板或电源背板。

上电即no signal

1.    收集iBMC日志,查询CPLD寄存器确认是否电源故障。

2.    通过iBMC命令行开启BIOS全打印,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。

1.    执行ipmcset -d clearcmos命令,清除CMOS,查看故障是否解决。

l  是,处理完毕。

l  否,执行2

须知

执行ipmcset -d clearcmos命令会恢复BIOS默认配置,请谨慎执行此操作。

2.    升级iBMC和BIOS。查看故障是否解决。

l  是,处理完毕。

l  否,执行3

3.    拆除PCIe卡等外部设备。查看故障是否解决。

l  是,处理完毕。

l  否,执行4

4.    仅保留服务器最小化配置,即仅保留单个CPU、主板和单根内存。查看故障是否解决。

l  是,处理完毕。

l  否,执行5

5.    排查CPU、主板和内存是否故障,确认故障部件后进行更换。

反复上下电

1.    开启iBMC录屏。

2.    通过iBMC命令行开启BIOS全打印,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。

3.    恢复BIOS默认值,查看是否正常运行。

l  如果恢复BIOS默认值后恢复正常,业务侧根据实际应用修改BIOS相关参数。

l  如果恢复BIOS默认值后无效,则收集iBMC日志、下载BIOS的BIN文件,具体请参见《H3C UniServer R4960 G3 服务器 iBMC 用户指南》。

POST随机界面卡住

1.    截图当前屏幕。

2.    收集iBMC日志,查询CPLD寄存器,确认是否电源故障。

3.    通过iBMC命令行开启BIOS全打印。

4.    开启iBMC录屏,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。

5.    排查USB外设、CPU、硬盘、内存、PCIe设备。

RAID自检卡住

1.    将当前iBMC的KVM或本地KVM拍照保留。

2.    收集iBMC日志。

1.    如果存在RAID卡固件错误,更换RAID卡或超级电容。查看故障是否解决。

l  是,处理完毕。

l  否,执行2

2.    排查硬盘、硬盘背板或SAS线缆是否故障。

l  是,更换故障部件。

l  否,执行3

3.    如果RAID组离线,则重新导入RAID组。查看故障是否解决。

l  是,处理完毕。

l  否,执行4

4.    如果超级电容电量为空,则根据界面提示,按相关按键使系统保持运行状态,上电约30分钟后观察超级电容状态。若超级电容显示异常,请更换超级电容。

网卡PXE失败

1.    确认网卡是否支持PXE。

2.    查看BIOS PXE配置、 确认网卡PXE功能是否启用。

3.    排查网卡是否故障。

4.    业务侧排查PXE网络环境。

根据处理步骤处理。

 

5.5.4 内存错误问题

内存错误相关的故障,请根据以下情况进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

故障现象

处理步骤

快速恢复方法

系统内存少于安装的物理内存

1.    检查内存是否包含在兼容性里。

l  是,执行2

l  否,将内存更换为在兼容性里包含的部件。

2.    检查内存安装位置是否满足配置规则。

l  是,执行3

l  否,则按照配置规则重新安装内存。

3.    检查iBMC是否产生“DIMM configuration error紧急告警”。

l  是,替换故障内存条,具体操作请参见参考5.2 根据告警处理故障。

l  否,执行4

4.    检查内存条插槽是否异常,如果异常,更换主板。

1.    如果iBMC产生“DIMMxxx Configuration Error”,请更换产生告警的内存。

2.    如果iBMC、OS显示的在位内存情况与实际物理内存情况对应关系有异常(包括无法识别内存,显示内存故障)。则更换显示有异常的内存。

3.    如果内存不满足内存配置规则,请根据兼容性重新安装内存。

4.    如果内存安装插槽有异常,请更换主板。

出现内存不可纠正错误的告警

1.    安装故障内存条到不同的通道上,使用测试工具验证。

l  如果故障现象跟随内存条出现,更换内存条。

l  如果故障发生在相同内存插槽,检查内存连接器,若有明显的损伤,更换主板。

1.    将故障内存与正常内存进行互换验证。

l  如果问题跟随内存条出现,则更换内存条。

l  如果问题跟随内存槽出现,更换主板。

2.    如果以上步骤都无复现问题,请联系H3C技术支持工程师。

 

5.5.5 硬盘IO问题

硬盘IO相关的故障,请根据以下情况进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

故障现象

处理步骤

快速恢复方法

iBMC上报Disk Fault硬盘告警事件

1.    如果告警硬盘在RAID组中,可先确认RAID组状态是否正常并尝试恢复。

2.    对告警硬盘尝试更换新硬盘解决。

3.    如果问题依旧,交叉验证硬盘槽位是否异常。

说明

支持带外管理的RAID卡,硬盘处于“Unconfigured Good (Foreign) ”状态,BMC会对其进行告警,但是硬盘Fault指示灯不会被点亮。

1.    如果故障硬盘未配置RAID(直通场景下的硬盘除外),则该硬盘无法使用,更换故障硬盘处理。建议在部署业务前所有硬盘配置RAID并部署业务冗余。

2.    备份冗余RAID组当中的数据,避免数据丢失。

3.    根据处理步骤进行排查,更换故障模块。

单个或部分硬盘在RAID卡中识别不到

1.    下电服务器,对该识别不到的硬盘与其它硬盘进行对调插拔,上电服务器确定问题是否在硬盘上。

l  如果问题跟着硬盘走,建议更换硬盘解决。

l  如果问题跟着槽位走,检查硬盘背板所有SAS端口是否都正常连接SAS线缆,可参考用户指南。

l  否则,执行2

2.    依次更换RAID卡、SAS线缆、硬盘背板解决。

1.    如果冗余RAID失效,或者未配置RAID组,则相应硬盘分区无法使用。

2.    把未识别硬盘或其所在的RAID组所有硬盘按照原来顺序依次移到备机上,尝试备份数据。

3.    根据处理步骤进行排查,更换故障模块。

全部硬盘在RAID卡中都识别不到

1.    检查硬盘Active指示灯是否点亮。确认供电线缆和硬盘是否安装正常。

2.    检查SAS线缆、点灯信号线是否连接正确,可参考用户指南的“内部布线”章节。

3.    否则依次更换RAID卡、SAS线缆、硬盘背板解决。

保持硬盘顺序不变,根据处理步骤进行排查,更换故障模块。

 

5.5.6 以太网控制器问题

请根据以下故障现象进行诊断。

现场具备通过日志或工具定位故障的条件时,请参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。

故障现象

处理步骤

快速恢复方法

网口不可见

1.    排查网卡类型/驱动与OS/服务器(BIOS/iBMC)是否符合兼容性要求:

l  如果使用不在兼容性里的系统,请联系技术支持解决。

说明

建议使用在兼容性里的系统。

l  如果网卡版本不配套,请先升级。

2.    在Linux系统中执行以下命令:lspci | grep -i eth*(请根据实际操作系统操作排查),排查网卡PCI硬件设备是否可见。

l  如果PCI设备可见,参考4

l  如果PCI设备不可见,参考3

3.    如果PCI设备不可见,执行以下步骤:

a.    查看网卡逻辑关系,如果网卡PCI总线没有对应的CPU,对应CPU下PCI扣卡不可见。

b.   iBMC先下电再上电,确认问题是否必现。

c.    对换不同槽位网卡,判断是否与具体网卡或网卡槽位相关。

4.    如果PCI设备可见,但网口不可见,驱动加载失败导致,执行以下步骤:

a.    在Linux系统中执行以下命令:ifconfig ethN up(请根据实际操作系统操作排查),排查网口配置文件和物理网口是否一致,是否up端口。

b.   如果以编译方式安装驱动报错,请排查系统是否已正确安装GCC和C/C++。

c.    排查光模块类型,Intel网卡配非Intel光模块时网口会加载失败,无法看到网口。

d.   重新安装驱动,排查驱动安装过程是否有明显报错,系统日志是否有驱动加载失败打印。

5.    收集操作系统的日志。

1.    如服务器正常运行过程中,原来可见的网口突然不可见,如果业务允许停机,则先下电后上电进行观察,若问题仍存在,执行2

2.    将网卡更换到其他PCIe卡槽位进行观察。

l  如果问题跟随网卡,则更换网卡。

l  如果问题跟随PCI插槽,则更换主板。

网口不通

1.    排查网线是否连接正常。

2.    排查网卡类型/驱动与服务器单板(BIOS/iBMC)是否符合兼容性要求;网卡版本不配套,请先升级配套。

3.    在Linux系统中执行以下命令:ifconfig ethN up,ethtool ethN(请根据实际操作系统操作排查),排查网卡是否up,且状态正常link,IP是否设置在正确的网口上。

4.    在Linux系统中执行以下命令:ethtool -p ethN(请根据实际操作系统操作排查),排查服务器网口配置文件和物理网口是否一致,网口状态灯亮,对端交换机网口up。

说明

ethtool -p ethN命令只针对标卡。

5.    排查IP,网关,VLAN,bonding及上行交换机网口设置。

6.    收集操作系统的日志。

1.    将异常服务器ping同网段其他IP,并检查同网段其他服务器是否存在网络异常:

l  如果同网段多台服务器有问题,则检查外部交换网络是否异常。

l  如果同网段只有一台服务器有问题,执行2检查网卡。

2.    检查网卡网口状态(状态指示灯是否常亮),如果网口状态是link down(状态指示灯灭),将异常网口对应的光模块、光纤和上行交换机端口与正常网口对应部件进行互换,验证是否正常,根据实际情况更换或调整部件。

3.    如果问题跟随网卡出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常;如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。

网口丢包/错包

1.    排查网卡类型/驱动与服务器单板(BIOS/iBMC)是否符合兼容性要求;如果网卡版本不配套,请先升级至配套版本。

2.    排查网口丢包/错包统计是否持续增长,非持续增长的统计可不关注。

3.    对调不同槽位网卡,排查是否与具体网卡或槽位相关。

4.    排查服务器:不同服务器网口对调网线测试,是否和网线相关。

5.    切换业务流量到其它单板网口,排查是否和流量有关。

6.    在Linux系统中执行以下命令:ethtool -S ethN(请根据实际操作系统操作排查),排查网口丢包/错包具体项,根据对应项进一步排查。

7.    收集操作系统的日志。

1.    排查是否单台服务器网卡丢包,执行ethtool -S ethN命令查询丢包类型,执行top命令检查系统资源情况(如软中断、CPU和内存占用情况),检查网卡流量。

2.    在业务允许停机的情况下,首先用PC直连网口,测试是否丢包;再和其他正常网口进行交叉验证,排查光模块、光纤线、上行交换机端口,根据实际情况更换或调整部件。

3.    如果问题跟随网卡出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常;如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。

网口性能不达标

1.    排查网卡类型/驱动与服务器单板(BIOS/iBMC)是否符合兼容性要求;网卡版本不配套,请先升级配套。

2.    排查物理网口是否达到性能要求。

3.    排查是否修改过网口中断与CPU队列绑定关系。

4.    在Linux系统中执行以下命令:ethtool -k ethN(请根据实际操作系统操作排查),排查是否修改过网口TSO,GSO设置。

5.    在Linux系统中执行以下命令:ethtool -g ethN(请根据实际操作系统操作排查),排查是否修改过网口buffer。

6.    收集操作系统的日志。

 

5.5.7 OS问题

OS安装问题

OS安装相关的故障,请根据以下情况进行诊断。

诊断思路

诊断步骤

可安装的OS选择问题

检查OS是否与服务器兼容。

OS安装方式问题

检查OS是否与服务器兼容,并查看对应的OS安装指南。

OS安装过程中的问题

1.    请参考对应的OS安装指南,检查OS安装步骤是否正确。

2.    检查OS是否对安装介质有特定要求,比如是否要求必须使用物理光驱。

3.    检查OS是否要求对OS安装盘有特定要求,比如是否要求必须合入某些驱动。

4.    检查OS安装盘是否是原厂光盘,是否有第三方做过修改。

5.    检查是否有外部存储空间,如果有,请尝试断开外部存储。

6.    检查BIOS配置是否经过修改,如果有,请尝试恢复BIOS默认值。

7.    向OS厂商获取标准的安装支持。

硬盘识别问题

1.    检查RAID控制卡下是否可识别到目标硬盘,检查目标硬盘是否兼容;检查BIOS中是否可以识别到目标存储设备(包括SD卡、内置U盘等)。

2.    检查RAID控制卡型号,确认是否需要配置RAID。

3.    检查RAID控制卡配置,确认启动盘与目标盘是否为同一硬盘或者RAID组。

4.    检查硬盘是否是4K盘。

5.    检查RAID控制卡型号,确认是否正确加载RAID控制卡驱动。

6.    检查硬盘上是否有残留数据影响安装,可以尝试把硬盘格式化,或者重新配置RAID组。

 

OS故障问题

界定OS故障问题之前,请排查是否是其他故障问题,再根据以下步骤进行诊断。

故障现象

诊断方法

诊断结论

服务器挂起或重启

系统挂起堆栈信息有对应挂起进程名称或者板卡厂家名称。(例如“FC_XX”是FC的挂起等。)

OS自带驱动兼容性问题

排查是否是PCIe板卡兼容性问题:

l  板卡供电问题

l  PCIe协议不支持

l  驱动问题

PCIe板卡兼容性问题

通过iBMC查找硬件报错位置,例如内存位置,硬盘位置和主板部件。

硬件电路部件故障问题

OS日志出现文件系统只读挂起,引导自检系统对硬盘打分,依据结果判断是否需要更换硬盘。

硬盘故障问题

Machine Check Exception问题。通过查看“/var/log/mce.log”和串口挂起堆栈信息错误码,找到对应故障点。

l  硬件故障问题

l  软硬件接口设置问题

请先在现场收集以下信息:

l  如果是新交付的服务器,确认出现问题的服务器比例,检查异常服务器和正常服务器的配置是否一致。

l  如果是已经上线一段时间的服务器,确认出现问题的服务器数量,查看问题出现是否具有规律性。

l  检查iBMC是否存在硬件告警。

通过前述信息咨询,再次确认是单机问题还是硬件问题。

依据报告结果确认硬件故障点

近期软件升级(包括客户业务软件、数据库、中间软件、内核、主机软件BIOS、iBMC和存储软件变更等)开始出现规律性宕机。

l  新版本软件bug问题

l  裁剪原有接口,导致异常

“update_cpu_power”或“divide_error”、“timer_xx”出现在挂起最后一屏堆栈信息中。(周期性)

OS自身bug,内核设计缺陷问题。

“gethostbyname”出现在挂起最后一屏堆栈信息中。(无周期性)


6 升级

关于升级,具体请参见《H3C UniServer R4960 G3 服务器 升级指导书》。


7 巡检指导

关于本章

通过日常维护巡检,您能够检测出服务器设备的故障并及时诊断处理。

服务器巡检操作前应征得客户同意。

 

整个操作过程请做好静电防护和机器保护工作。

7.1  机房环境及线缆布局巡检

7.2  服务器巡检

7.3  服务器巡检报告

7.1 机房环境及线缆布局巡检

7.1.1 巡检注意事项

巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号。下列符号可能显示在服务器的一些部件上面。

表7-1 安全信息符号

图标

说明

提示危险用电器件。请注意防止电击危险。请勿打开此器件。

警告:所有带有此标识的器件都存在电击危险,被标识区域没有可维护的器件!

提示危险器件。该器件可能造成电击危险。被标识区域没有可维护器件,请勿打开此器件。

警告:请注意防止电击危险,请勿打开此器件!

提示高温表面。

警告:小心烫伤,请等器件降温后再接触!

提示危险用电器件。该标识表示误操作可能会导致设备损坏或人身伤害。

该标识是设备外部的接地标识。接地电缆的两端分别接在不同设备上,表示设备必须通过接地点接地,保证设备正常运行及操作人员的人身安全。

该标识是设备内部的接地标识。接地电缆的两端都接在同一个设备上的不同组件上,表示设备必须通过接地点接地,保证设备正常运行及操作人员的人身安全。

该标识表示为静电敏感区,请勿徒手触摸设备。在该区域操作时,请采取严格的防静电措施,例如佩戴防静电腕带或者防静电手套。

 

7.1.2 机房环境巡检

机房环境主要包括机房内部的空调和供电设备等。

详细检查项请参见7.3 服务器巡检报告。

7.1.3 线缆布局巡检

对线缆的巡检,建议肉眼查看即可。如果需要重新拔插,必须征得客户的同意。

巡检线缆布局前为防止损坏线缆,需注意以下事项:

l   检查电源线。

          确保三线制电源接地线的接头表面良好。

          确保电源线的类型正确。

          确保电源线表面绝缘部分没有任何破损。

l   保证线缆远离热源,线缆避免紧绷,保持适度松弛。

l   插拔线缆时,不要用力过大。

l   尽可能通过连接端口插拔线缆。

l   任何情况下,禁止扭曲或者拉扯线缆。

l   合理布线,保证需要拆卸或者更换的部件不会接触线缆,确保所有电源线正确连接。

详细检查项请参见7.3 服务器巡检报告。

7.2 服务器巡检

7.2.1 巡检注意事项

l   服务器巡检,需要征得客户同意并且对机器只能做查看操作。未经客户书面授权同意,严禁对服务器做任何修改配置、上下电操作。

l   服务器巡检前,需要提前获取巡检机器的iBMC和root账户密码。巡检完成后,需要通知客户及时更新root账户密码。

7.2.2 指示灯巡检

H3C UniServer R4960 G3 服务器前后面板分别提供UID按钮/指示灯、健康状态指示灯、网口指示灯、电源状态指示灯等。通过观察指示灯状态可以初步诊断当前服务器的状态。具体指示灯状态及处理方法请参见5.4 根据指示灯定位故障 。

指示灯检查项:

l   健康状态指示灯

l   电源按钮/指示灯

l   硬盘指示灯

l   电源指示灯

l   网口/光口状态指示灯

7.2.3 通过iBMC检查系统状态

前提条件

能正常登录iBMC Web界面。

操作步骤

                           步骤 1     登录iBMC Web界面,详细操作请参见8.3 登录iBMC Web界面。

                           步骤 2     查看系统告警与事件信息。

1.       在iBMC Web界面上方,单击“告警与事件”。

2.       在界面左侧导航栏中,单击“当前告警”,查看系统当前存在的告警信息。

3.       在界面左侧导航栏中,单击“系统事件”,查看系统的事件信息。

                           步骤 3     查看系统硬盘、内存和传感器等硬件状态信息。

1.       在iBMC Web界面上方,单击“信息”。

2.       在界面左侧导航栏中,单击“系统信息”。然后在右侧界面单击“存储”页签,查看系统硬盘等硬件状态信息。

3.       在界面左侧导航栏中,单击“实时监控”,查看系统CPU利用率、内存占用率和进风口温度信息。

4.       在界面左侧导航栏中,单击“传感器”,查看传感器的状态信息。

----结束

7.3 服务器巡检报告

巡检信息

客户信息

客户名称

 

机房地址

 

机房名称

 

机房主管

 

电话

 

 

巡检方信息

巡检时间

 

巡检人

 

电话

 

H3C接口人

 

电话

 

 

服务热线

请联系技术支持。

机房环境巡检

机房环境巡检结果

序号

技术指标项

说明(仅供参考,实际按具体产品型号用户指南为准)

结果

1

工作温度

10℃ ~ 35℃(50℉ ~ 95℉)

□正常

□不正常

简述

2

存储温度

-40℃ ~ +65℃(-40℉ ~ 149℉)

□正常

□不正常

简述

3

温度变化率

20℃/h(36℉/h)

□正常

□不正常

简述

4

工作湿度

8% RH ~ 90% RH(无冷凝)

□正常

□不正常

简述

5

存储湿度

5% RH ~ 95% RH(无冷凝)

□正常

□不正常

简述

6

工作海拔高度

≤3050m

□正常

□不正常

简述

7

电源

l  交流供电:输入电压范围100V AC ~ 240V AC,50/60Hz

l  直流供电:

      标称-48VDC,电压波动范围-38.4V ~ -57.6V DC

      标称240VDC,电压波动范围192V ~ 288V DC

      标称380VDC,电压波动范围260V ~ 400V DC

□正常

□不正常

简述

 

线缆布局巡检

线缆布局巡检

序号

检查项

检查内容

结果

1

线缆总布放

强电、弱电线应该分别从机柜两边走线,即业务、电源线分离。

□正常

□不正常

简述

2

电源线布放

l  整齐、美观、有序。

l  尽量与机房内其余机柜布线风格保持一致。

l  电源线禁止挽圈。

□正常

□不正常

简述

3

业务线布放

l  整齐、美观、有序。

l  尽量与机房内其余机柜布线风格保持一致。

□正常

□不正常

简述

4

光纤布放

光纤是否有被小角度弯曲或强行拉伸。

□正常

□不正常

简述

5

地线连接

服务器设备是否已按规定接地并连接牢固。

□正常

□不正常

简述

6

线缆标签标注、粘贴

标签字体清晰,标注明确且含义准确,粘贴牢固。

□正常

□不正常

简述

7

电源线检查

电源线是否牢固插入电源插座。

□正常

□不正常

简述

8

信号线插头检查

检查服务器、交换机等设备之间的信号、数据线连接是否牢固。

□正常

□不正常

简述

 

服务器健康信息巡检

服务器巡检

序号

检查项

检查内容

结果

1

iBMC信息

服务器的健康状态日志信息没有任何告警。

□正常

□不正常

简述

 

巡检总结及建议

尊敬的客户:

您好!巡检主要目的是对您所购买的H3C UniServer R4960 G3 服务器进行全面检查,及早发现潜在问题,提交详细检查报告及问题的针对性建议,提高业务的可用性。H3C的工程师有责任将检查的结果向您汇报。如果您已了解此次巡检服务的内容,请针对本次巡检的结果提出意见和建议并签字确认。

本次巡检总结及意见

 

巡检工程师

 

电话

 

日期

 

 

客户对巡检意见及建议

 

客户

 

电话

 

日期

 


8 常用操作

8.1  获取产品序列号

8.2  通过iBMC一键收集信息

8.3  登录iBMC Web界面

8.4  使用PuTTY登录服务器(网口方式)

8.5  使用PuTTY登录服务器(串口方式)

8.6  使用WinSCP传输文件

8.1 获取产品序列号

您可以通过iBMC WebUI界面获取产品序列号:

1.       登录iBMC Web界面,详细操作请参见8.3 登录iBMC Web界面。

2.       选择“信息 > 信息概况”,查看产品序列号,如图8-1所示。

图8-1 产品序列号

 

8.2 通过iBMC一键收集信息

操作步骤

                           步骤 1     登录iBMC Web界面,详细操作请参见8.3 登录iBMC Web界面。

                           步骤 2     依次选择“信息 > 信息概况 > 常用操作快捷入口 > 一键收集信息”,如图8-2所示。

图8-2 一键式信息收集

 

                           步骤 3     单击“一键收集信息”。

界面提示正在收集信息,收集完成后显示收集文件“dump_info.tar.gz”。

                           步骤 4     单击收集文件,根据界面提示将其下载至本地PC机。

----结束

8.3 登录iBMC Web界面

操作场景

指导您通过本地PC上的浏览器登录iBMC Web界面。下面以Windows 7操作系统的PC以及IE 8.0浏览器为例进行操作步骤描述。

必备事项

前提条件

使用远程控制功能的本地PC需具备相应版本的浏览器和Java运行环境。本地PC的系统配置要求请参见对应的iBMC用户指南。

本地PC需满足的物理组网条件有:

l   网络连接本地PC与iBMC管理网口。

l   要求本地PC与iBMC管理网口的IP在同一网段。

数据

执行该操作需准备的数据如表8-1所示。

表8-1 准备的数据

类别

参数

说明

示例

用户登录信息

用户名

登录iBMC的用户。

admin

密码

登录用户的密码。

说明

H3C UniServer R4960 G3 服务器iBMC系统的默认用户为“admin”,默认密码为“Password@_”。

Password@_

 

操作步骤

                           步骤 1     使用网线(交叉网线或双绞线)连接本地PC和服务器的iBMC管理网口。

连接组网图如图8-3所示。

图8-3 组网图

 

                           步骤 2     在本地PC中打开IE浏览器。

                           步骤 3     在地址栏中,输入iBMC系统的地址,地址格式为“https://服务器iBMC管理网口的IP地址”,例如“https://192.168.1.2”。

按“Enter”键,IE浏览器中显示iBMC的登录界面,如图8-4所示。

l  如果IE浏览器显示“此网站的安全证书有问题”,请单击“继续浏览此网站(不推荐)”。

l  如果弹出“安全警报”对话框提示证书有问题,请单击“是”。

图8-4 登录iBMC系统

 

                           步骤 4     在iBMC登录界面中,输入登录iBMC系统的用户名和密码。

如果登录时连续五次输入错误的密码,系统将锁定此用户。此时请等待5分钟后重新登录。

                           步骤 5     在“域名”下拉列表框中,选择“这台iBMC”。

                           步骤 6     单击“登录”。

进入“信息概况”界面。界面右上角将显示登录的用户名。

----结束

8.4 使用PuTTY登录服务器(网口方式)

操作场景

使用PuTTY工具,可以通过局域网远程访问服务器,对服务器实施配置、维护操作。

必备事项

前提条件

已通过网线连接PC与服务器的管理网口。

数据

需准备如下数据:

l   待连接服务器的IP地址

l   登录待连接服务器的用户名和密码

软件

PuTTY.exe:此工具为第三方软件。

操作步骤

                           步骤 1     设置PC机的IP地址、子网掩码或者路由,使PC机能和服务器网络互通。

可在PC机的cmd命令窗口,通过Ping 服务器IP地址命令,检查网络是否互通。

                           步骤 2     双击“PuTTY.exe”。

弹出“PuTTY Configuration”窗口,如图8-5所示。

图8-5 PuTTY Configuration

 

                           步骤 3     填写登录参数。

参数说明如下:

l   Host Name(or IP address):输入要登录服务器的IP地址,如“191.100.34.32”。

l   Port:默认设置为“22”。

l   Connection type:默认选择“SSH”。

l   Close window on exit:默认选择“Only on clean exit”。

配置“Host Name”后,再配置“Saved Sessions”并单击“Save”保存,则后续使用时直接双击“Saved Sessions”下保存的记录即可登录服务器。

                           步骤 4     (可选)通过PuTTY登录以太网交换平面后,若在命令行中输入的字符无法通过退格键(Backspace)删除,请在左侧导航树中选择“Teminal > Keyboard”,设置参数“The Backspace key”为“Control-H”,其他参数保持默认值,如图8-6所示。

图8-6 PuTTY Configuration

 

                           步骤 5     单击“Open”。

进入“PuTTY”运行界面,提示“login as:”,等待用户输入用户名。

l  如果首次登录该目标服务器,则会弹出“PuTTY Security Alert”窗口。单击“是”表示信任此站点,进入“PuTTY”运行界面。

l  登录服务器时,如果帐号输入错误,必须重新连接PuTTY。

                           步骤 6     按提示分别输入用户名和密码。

登录完成后,命令提示符左侧显示出当前登录服务器的主机名。

----结束

8.5 使用PuTTY登录服务器(串口方式)

服务器默认串口为操作系统串口,如需调整串口方向,请参见对应版本的iBMC用户指南“查询和设置串口方向(serialdir)”章节。

操作场景

使用PuTTY工具,可以通过串口方式访问服务器,主要应用场景如下:

l   新建局点首次配置服务器时,本地PC机可以通过连接服务器的串口,登录服务器进行初始配置。

l   产品网络故障,远程连接服务器失败时,可通过连接服务器的串口,登录服务器进行故障定位。

必备事项

前提条件

l   已通过串口线缆连接PC与服务器。

l   已经安装PuTTY,且PuTTY的版本为0.60及以上。

数据

登录待连接服务器的用户名和密码。

软件

PuTTY.exe:此工具为第三方软件。要求Putty能支持串口登录,版本需为0.60及以上。

操作步骤

                           步骤 1     双击“PuTTY.exe”。

弹出“PuTTY Configuration”窗口。

                           步骤 2     在左侧导航树中选择“Connection > Serial”。

                           步骤 3     设置登录参数。

参数举例如下:

l   Serial Line to connect to:COMn

l   Speed(baud):115200

l   Data bits:8

l   Stop bits:1

l   Parity:None

l   Flow control:None

n表示不同串口的编号,取值为整数。

                           步骤 4     在左侧导航树中选择“Session”。

                           步骤 5     选择“Connection type”为“Serial”,如图8-7所示。

图8-7 PuTTY Configuration

 

                           步骤 6     单击“Open”。

进入“PuTTY”运行界面,提示“login as:”,等待用户输入用户名。

                           步骤 7     按提示分别输入用户名和密码。

登录完成后,命令提示符左侧显示出当前登录服务器的主机名。

----结束

8.6 使用WinSCP传输文件

操作场景

在PC机上使用WinSCP工具进行文件传输。

必备事项

前提条件

目的设备已开启SFTP服务。

数据

需准备如下数据:

l   待连接服务器的IP地址

l   登录待连接服务器的用户名和密码

软件

WinSCP.exe:此工具为第三方免费软件。

操作步骤

                           步骤 1     打开“WinSCP”文件夹,双击“WinSCP.exe”。

弹出“WinSCP 登录”对话框,如图8-8所示。

若系统非中文操作系统,可以单击“Languages”进行界面语言的选择。

图8-8 WinSCP登录

 

                           步骤 2     设置登录参数。

参数说明如下。

l   主机名(H):输入待连接设备的IP地址。例如:“191.100.34.32”

l   端口号(R):默认为“22”

l   用户名(U):输入用户名。例如:admin123

l   密码(P):输入密码。例如:admin123

l   密钥文件(K):默认为空,保留默认值

l   协议:选择默认文件协议“SFTP”,并勾选“允许SCP反馈(F)”

                           步骤 3     单击“登录”。

进入“WinSCP”文件传输界面。

l  如果首次登录时没有选择密钥文件,此时会弹出一个警告提示框,询问“是否连接并添加密钥到缓存?”,单击“是(Y)”,进入“WinSCP”文件传输界面。

l  以Windows 7为例,界面左侧区域默认打开本地计算机的“C:\Users\Administrator\Documents”目录,右侧区域默认打开设备的“/root”目录。

                           步骤 4     根据实际需求,在界面左右区的指定目录中进行文件夹的创建、删除和复制等操作。

图8-9 WinSCP界面

 

----结束


9 更多资源

9.1  技术支持

9.2  产品信息资源

9.1 技术支持

技术支持网址

查阅技术支持网站上的技术资料:http://www.h3c.com

获取技术支持

如果在设备维护或故障处理过程中,遇到难以确定或难以解决的问题,通过文档的指导仍然不能解决,请通过如下方式获取技术支持:

l   联系新华三技术有限公司客户服务中心。

客户服务电话:400-810-0504

客户服务邮箱:[email protected]

l   联系新华三技术有限公司驻当地办事处的技术支持人员。

9.2 产品信息资源

服务器的用户指南或维护与服务指南,介绍服务器产品的结构、规格和安装。具体请参考《H3C UniServer R4960 G3 服务器 用户指南》和《H3C UniServer R4960 G3 服务器 维护与服务指南》。

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们