• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 关于我们

H3C UIS B780 G3刀片服务器 用户指南-6W102

01-正文

本章节下载  (3.60 MB)

01-正文

目 

1 安全

1.1 安全信息

1.1.1 运行安全

1.1.2 电气安全

1.1.3 电池安全

1.2 静电防护

1.2.1 防止静电释放

1.2.2 防止静电释放的接地方法

2 认识刀片服务器

2.1 简介

2.2 规格参数

2.2.1 产品规格

2.2.2 技术参数

2.3 部件

2.4 前面板

2.4.1 前面板组件

2.4.2 指示灯和按钮

2.4.3 SUV电缆

2.4.4 抽拉式标签

2.5 主板

2.5.1 主板布局

2.5.2 系统维护开关

2.5.3 内存插槽

2.5.4 PCIe连接器

2.6 硬盘和SATA M.2 SSD模块

2.6.1 硬盘

2.6.2 SATA M.2 SSD模块

2.7 内部组网

2.8 部件安装准则

2.8.1 SAS/SATA硬盘

2.8.2 NVMe硬盘

2.8.3 NVMe VROC模块

2.8.4 Riser卡与PCIe卡

2.8.5 存储控制卡及其掉电保护模块

2.8.6 GPU卡

2.8.7 网卡

2.8.8 SATA M.2 SSD卡

2.8.9 SATA M.2 SSD模块

2.8.10 SATA M.2 SSD适配盒

2.8.11 内存

2.8.12 CPU

2.9 存放要求

3 安装和拆卸刀片服务器

3.1.1 准备工作

3.1.2 安装刀片服务器

3.1.3 拆卸刀片服务器

4 上电和下电

4.1 上电

4.1.1 支持的上电方式

4.1.2 前提条件

4.1.3 操作方法

4.2 下电

4.2.1 支持的下电方式

4.2.2 前提条件

4.2.3 操作方法

5 配置刀片服务器

5.1 配置流程

5.2 缺省参数

5.3 将刀片服务器接入网络

5.3.1 通过管理模块接入网络

5.3.2 通过互联模块接入网络

5.4 查看刀片服务器状态

5.5 修改OM缺省信息

5.5.1 修改OM缺省用户密码

5.5.2 修改OM缺省IP地址

5.6 修改HDM缺省信息

5.6.1 修改HDM缺省用户密码

5.6.2 修改HDM缺省IP地址

5.7 登录刀片服务器

5.8 设置BIOS

5.8.1 设置服务器启动顺序

5.8.2 设置BIOS密码

5.9 配置RAID

5.10 安装操作系统和驱动程序

5.10.1 安装驱动程序

6 更换部件

6.1 可更换的部件及其视频

6.2 更换SAS/SATA硬盘

6.2.1 操作场景

6.2.2 准备工作

6.2.3 更换SAS/SATA硬盘

6.3 更换NVMe硬盘

6.3.1 操作场景

6.3.2 准备工作

6.3.3 拆卸NVMe硬盘

6.3.4 安装NVMe硬盘

6.3.5 确认工作

6.4 更换Riser卡和PCIe卡

6.4.1 操作场景

6.4.2 准备工作

6.4.3 拆卸Riser卡和PCIe卡

6.4.4 安装Riser卡和PCIe卡

6.5 更换前置Mezz存储控制卡及其掉电保护模块

6.5.1 操作场景

6.5.2 准备工作

6.5.3 拆卸前置Mezz存储控制卡及其掉电保护模块

6.5.4 安装前置Mezz存储控制卡

6.6 更换后置Mezz RAID卡

6.6.1 操作场景

6.6.2 准备工作

6.6.3 拆卸后置Mezz RAID卡

6.6.4 安装后置Mezz RAID卡

6.7 更换直通卡

6.7.1 操作场景

6.7.2 准备工作

6.7.3 拆卸直通卡

6.7.4 安装直通卡

6.8 更换GPU卡

6.8.1 操作场景

6.8.2 准备工作

6.8.3 拆卸GPU卡

6.9 更换网卡

6.9.1 操作场景

6.9.2 准备工作

6.9.3 更换Mezz网卡

6.10 更换SATA M.2 SSD卡

6.10.1 操作场景

6.10.2 准备工作

6.10.3 拆卸SATA M.2 SSD卡

6.10.4 安装SATA M.2 SSD卡

6.11 更换SATA M.2 SSD模块

6.11.1 操作场景

6.11.2 准备工作

6.11.3 拆卸SATA M.2 SSD模块

6.11.4 安装SATA M.2 SSD模块

6.12 更换SATA M.2 SSD适配盒

6.12.1 操作场景

6.12.2 准备工作

6.12.3 拆卸SATA M.2 SSD适配盒

6.12.4 安装SATA M.2 SSD适配盒

6.13 更换Micro SD卡

6.13.1 操作场景

6.13.2 准备工作

6.13.3 拆卸Micro SD卡

6.13.4 安装Micro SD卡

6.14 更换NVMe VROC模块

6.14.1 操作场景

6.14.2 准备工作

6.14.3 拆卸NVMe VROC模块

6.14.4 安装NVMe VROC模块

6.15 更换内存

6.15.1 操作场景

6.15.2 准备工作

6.15.3 拆卸内存

6.15.4 安装内存

6.16 更换CPU

6.16.1 操作场景

6.16.2 准备工作

6.16.3 拆卸CPU

6.16.4 安装CPU

6.17 安装CPU选件

6.17.1 操作场景

6.17.2 准备工作

6.17.3 安装CPU选件

6.18 更换系统电池

6.18.1 操作场景

6.18.2 准备工作

6.18.3 拆卸系统电池

6.18.4 安装系统电池

6.19 更换主板

6.19.1 操作场景

6.19.2 准备工作

6.19.3 更换主板

6.19.4 安装主板

6.20 更换硬盘背板

6.20.1 操作场景

6.20.2 准备工作

6.20.3 拆卸硬盘背板

6.20.4 安装硬盘背板

6.21 安装TPM/TCM模块

6.21.1 操作场景

6.21.2 准备工作

6.21.3 安装TPM/TCM模块

7 常用操作

7.1 登录刀片服务器操作系统

7.1.1 本地登录

7.1.2 远程登录

7.2 登录刀片服务器HDM

8 日常维护指导

8.1 维护基本原则

8.2 维护工具

8.3 维护操作

8.3.1 任务列表

8.3.2 查看服务器监控指示灯

8.3.3 监测机房温度和湿度

8.3.4 查看服务器状态

8.3.5 收集服务器日志

8.3.6 升级服务器固件

 


1 安全

1.1  安全信息

为了避免操作过程中对人和设备造成伤害,请在操作前,仔细阅读产品相关安全信息。实际操作中,包括但不限于本文描述的安全信息。

1.1.1  运行安全

·     H3C授权人员或专业的工程师才能运行该设备。

·     请将设备放在干净、平稳的工作台或地面上进行维护。

·     运行服务器前,请确保所有线缆均连接正确。

·     为确保服务器充分散热,请遵循如下操作准则:

¡     请勿阻塞服务器的通风孔。

¡     服务器的空闲槽位必须安装假面板,比如硬盘、风扇、PCIe卡、电源模块的槽位。

¡     机箱盖、导风罩、空闲槽位假面板不在位的情况下,请不要运行服务器。

¡     维护热插拔部件时,请最大限度地减少机箱盖打开的时间。

·     请保持设备清洁、无尘,请勿将设备放置在潮湿的地方,也不要让液体进入设备。

·     搬运或放置设备时,请勿用力过猛,请确保搬运设备过程中,用力均匀、缓慢。

·     为避免组件表面过热造成人身伤害,请确保设备和内部系统组件冷却后再操作。

1.1.2  电气安全

·     请仔细检查工作区域内是否存在潜在的危险,如:机箱未接地或接地不可靠、地面潮湿等。

·     需要对设备进行断电操作时,请先仔细检查,确认电源已关闭。

·     为减少触电风险,在安装或拆卸任何非热插拔部件时,请先将设备下电。

1.1.3  电池安全

主板上配置有系统电池,一般情况下,电池寿命为3~5年。

当设备BIOS下不再自动显示正确的日期和时间时,需更换电池。更换电池时,请注意以下安全措施:

·     请勿尝试给电池充电。

·     请勿将电池置于60°C以上的环境中。

·     请勿拆卸、碾压、刺穿电池、使电池外部触点短路,或将其投入火中或水中。

·     请将电池弃于专门的电池处理点,勿随垃圾一起丢弃。

1.2  静电防护

1.2.1  防止静电释放

人体或其它导体释放的静电可能会损坏主板和对静电敏感的部件,由静电造成的损坏会缩短主板和部件的使用寿命。

为避免静电损害,请注意以下事项:

·     在运输和存储设备时,请将部件装入防静电包装中。

·     将静电敏感部件送达不受静电影响的工作区前,请将它们放在各自的防静电包装中保管。

·     先将部件放置在防静电工作台上,然后再将其从防静电包装中取出。

·     在没有防静电措施的情况下,请勿触摸组件上的插针、线缆和电路元器件。

·     在触摸静电敏感元件或装置时,一定要采取防静电措施。

1.2.2  防止静电释放的接地方法

在取放或安装部件时,用户可采取以下一种或多种接地方法以防止静电释放。

·     佩戴防静电腕带,并将腕带的另一端良好接地。请将腕带紧贴皮肤,且确保其能够灵活伸缩。

·     在工作区内,请穿上防静电服和防静电鞋。

·     请使用导电的现场维修工具。

·     使用防静电的可折叠工具垫和便携式现场维修工具包。


2 认识刀片服务器

说明

图片仅供参考,具体请以实物为准。

 

2.1  简介

H3C UIS B780 G3刀片服务器(以下简称刀片服务器)是一款公司自主研发、最多支持4路Intel Purley CPU或澜起Jintide C系列CPU的4路刀片刀片服务器,具有强大的计算能力和灵活的扩展能力。该刀片服务器安装在H3C UIS 9000一体机(以下简称机箱)内,通过OM模块进行集中管理。

刀片服务器的外观如图2-1所示。

图2-1 刀片服务器外观

 

2.2  规格参数

介绍刀片服务器的规格参数。

2.2.1  产品规格

说明

产品规格的计算,以产品支持的所有部件为基准。比如最大内存容量,是以所有内存中容量最大的为准进行计算的。对于定制化产品,请用户以产品实际情况为准。

 

表2-1 刀片服务器规格参数

功能特性

说明

处理器

最多支持4Intel Purley CPU或澜起Jintide C系列CPU

·     单颗CPU最大支持功耗205W

·     最高主频支持3.6GHz

·     单颗CPU缓存最高支持38.5MB

内存

最多可支持48根内存条

存储控制卡

·     RSTe板载软RAID

·     高性能存储控制卡

·     NVMe VROC模块

芯片组

Intel C621 Lewisburg芯片组

网络接口

板载2个1Gb/s 以太网接口,与机箱背板连接,用于和主用和备用OM模块互联

I/O端口

·     最多支持4个USB接口:

¡     2USB 3.0接口(前面板1个,主板内1个)

¡     2USB 2.0接口(需要通过前面板上的SUV连接器扩展)

·     1VGA接口(需要通过前面板上的SUV连接器扩展)

·     1个串口(需要通过前面板上的SUV连接器扩展)

·     2SATA M.2 SSD卡连接器

·     2个Micro SD卡连接器(主板上,2Micro SD卡通过主板上的存储控制芯片配置RAID 1,该RAID级别不支持用户修改)

PCIe连接器

最多支持9PCIe 3.0连接器(1个存储控制卡连接器、2个标准连接器、6Mezz卡连接器)

 

2.2.2  技术参数

表2-2 技术参数

类别

项目

说明

物理参数

尺寸

·     高xx深:59.5mm x 436mm x 613.4mm

·     高x宽:半高全宽

·     满框最大配置数量:8

最大重量

16.5kg

功耗

最大功率

1243W

环境参数

温度

工作环境温度:5°C45°C

说明

某些配置下,服务器支持的最高工作环境温度会降低,具体请参见附录中的“工作环境温度规格”章节。

贮存环境温度:-40°C~70°C

湿度

·     工作环境湿度:8%90%(无冷凝)

·     贮存环境湿度:5%95%(无冷凝)

海拔高度

·     工作环境高度:-60m5000m,海拔高于900m时,每升高100m,规格最高温度降低0.33°C3000m以上不支持配置HDD硬盘)

·     贮存环境高度:-60m~5000m

 

2.3  部件

介绍刀片服务器各部件含义。

图2-2 刀片服务器部件

 

 

表2-3 刀片服务器部件说明

编号

名称

说明

1

刀片服务器机箱

用于将刀片服务器各部件及元器件集中在一起

2

机箱盖

-

3

主板

刀片服务器最重要的部件之一,用于安装CPU、内存和PCIe卡等,集成了刀片服务器的基础元器件,包括BIOS芯片、HDM芯片和PCIe连接器等

4

Mezz卡

安装在Mezz连接器上的卡的统称。Mezz卡通过PCIe协议与CPU通信。Mezz卡中有一种是Mezz网卡,用于与机箱后部的互联模块相连,从而实现刀片服务器和客户端的交互

5

存储控制卡

为SAS/SATA硬盘提供RAID支持,具有RAID扩容、RAID配置记忆等功能,支持在线升级、远程设置

6

硬盘背板

为硬盘供电并提供数据传输通道

7

PCIe Riser卡

转接卡,标准PCIe卡通过Riser卡安装到刀片服务器

8

直通卡

用于连接板载软RAID和SATA硬盘

9

SATA M.2 SSD卡

为刀片服务器提供数据存储介质

10

TPM/TCM模块

一种加密模块,为刀片服务器提供加密服务

11

CPU

集成内存控制器和PCIe控制器,为刀片服务器提供强大的数据处理功能

12

CPU夹持片

用于将CPU固定到散热器

13

CPU散热器

用于为CPU散热

14

CPU支架

为CPU底座针脚提供保护并为CPU提供散热风道

15

超级电容

用于在系统意外掉电时为存储控制卡上集成或安装的Flash卡供电,实现存储控制卡上数据的掉电保护

16

NVMe VROC模块

NVMe VROC模块用于激活NVMe硬盘阵列特性,配合VMD技术实现NVMe硬盘阵列功能

17

Micro SD卡

为服务器提供数据存储介质

18

系统电池

为系统时钟供电,确保系统日期和时间正确

19

内存

用于暂时存放CPU中的运算数据,以及与硬盘等外部存储设备交换的数据。

20

SATA M.2 SSD适配盒

用于扩展2块SATA M.2 SSD模块,支持热插拔

21

SATA M.2 SSD模块

与SATA M.2 SSD卡的功能相同,为刀片服务器提供数据存储介质,支持热插拔

22

硬盘

为刀片服务器提供数据存储介质,支持热插拔

23

硬盘笼

用于扩展硬盘

24

导风罩

为刀片服务器内部提供散热风道

25

Riser卡假面板

主板上未安装Riser卡时,请安装该假面板,以确保刀片服务器正常散热

 

2.4  前面板

介绍前面板上的组件、指示灯含义和接口用途。

2.4.1  前面板组件

图2-3 前面板组件

 

表2-4 前面板组件说明

编号

含义

1

可选PCIe卡(从属CPU 2

2

可选普通硬盘或NVMe硬盘

3

可选PCIe卡(从属CPU 3

4

可选普通硬盘或NVMe硬盘

5

抽拉式标签

6

可选普通硬盘或SATA M.2 SSD模块(通过适配盒)

7

扳手

8

扳手解锁按钮

9

USB 3.0接口

10

SUV连接器

·     普通硬盘:指SAS/SATA HDD/SSD硬盘

·     USB 3.0接口可用于连接U盘、USB键盘或鼠标、USB光驱(用于安装操作系统)

 

2.4.2  指示灯和按钮

图2-4 前面板指示灯和按钮

 

编号

说明

状态

1

UID按钮/指示灯

·     蓝灯常亮:UID指示灯被激活。UID指示灯可通过以下任意方法被激活

¡     UID按钮被按下

¡     通过HDM或OM开启UID指示灯

·     蓝灯闪烁:

¡     1Hz:系统正在被HDM远程管理或正在通过HDM带外方式升级固件,请勿下电

¡     4Hz:HDM正在重启(长按UID按钮/指示灯10秒可重启HDM)

·     灯灭:UID指示灯未被激活

2

Health指示灯

·     绿灯常亮:系统状态正常

·     绿灯闪烁(4Hz):HDM正在初始化

·     橙灯闪烁(0.5Hz):系统出现预告警

·     橙灯闪烁(1Hz):系统出现一般性告警

·     红灯闪烁(1Hz):系统出现严重错误告警

3

板载千兆网卡指示灯

·     绿灯常亮:网口链路已经连通

·     绿灯闪烁(1Hz):网口正在接收或发送数据

·     灯灭:网口链路没有连通

4

开机/待机按钮和系统电源指示灯

·     绿灯常亮:系统已启动

·     绿灯闪烁(1Hz):系统正在开机

·     橙灯常亮:系统处于待机状态

·     灯灭:未通电

·     如果Health指示灯显示系统出现问题,请通过HDM查看系统运行状态

·     系统电源指示灯灭的原因可能有:没有接通电源、电源模块故障或机箱未上电

 

2.4.3  SUV电缆

SUV电缆连接到刀片服务器前面板的SUV连接器上。通过SUV电缆,可为刀片服务器扩展出2个USB 2.0接口、1个串口和1个VGA接口。

图2-5 SUV电缆

 

表2-5 SUV电缆说明

编号

含义

用途

1

串口

用于故障诊断和设备调试使用

2

VGA接口

用途用于连接显示终端,如显示器或KVM设备

3

USB 2.0接口(2个)

USB 2.0接口和刀片服务器缺省配置的USB 3.0接口均用于连接USB设备,以下情况下需要使用上述连接器:

·     连接U盘

·     连接USB键盘或鼠标

·     安装操作系统时,连接USB光驱

 

2.4.4  抽拉式标签

抽拉式标签位于刀片服务器前面板,即图2-3的编号5位置。抽拉式标签提供以下刀片服务器信息:

·     用户资料:通过扫描标签上的产品资料二维码,会链接到产品文档中心,用户通过文档中心可以查看该刀片服务器的用户资料。

·     HDM缺省信息。

·     产品序列号。

·     产品型号。

2.5  主板

介绍刀片服务器主板布局和主板上的组件含义。

2.5.1  主板布局

图2-6 主板布局

 

 

表2-6 主板布局说明

编号

含义

1

存储控制卡连接器

2

PCIe Riser卡连接器1(从属CPU 2)

3

系统维护开关3

4

NVMe VROC模块连接器

5

Mezz卡连接器6(从属CPU 1,对应ICM 3/6)

6

Mezz卡连接器5(从属CPU 2,对应ICM 2/5)

7

Micro SD卡连接器2

8

Micro SD卡连接器1

9

Mezz卡托架2

10

Mezz卡连接器4(从属CPU 1,对应ICM 1/4)

11

背板连接器2

12

Mezz卡连接器3(从属CPU 4,对应ICM 3/6)

13

Mezz卡连接器2(从属CPU 3,对应ICM 2/5)

14

Mezz卡托架1

15

Mezz卡连接器1(从属CPU 4,对应ICM 1/4)

16

背板连接器1

17

硬盘背板连接器2

18

SATA M.2 SSD卡连接器1

19

SATA M.2 SSD卡连接器2

20

PCIe Riser卡连接器2(从属CPU 3)

21

系统维护开关2

22

USB 3.0接口

23

系统电池

24

TPM/TCM连接器

25

系统维护开关1

26

硬盘背板连接器1

 

2.5.2  系统维护开关

通过系统维护开关,可解决以下问题,具体请参见表2-7系统维护开关的具体位置请参见2.5.1  主板布局

·     忘记HDM登录用户名或密码,无法登录HDM。

·     忘记BIOS密码,无法进入BIOS。

·     需要恢复BIOS缺省设置。

表2-7 系统维护开关含义

系统维护开关

名称

含义

注意事项

系统维护开关1

·     1234567:预留

·     8:

¡     OFF(缺省) = 登录HDM时,输入用户名和密码

¡     ON = 登录HDM时,输入缺省用户名和缺省密码

位置8为ON时,可永久通过缺省用户名和缺省密码登录HDM。建议完成操作后,重新将位置8调整为OFF

系统维护开关2

·     跳针1、2短接(缺省) = 正常启动刀片服务器

·     跳针2、3短接 = 恢复BIOS缺省设置

跳针2、3短接30秒以上,BIOS即可恢复缺省设置。此时请重新将跳针1、2短接,正常启动刀片服务器

系统维护开关3

·     跳针1、2短接(缺省) = 正常启动刀片服务器

·     跳针2、3短接 = 启动刀片服务器时清除BIOS的所有密码

跳针2、3短接后,刀片服务器开机过程中BIOS密码被清除。此时请根据BIOS界面提示,关机并重新将跳针1、2短接后,再开机,即可无BIOS密码启动刀片服务器

 

2.5.3  内存插槽

内存插槽布局如图2-7所示,A1、A2…A12,B1、B2…B12,C1、C2…C12,D1、D2…D12表示内存插槽号。内存的具体安装准则请参见2.8.11  内存

图2-7 内存插槽编号

 

 

2.5.4  PCIe连接器

刀片服务器支持的所有PCIe设备、以及这些PCIe设备从属的CPU、遵守的PCIe标准、对应PCIe连接器的物理和总线带宽、PCIe设备尺寸信息,请参见表2-8

说明

当从属的CPU不在位时,对应PCIe设备不可用。

 

表2-8 PCIe设备从属的CPU

PCIe设备

从属CPU

PCIe标准

PCIe连接器物理带宽

PCIe连接器总线带宽

PCIe设备尺寸

NVMe硬盘0

CPU 2

PCIe 3.0

x4

x4

2.5英寸

NVMe硬盘1

CPU 2

PCIe 3.0

x4

x4

2.5英寸

NVMe硬盘2

CPU 3

PCIe 3.0

x4

x4

2.5英寸

NVMe硬盘3

CPU 3

PCIe 3.0

x4

x4

2.5英寸

Riser1

CPU 2

PCIe 3.0

x162*x8

x162*x8

支持安装LP卡或非标准P6 GPU

Riser2

CPU 3

PCIe 3.0

x162*x8

x162*x8

支持安装LP卡或非标准P6 GPU

存储控制卡

CPU 1

PCIe 3.0

x8

x8

非标准部件

Mezz1

CPU 4

PCIe 3.0

x162*x8

x162*x8

非标准部件

Mezz2

CPU 3

PCIe 3.0

x162*x8

x162*x8

非标准部件

Mezz3

CPU 4

PCIe 3.0

x162*x8

x162*x8

非标准部件

Mezz4

CPU 1

PCIe 3.0

x162*x8

x162*x8

非标准部件

Mezz5

CPU 2

PCIe 3.0

x162*x8

x162*x8

非标准部件

Mezz6

CPU 1

PCIe 3.0

x162*x8

x162*x8

非标准部件

·     NVMe硬盘0表示编号为0NVMe硬盘,其他NVMe硬盘的含义同理类推。硬盘编号请参见2.6.1  1. 硬盘编号

·     Riser1表示安装到主板的PCIe Riser1连接器的Riser卡,其他PCIe设备的含义同理类推

 

2.6  硬盘和SATA M.2 SSD模块

2.6.1  硬盘

1. 硬盘编号

硬盘编号用于指示硬盘位置,与刀片服务器前后面板上的丝印完全一致。

说明

图2-8中编号4槽位安装2个SATA M.2 SSD模块时,2个SATA M.2 SSD模块的编号从左往右分别是4和5。

 

图2-8 硬盘编号

 

2. 硬盘指示灯

刀片服务器支持SAS/SATA硬盘和NVMe硬盘。硬盘通过硬盘指示灯指示硬盘状态,硬盘指示灯位置如图2-9所示。

图2-9 硬盘指示灯

(1):硬盘Fault/UID指示灯

(2):硬盘Present/Active指示灯

 

SAS/SATA硬盘指示灯含义请参见表2-9NVMe硬盘指示灯含义请参见表2-10

表2-9 SAS/SATA硬盘指示灯说明

硬盘Fault/UID指示灯(橙色/蓝色)

硬盘Present/Active指示灯(绿色)

说明

橙色闪烁(0.5Hz)

常亮/闪烁(4Hz)

硬盘预告性故障报警,请及时更换硬盘

橙色常亮

常亮/闪烁(4Hz)

硬盘出现故障,请立即更换硬盘

蓝色常亮

常亮/闪烁(4Hz)

硬盘状态正常,且被阵列管理工具点灯

灯灭

闪烁(4Hz)

硬盘在位,有数据读写操作或正在进行阵列迁移/重建

灯灭

常亮

硬盘在位,但没有数据读写操作

灯灭

灯灭

硬盘未安装到位

 

表2-10 NVMe硬盘指示灯说明

硬盘Fault/UID指示灯(橙色/蓝色)

硬盘Present/Active指示灯(绿色)

说明

橙色闪烁(0.5Hz)

灯灭

硬盘已完成预知性热拔出流程,允许拔出硬盘

橙色闪烁(4Hz)

灯灭

硬盘处于热插入过程

橙色常亮

常亮/闪烁(4Hz)

硬盘出现故障,请立即更换硬盘

蓝色常亮

常亮/闪烁(4Hz)

硬盘状态正常,且被阵列管理工具点灯

灯灭

闪烁(4Hz)

硬盘在位,有数据读写操作或正在进行阵列迁移/重建

灯灭

常亮

硬盘在位,但没有数据读写操作

灯灭

灯灭

硬盘未安装到位

 

2.6.2  SATA M.2 SSD模块

通过SATA M.2 SSD适配盒,刀片服务器前部最多支持安装2块SATA M.2 SSD模块。SATA M.2 SSD模块通过其前面板上的指示灯指示SATA M.2 SSD模块状态,SATA M.2 SSD模块上指示灯的含义,如表2-11所示。

图2-10 SATA M.2 SSD模块指示灯

(1):SATA M.2 SSD模块Fault/UID指示灯

(2):SATA M.2 SSD模块Present/Active指示灯

 

表2-11 SATA M.2 SSD模块指示灯说明

SATA M.2 SSD模块Fault/UID指示灯(橙色/蓝色)

SATA M.2 SSD模块Present/Active指示灯(绿色)

说明

橙色闪烁(0.5Hz)

常亮/闪烁(4Hz)

M.2 SSD模块预告性故障报警,请及时更换M.2 SSD模块

橙色常亮

常亮/闪烁(4Hz)

M.2 SSD模块出现故障,请立即更换M.2 SSD模块

蓝色常亮

常亮/闪烁(4Hz)

M.2 SSD模块状态正常,且被阵列管理工具点灯

灯灭

闪烁(4Hz)

M.2 SSD模块在位,有数据读写操作或正在进行阵列迁移/重建

灯灭

常亮

M.2 SSD模块在位,但没有数据读写操作

灯灭

灯灭

M.2 SSD模块未安装到位

 

2.7  内部组网

刀片服务器支持通过以下任意一种方式连接到网络。OM模块和互联模块后面板上的接口,支持为刀片服务器提供上行互联接口。具体连接请参见图2-11

·     方式一:板载网卡与OM模块之间的互联。板载网卡连接到主用和备用OM模块。

·     方式二:Mezz网卡与互联模块之间的互联。刀片服务器支持满配6张Mezz网卡,机箱支持满配6个互联模块。

6张Mezz网卡卡与互联模块的连接关系如下。其中,1和4,2和5,3和6槽位的互联模块,通过机箱内部端口两两互联,形成三对,每对可作为一个交换平面,用户可根据业务需求,将成对的互联模块配置成主备。不同槽位号的互联模块位置,请参见机箱的用户指南。

¡     Mezz网卡1和Mezz网卡4连接1、4槽位的互联模块。

¡     Mezz网卡2和Mezz网卡5连接2、5槽位的互联模块。

¡     Mezz网卡3和Mezz网卡6连接3、6槽位的互联模块。

图2-11 刀片服务器机箱内部连接方式

 

2.8  部件安装准则

2.8.1  SAS/SATA硬盘

·     SAS/SATA硬盘支持热插拔。

·     建议您安装没有RAID信息的SAS/SATA硬盘。

·     请确保组建同一RAID的所有硬盘类型相同,否则会因硬盘性能不同而造成RAID性能下降或者无法创建RAID。即同时满足如下两点。

¡     所有硬盘均为SAS或SATA硬盘。

¡     所有硬盘均为HDD或SSD硬盘。

·     建议组建同一RAID的所有硬盘容量相同。当硬盘容量不同时,系统以最小容量的硬盘为准,即将所有硬盘容量都视为最小容量。

需要注意的是:

·     一个硬盘属于多个RAID的情况会使后期维护变得复杂,并影响RAID的性能。

·     HDD硬盘如果被频繁插拔,且插拔时间间隔小于30秒,可能会导致该硬盘无法被系统识别。

2.8.2  NVMe硬盘

·     NVMe硬盘支持热插和预知性热拔。

·     建议用户安装没有RAID信息的NVMe硬盘。

·     建议组建同一RAID的所有NVMe硬盘容量相同。当NVMe硬盘容量不同时,系统以最小容量的NVMe硬盘为准,即将所有NVMe硬盘容量都视为最小容量。对于容量较大的NVMe硬盘,其多余容量无法用于配置当前RAID,也无法用于配置其他RAID。

·     NVMe硬盘支持热插。插入硬盘时要匀速插入,过程中不能出现停顿,否则容易导致操作系统卡死或重启。

·     NVMe硬盘是否支持热拔和预知性热拔,与操作系统有关。

·     不支持多个NVMe硬盘同时热插拔,建议间隔30秒以上,待操作系统识别到第一个硬盘信息后,再开始操作下一个硬盘。同时插入多个NVMe硬盘,容易导致操作系统无法识别硬盘。

2.8.3  NVMe VROC模块

服务器支持的NVMe VROC模块及规格信息,如表2-12所示。

表2-12 NVMe VROC模块规格

型号

说明

支持的RAID级别

NVMe-VROC-Key-i

NVMe VROC模块Intel版,仅支持Intel NVMe硬盘

RAID 0/1/5/10

NVMe-VROC-Key-P

NVMe VROC模块高级版,支持任意品牌的NVMe硬盘

RAID 0/1/5/10

NVMe-VROC-Key-S

NVMe VROC模块标准版,支持任意品牌的NVMe硬盘

RAID 0/1/10

 

2.8.4  Riser卡与PCIe卡

1. Riser卡与PCIe卡适配关系

表2-13 PCIe卡尺寸

简称

英文全称

描述

LP卡

Low Profile card

小尺寸卡

FHHL卡

Full Height,Half Length card

全高半长卡

FHFL卡

Full Height,Full Length card

全高全长卡

HHHL卡

Half Height,Half Length card

半高半长卡

HHFL卡

Half Height,Full Length card

半高全长卡

 

2. Riser卡与PCIe卡适配关系

Riser卡和PCIe卡的适配关系如表2-14所示。

表2-14 Riser卡与PCIe卡适配关系

Riser卡型号

Riser卡安装位置

Riser卡上的PCIe连接器槽位号

PCIe连接器描述

PCIe连接器支持的PCIe卡

从属CPU

RC-LP-1

PCIe Riser卡连接器1

slot 1

PCIe3.0 x16

LP卡

CPU 1

PCIe Riser卡连接器2

slot 2

CPU 2

·     PCIe Riser卡连接器在主板的具体位置,请参见2.5.1  主板布局

·     小尺寸PCIe卡可以插入到大尺寸PCIe卡对应的PCIe连接器,例如:LP卡可以插入到FHFL卡对应的PCIe连接器

·     PCIe3.0 x16:

¡ PCIe3.0:第三代信号速率;

¡ x16:连接器宽度;

 

2.8.5  存储控制卡及其掉电保护模块

1. 前置Mezz存储控制卡和板载软RAID

刀片服务器支持的前置Mezz存储控制卡和板载软RAID如表2-15所示。

表2-15 前置Mezz存储控制卡和板载软RAID说明

前置Mezz存储控制卡和板载软RAID型号

安装位置

支持的硬盘类型

是否支持掉电保护功能

Flash

安装方法

RSTe板载软RAID

内嵌在主板上,无需用户安装

SATA HDD/SSD

不支持

不涉及

RAID-P5408-Mf-8i-4GB

主板的存储控制卡连接器

SAS/SATA HDD/SSD

支持,需选配SCAP-LSI-G3超级电容(Flash内嵌在存储控制卡上)

内置Flash

请参见6.5.4  安装前置Mezz存储控制卡

RAID-P2404-Mf-4i-2GB

主板的存储控制卡连接器

SAS/SATA HDD/SSD

支持,需选配SCAP-PMC-G3超级电容(Flash内嵌在存储控制卡上)

内置Flash

HBA-H5408-Mf-8i

主板的存储控制卡连接器

SAS/SATA HDD/SSD

不支持

·     RSTe板载软RAID必须配合PTH-PT104-Mf-4L直通卡使用

·     支持掉电保护的存储控制卡必须与对应的超级电容配合使用

·     存储控制卡连接器在主板的具体位置请参见2.5.1  主板布局

 

RSTe板载软RAID规格信息如2-16所示,其他存储控制卡规格信息请查询官网UIS一体机兼容查询工具

表2-16 RSTe板载软RAID规格

型号

项目

RSTe板载软RAID

端口数

8个内置SATA接口

端口特性

支持6.0Gb/s SATA 3.0接口,支持对应硬盘热插拔

PCIe接口

PCIe3.0 x4位宽

RAID级别

RAID 0/1/5

位置/尺寸

位置:内嵌在主板的PCH上

缓存

Flash

掉电保护

不支持

电池接口

固件升级

随BIOS升级

说明:如需使用RSTe板载软RAID,需要选配直通卡(型号:PTH-PT104-Mf-4L)

 

2. 后置Mezz RAID卡安装准则

刀片服务器支持的后置Mezz存储控制卡如表2-17所示。

表2-17 后置Mezz RAID卡说明

后置MezzRAID卡型号

安装位置

支持的硬盘类型

是否支持掉电保护功能

安装方法

RAID-P4408-Ma-8i-2GB

主板的后部Mezz卡连接器3或6

SAS/SATA HDD/SSD

支持,需选配SCAP-PMC-G3超级电容(Flash内嵌在存储控制卡上)

请参见6.6.4  安装后置Mezz RAID卡

RAID-P5408-Ma-8i-4GB

主板的后部Mezz卡连接器3或6

SAS HDD/SSD

支持,需选配SCAP-LSI-G3超级电容(Flash内嵌在存储控制卡上)

 

刀片服务器中仅支持安装一张后置Mezz RAID卡,安装位置为:

·     如图2-12所示,对于支持6个后部Mezz卡槽位的刀片服务器而言,后置Mezz RAID卡支持安装在Mezz3槽位或Mezz6槽位。

说明

安装后置Mezz RAID卡时,请确保后部Mezz卡槽位从属的CPU在位。

 

图2-12 服务器上的6个后部Mezz卡槽位

 

3. 掉电保护模块

掉电保护模块是一个总称,包含Flash卡和超级电容。Flash卡有两种,一种需要安装到存储控制卡上;另一种内嵌在存储控制卡上,无需用户安装。

服务器系统意外掉电时,超级电容可为Flash卡供电20秒以上,在此期间,缓存数据会从存储控制卡的DDR存储器传输到Flash卡中。由于Flash卡是非易失性存储介质,故可实现缓存数据的永久保存或者保存到服务器系统上电,存储控制卡检索到这些数据为止。

说明

安装超级电容后,可能会出现电量不足,此时无需采取任何措施,服务器上电后,内部电路会自动为超级电容充电并启用超级电容。关于超级电容的状态,通过HDM或OM可以查看,具体请参见HDM或OM联机帮助。

 

超级电容寿命到期注意事项:

·     超级电容的寿命通常为3年~5年。

·     超级电容寿命到期时,可能导致超级电容异常,系统通过如下方式告警:

¡     对于PMC超级电容,HDM界面中的Flash卡状态会显示为“异常”+“状态码”,可通过解析状态码了解超级电容异常的原因,具体请参见HDM联机帮助。

¡     对于LSI超级电容,HDM界面中的Flash卡状态会显示为“异常”。

¡     HDM会生成SDS日志记录,SDS日志的查看方法请参见HDM联机帮助。

·     超级电容寿命到期时,需要及时更换,否则会导致存储控制卡的数据掉电保护功能失效。

说明

更换寿命到期的超级电容后,请检查存储控制卡的逻辑盘缓存状态,若存储控制卡的逻辑盘缓存被关闭,则需要重新开启逻辑盘缓存的相关配置以启用掉电保护功能,具体配置方法请参见HDM联机帮助。

 

4. 安装准则

服务器支持配置单张或多张存储控制卡,请确保服务器上配置的所有存储控制卡的厂家(PMC和LSI)相同,服务器支持的存储控制卡及对应厂家请参见UIS一体机兼容查询工具

2.8.6  GPU

·     由于结构限制,PCIe Riser卡连接器上1位置无法同时安装GPU卡和存储控制卡。GPU卡安装在PCIe Riser卡连接器上1或PCIe Riser卡连接器2上,存储控制卡安装在存储控制卡连接器上,连接器的具体位置请参见2.5.1  主板布局

·     当配置一张GPU卡时,建议将该GPU卡安装到主板的PCIe Riser卡连接器1。

2.8.7  网卡

1. 标准PCIe网卡安装准则

由于结构限制,PCIe Riser卡连接器上1位置无法同时安装GPU卡和存储控制卡。GPU卡安装在PCIe Riser卡连接器上1或PCIe Riser卡连接器2上,存储控制卡安装在存储控制卡连接器上,连接器的具体位置请参见2.5.1  主板布局

2. Mezz网卡安装准则

·     刀片服务器最多支持安装6张Mezz网卡。

·     安装Mezz网卡时,请确保Mezz卡连接器从属的CPU在位。具体关系请参见2.5.4  PCIe连接器

·     Mezz网卡与互联模块通过机箱背板互联,且两者存在槽位上的对应关系;故安装Mezz网卡时,请确保对应槽位的互联模块在位,具体关系请参见2.7  内部组网

2.8.8  SATA M.2 SSD

·     建议您安装没有RAID信息的SATA M.2 SSD卡。

·     建议组建同一RAID的所有SATA M.2 SSD卡和SATA M.2 SSD模块容量相同。当容量不同时,系统以最小容量的为准,即将所有模块容量都视为最小容量。

2.8.9  SATA M.2 SSD模块

·     SATA M.2 SSD模块必须配合SATA M.2 SSD适配盒使用。

·     SATA M.2 SSD模块支持热插拔。

·     建议您安装没有RAID信息的SATA M.2 SSD模块。

·     建议组建同一RAID的所有SATA M.2 SSD模块容量相同。当容量不同时,系统以最小容量的模块为准,即将所有模块容量都视为最小容量。

2.8.10  SATA M.2 SSD适配盒

SATA M.2 SSD适配盒支持热插拔。

2.8.11  内存

介绍内存的基本概念、内存模式及内存安装准则。

1. 内存基本概念

内存包括DDR4和DCPMM两类,其中DDR4又包括LRDIMM和RDIMM。

(1)     DDR4和DCPMM

·     DDR4是最为常见的内存。服务器系统意外掉电时,DDR4中的数据会丢失。

·     DCPMM具有如下两个特点。

¡     相比于DDR4,DCPMM具有更大的单根内存容量。

¡     DCPMM(如Apache Pass)具有数据掉电保护功能。服务器系统意外掉电时,DCPMM中的数据不会丢失。

(2)     RDIMM和LRDIMM

·     RDIMM提供了地址奇偶校验保护功能。

·     LRDIMM可为系统提供更大的容量和带宽。

(3)     Rank

内存的RANK数量通常为1、2、4、8,一般简写为1R/SR、2R、4R、8R,或者Single-Rank、Dual-Rank、Quad-Rank、8-Rank。

·     1R DIMM具有一组内存芯片,在DIMM中写入或读取数据时,将会访问这些芯片。

·     2R DIMM相当于一个模块中包含两个1R DIMM,但每次只能访问一个Rank。

·     4R DIMM相当于一个模块中包含两个2R DIMM,但每次只能访问一个Rank。

·     8R DIMM相当于一个模块中包含两个4R DIMM,但每次只能访问一个Rank。

在内存中写入或读取数据时,服务器内存控制子系统将在内存中选择正确的Rank。

(4)     DDR4内存规格

可通过内存上的标签确定内存的规格。

图2-13 内存标识

 

表2-18 DDR4内存标识说明

编号

说明

定义

1

容量

·     8GB

·     16GB

·     32GB

2

Rank数量

·     1R = Rank数量为1

·     2R = Rank数量为2

·     4R = Rank数量为4

·     8R = Rank数量为8

3

数据宽度

·     x4 = 4位

·     x8 = 8位

4

内存代数

DDR4

5

内存等效速度

·     2133P:2133MHz

·     2400T:2400MHz

·     2666V:2666MHz

·     2933Y:2933MHz

6

内存类型

·     R = RDIMM

·     L = LRDIMM

 

(5)     DCPMM的内存标识上仅显示DCPMM容量,具体的参数请参见UIS一体机兼容查询工具

2. DDR4内存模式

刀片服务器支持通过以下内存模式来保护DDR4内存中的数据。

说明

Independent Mode为缺省内存模式,在BIOS界面上无该配置选项。

 

·     Independent Mode(缺省)

·     Mirror Mode

·     Memory Rank Sparing

Independent Mode

标准ECC可纠正1位内存错误、检测多位内存错误,当标准ECC检测到多位错误时,会通报给服务器并使服务器停止运行。独立模式可避免服务器出现多位内存错误,同时可纠正一位或四位内存错误(当错误均位于内存上相同的DDR4时)。独立模式具有更强大的保护功能,可以纠正某些标准ECC无法纠正从而导致服务器停机的内存错误。

Mirror Mode

使用系统内存的一部分来做镜像,提高系统稳定性,以防出现无法纠正的内存错误而导致服务器停机,当检测到内存通道中发生无法纠正的错误时,刀片服务器会从镜像内存中获取数据,镜像模式是通道级别的内存模式,如CH2为CH1的镜像,CH3为CH2的镜像,CH1为CH3的镜像。

Memory Rank Sparing

使用系统内存中的一部分Rank作为备份Rank,提高系统稳定性。该功能开启后,当非备份Rank发生的可纠正错误超过特定阈值时,刀片服务器会启用备份Rank替换该Rank,并停用该故障Rank。

3. 内存安装准则

刀片服务器支持2路或4路CPU,每路CPU支持6个通道,每个通道支持2根内存,即2路CPU支持24根内存,4路CPU支持48根内存。不同CPU平台,支持的内存类型不同,详细信息请参见表2-19

表2-19 不同CPU平台的内存支持情况

CPU平台

内存支持情况

Intel SkyLake

仅配置DDR4

Intel Cascade Lake

·     仅配置DDR4

·     混配DCPMMDDR4

澜起Jintide C系列(包括C1和C2系列)

仅配置DDR4

·     仅配置DDR4时,内存安装准则请参见仅配置DDR4时的内存安装准则

·     混配DCPMM和DDR4时,内存安装准则请参见混配DCPMM和DDR4时的内存安装准则

 

说明

仅当同时满足以下条件时,内存的工作频率可达到2933MHz:

·     使用支持的最高内存频率为2933MHz的Cascade Lake CPU

·     使用最高频率为2933MHz的内存

·     配置了内存的通道中均仅配置一根内存,且需将内存插在白色的内存槽位

 

内存和CPU的兼容性

内存和CPU的兼容性,如表2-20所示。

表2-20 内存和CPU之间的兼容性

CPU类型

CPU兼容的内存类型@频率

说明

·     Intel Skylake

·     澜起Jintide C1

·     DDR4 @2933MHz

·     DDR4 @2666MHz

CPU兼容的DDR4 @2933MHz,仅包括如下编码的DDR4:

0231ABE2、0231AC4S、0231AC4R、0231ABDT、0231AC4V、0231AC4Q、0231ABDU、0231AC4T、0231AC4U

Intel Cascade Lake

·     DDR4 @2933MHz

·     DCPMM @2666MHz

如下CPU系列不兼容DCPMM:

·     32XX系列

·     42XX系列(除4215、4215R)

澜起Jintide C2

DDR4 @2933MHz

-

 

内存运行频率

说明

内存频率、CPU支持的最高内存频率,均可以通过UIS一体机兼容查询工具查询。在查询工具中,内存频率通过“内存条”部件名称进行查询;CPU支持的最高内存频率通过“处理器”部件名称进行查询。

 

内存在服务器上的运行频率,与内存频率、CPU支持的最高内存频率有关,确认流程如图2-14所示,具体细则如下:

·     CPU支持的最高内存频率<内存频率时,内存运行频率为CPU支持的最高内存频率。

·     CPU支持的最高内存频率>内存频率时,内存运行频率为内存频率。

·     CPU支持的最高内存频率=内存频率时,服务器的DPC(DIMM Per Channel,每个通道中配置的内存数量)配置不同,内存运行频率也不同:

¡     CPU支持最高频率和内存频率=2933 MHz时:

-     所有内存通道均为1 DPC配置时,内存运行频率为2933 MHz。

-     存在2 DPC配置(含DDR4和DCPMM混配)时,服务器上的所有内存均会降频,内存运行频率为2666 MHz。

¡     CPU支持最高频率和内存频率<2933 MHz时,1 DPC和2 DPC内存运行频率均为内存频率。

图2-14 内存运行频率确认流程图

 

仅配置DDR4时的内存安装准则

·     确保相应的CPU已安装到位。

·     不同规格(类型、容量、Rank、数据宽度、速率)的DDR4不支持混插,即一台服务器上配置的所有DDR4产品编码必须相同,产品编码信息请参见UIS一体机兼容查询工具

·     每个通道最多支持8个Rank。

·     一般的内存安装准则如图2-15图2-16

·     除上述准则外,不同内存模式还有各自特定的准则,具体请参见表2-21。需要注意的是,当实际内存安装不满足这些特定准则时,无论用户配置了何种内存模式,系列均会自动降级并使用缺省的Independent Mode。

表2-21 不同内存模式的特定安装准则

内存模式

特定安装准则

Independent Mode(缺省)

遵循一般的内存安装准则,具体如下:

·     2路CPU在位时,内存安装准则如图2-15所示。

·     4路CPU在位时,内存安装准则如图2-16所示。

Mirror Mode

·     确保每个CPU至少安装2根内存。

·     遵循一般的内存安装准则。需要注意的是,该模式不支持一般内存安装准则中不推荐的内存配置。

¡     2路CPU在位时,内存安装准则如图2-15所示。

¡     4路CPU在位时,内存安装准则如图2-16所示。

Memory Rank Sparing

·     确保安装了内存的通道,每个通道的内存Rank总数大于等于2。

·     遵循一般的内存安装准则,具体如下:

¡     2路CPU在位时,内存安装准则如图2-15所示。

¡     4路CPU在位时,内存安装准则如图2-16所示。

 

说明

图2-15图2-16(内存安装准则)中:

·     ”和橙色行表示推荐的内存安装准则,“*”表示不推荐的内存安装准则。

·     灰显的内存插槽(如A12)表示黑色的内存插槽,非灰显(如A6)的表示白色的内存插槽。

 

图2-15 内存安装准则(2路CPU)

 

图2-16 内存安装准则(4路CPU)

 

混配DCPMM和DDR4时的内存安装准则

说明

DCPMM不支持ADR功能。

 

·     确保相应的CPU已安装到位。

·     不同规格(类型、容量、Rank、数据宽度、速率)的DDR4不支持混插,即服务器上配置的所有DDR4产品编码必须相同;不同规格的DCPMM不支持混插,即服务器上配置的所有DCPMM产品编码必须相同。产品编码信息请参见UIS一体机兼容查询工具

·     每路CPU安装的内存容量不可超过CPU本身支持的最高“内存”容量。

·     混配DCPMM和DDR4时的内存安装准则如图2-17图2-18所示。

图2-17 内存安装准则(2路CPU)

 

图2-18 内存安装准则(4路CPU)

 

2.8.12  CPU

1. CPU安装准则

·     刀片服务器仅支持2路或4路CPU。

·     为避免损坏CPU或主板,只限授权人员或专业的刀片服务器工程师安装CPU。

·     请确保同一刀片服务器上安装的CPU型号相同。

·     CPU产品型号后缀为U,代表此CPU仅支持单路运行。CPU产品型号后缀请参见2. CPU产品型号后缀的含义

·     同一个型号的CPU,包括疏齿和密齿两种散热器。带有标签“Front”的疏齿散热器必须安装在CPU2和CPU3上,带有标签“Rear”的密齿散热器必须安装在CPU1和CPU4上,CPU布局如图2-19

·     请确保CPU 1和CPU 2始终在位,否则刀片服务器将无法运行。CPU 1和CPU2的具体位置如图2-19

·     为避免CPU底座中针脚损坏,请确保在未安装CPU的底座上安装CPU支架。

·     为防止人体静电损坏电子组件,请在操作前佩戴防静电手腕,并将防静电手腕的另一端良好接地。

图2-19 CPU布局

 

2. CPU产品型号后缀的含义

若CPU产品型号是:UN-CPU-INTEL-8360Y-S,那么它的后缀为“Y”(简称CPU产品型号后缀)。服务器支持的CPU产品型号可通过UIS一体机兼容查询工具查询。

Intel Cascade/Skylake CPU产品型号后缀含义如表2-22

表2-22 Intel Cascade/Skylake CPU产品型号后缀说明

CPU产品型号后缀

后缀含义

后缀说明

N

NFV Optimized

NFV场景优化

S

Search Optimized

搜索场景优化

T

High Tcase

支持高温度规格的CPU型号

U

Single Socket

仅支持单路运行

V

VM Density Optimized

虚拟机密度优化

Y

Speed Select

支持英特尔SST技术,可配置内核数量和内核频率

M

2TB/Socket memory tier

支持高内存容量,单颗CPU最高可支持2TB的内存容量

L

4.5TB/Socket memory tier

支持高内存容量,单颗CPU最高可支持4.5TB的内存容量

本表提供的信息仅供参考,具体内容以Intel官网资料为准。

 

2.9  存放要求

·     HDD硬盘断电存放时间建议小于6个月。

·     SSD、M.2卡、SD卡等存储介质,断电存放时间建议小于3个月,长期断电可能存在数据丢失的风险。

·     当HDD/SSD/M.2卡/SD卡等存储介质需要断电存放3个月及以上时,建议每3个月至少上电运行一次,每次上电运行时间不少于2小时。服务器上电和下电的操作方法请参见4 上电和下电

 


3 安装和拆卸刀片服务器

介绍刀片服务器安装拆卸的具体步骤。

说明

具体操作步骤请参见部件安装&更换视频

 

3.1.1  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     拆卸刀片服务器前,请做好业务备份并确保业务已停止运行,并将服务器下电。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解刀片服务器安装准则,具体请参见《H3C UIS 9000一体机 用户指南》。

3.1.2  安装刀片服务器

(1)     拆卸刀片服务器假面板。按住两侧按钮,将假面板水平向外拉。

(2)     安装刀片服务器。从防静电包装袋中取出待安装的服务器。

(3)     按下刀片服务器两侧的解锁按钮,扳手会自动打开。

(4)     沿水平方向将服务器缓缓插入机箱中,然后闭合扳手。

3.1.3  拆卸刀片服务器

(1)     拆卸刀片服务器。按下服务器的解锁按钮,完全打开扳手,将服务器沿水平方向从机箱中缓缓拔出服务器。

(2)     将服务器放入防静电包装袋。


4 上电和下电

介绍刀片服务器的上电和下电方法。

说明

在刀片服务器连接了外部数据存储设备的组网中,请确保刀片服务器是第一个下电且最后一个恢复上电的设备。该方法可确保刀片服务器上电时,不会误将外部数据存储设备标记为故障设备。

 

4.1  上电

介绍刀片服务器的上电方法。

4.1.1  支持的上电方式

刀片服务器支持的上电方式,如表4-1所示。

表4-1 刀片服务器上电方式

上电方式

应用场景

方式一:刀片服务器随机箱上电

刀片服务器安装到位,机箱未上电

方式二:通过刀片服务器前面板上的开机/待机按钮为刀片服务器上电

机箱已上电,刀片服务器已安装但处于下电状态,此时刀片服务器系统电源指示灯为橙色常亮

方式三:通过OM Web方式为刀片服务器上电

方式四:通过OM命令行方式为刀片服务器上电

方式五:通过刀片服务器HDM Web方式为刀片服务器上电

 

4.1.2  前提条件

·     刀片服务器及内部部件已经安装完毕。

·     机箱已连接外部供电系统。

·     刀片服务器关机后,如果需要立刻执行开机操作,为确保刀片服务器内部各部件能正常工作,建议关机后等待30秒以上(确保HDD硬盘彻底静止、各电子部件彻底掉电),再执行开机操作。

4.1.3  操作方法

刀片服务器上电成功后,系统电源指示灯为绿色常亮,指示灯的具体位置请参见2.4.2  指示灯和按钮

1. :方式一:刀片服务器随机箱上电

说明

此上电方式需要用户已配置好槽位错峰上电功能,槽位错峰上电功能具体配置方法请参见OM联机帮助。

 

机箱上电前已安装的刀片服务器,机箱上电时,刀片服务器会随机箱自动上电,用户无需执行任何操作。

2. 方式一:通过刀片服务器前面板上的开机/待机按钮上电

按下刀片服务器前面板上的开机/待机按钮,使刀片服务器上电。开机/待机按钮的具体位置请参见2.4.2  指示灯和按钮

3. 方式二:通过OM Web方式为刀片服务器上电

通过OM Web界面的刀片服务器管理功能,可为刀片服务器上电,具体操作方法请参见机箱OM的联机帮助。

4. 方式三:通过OM命令行方式为刀片服务器上电

通过OM的命令行界面执行psu-blade命令,可为刀片服务器上电,具体操作方法请参见机箱OM的命令手册。

5. 方式四:通过刀片服务器HDM Web方式为刀片服务器上电

通过刀片服务器HDM Web界面的电源管理功能,可为刀片服务器上电,具体操作方法请参见刀片服务器的HDM联机帮助。

4.2  下电

介绍刀片服务器的下电方法。

说明

刀片服务器会随着机箱的下电而下电。

 

4.2.1  支持的下电方式

刀片服务器支持的下电方式,如表4-2所示。

表4-2 刀片服务器下电方式

下电方式

应用场景

方式一:通过连接显示器、鼠标和键盘为刀片服务器下电

机箱和刀片服务器均已上电,且刀片服务器正常工作

方式二:通过OM Web方式为刀片服务器下电

方式三:通过OM命令行方式为刀片服务器下电

方式四:通过刀片服务器HDM Web方式的电源管理功能为刀片服务器下电

方式五:通过刀片服务器前面板上的开机/待机按钮为刀片服务器下电

机箱和刀片服务器均已上电,但刀片服务器出现异常

 

4.2.2  前提条件

·     下电前,请确保所有数据已提前保存。

·     下电后,所有业务将终止,因此下电前请确保刀片服务器的所有业务已经停止或者迁移到其他刀片服务器上。

4.2.3  操作方法

刀片服务器下电成功后,系统电源指示灯为橙色常亮,指示灯的具体位置请参见2.4.2  指示灯和按钮

1. 方式一:通过连接显示器、鼠标和键盘为刀片服务器下电

通过SUV电缆连接显示器、鼠标和键盘到刀片服务器,关闭刀片服务器操作系统。

2. 方式二:通过OM Web方式为刀片服务器下电

通过OM Web界面的刀片服务器管理功能,可为刀片服务器下电,具体操作方法请参见机箱OM的联机帮助。

3. 方式三:通过OM命令行方式为刀片服务器下电

通过OM的命令行界面执行psu-blade命令,可为刀片服务器下电,具体操作方法请参见机箱OM的命令手册。

4. 方式四:通过刀片服务器HDM Web方式为刀片服务器下电

通过刀片服务器HDM Web界面的电源管理功能,可为刀片服务器下电,具体操作方法请参见刀片服务器的HDM联机帮助。

5. 方式五:通过刀片服务器前面板上的开机/待机按钮为刀片服务器下电

说明

采用该方式,刀片服务器的应用程序和操作系统为非正常关闭,可能会导致服务器数据丢失。当应用程序停止响应时,可采用这种方式。

 

按住刀片服务器前面板上的开机/待机按钮5秒以上,使刀片服务器下电。


5 配置刀片服务器

介绍完成刀片服务器安装后,对其进行简单配置的过程,包括配置BIOS、配置RAID以及安装操作系统和驱动程序。

5.1  配置流程

刀片服务器配置流程如图5-1所示。

图5-1 刀片服务器配置流程

 

5.2  缺省参数

机箱OM管理接口的缺省IP地址、缺省用户名和密码,如表5-1所示。

表5-1 OM缺省参数

类型

缺省值

用户名

admin

密码

Password@_

管理接口的IP地址

192.168.100.100/24

 

刀片服务器HDM管理接口的缺省IP地址、缺省用户名和密码,如表5-2所示。

表5-2 HDM缺省参数

类型

缺省值

用户名

admin

密码

Password@_

管理接口的IP地址

缺省通过DHCP服务器获取

 

5.3  将刀片服务器接入网络

5.3.1  通过管理模块接入网络

·     管理模块提供如下四个业务网口,连接网线到四个业务网口中的任意一个,即可将刀片服务器接入网络。

图5-2 管理模块上的业务网口

 

·     管理模块提供一个管理接口(丝印为MGMT的接口),连接网线到该管理接口,即可登录机箱OM和刀片服务器的HDM,进行机箱及机箱内刀片服务器运行状态的监控和基本信息的设置。

5.3.2  通过互联模块接入网络

互联模块与刀片服务器上的Mezz网卡互联且存在对应关系。互联模块与Mezz网卡的互联关系,请参见2.7  内部组网

通过互联模块将刀片服务器接入网络时,需要确保刀片服务器上与互联模块对应的Mezz网卡在位。

5.4  查看刀片服务器状态

将刀片服务器上电,上电完成后,查看刀片服务器的以下信息,确保刀片服务器正常运行。刀片服务器上电的具体方法,请参见4.1  上电

·     查看刀片服务器前面板上四个指示灯的状态是否正常。四个指示灯的含义,请参见2.4.2  指示灯和按钮

·     通过OM查看刀片服务器的固件版本,如果发现和目标固件版本不一致,请升级固件。具体方法,请参见OM联机帮助。

·     通过OM查看刀片服务器的运行状态是否正常,如果有告警,请排除告警。

5.5  修改OM缺省信息

介绍OM缺省用户密码及缺省IP地址的修改方法。

5.5.1  修改OM缺省用户密码

(1)     登录OM,具体方法请参见OM模块用户指南。

(2)     修改OM缺省用户密码。具体修改方法,请参见OM联机帮助。

5.5.2  修改OM缺省IP地址

(1)     登录OM,具体方法请参见OM模块的用户指南。

(2)     修改OM缺省IP地址。具体修改方法,请参见OM联机帮助。

5.6  修改HDM缺省信息

介绍刀片服务器HDM缺省用户密码及缺省IP地址的修改方法。

5.6.1  修改HDM缺省用户密码

OM不能直接修改刀片服务器HDM的缺省用户密码,如需修改,必须进入刀片服务器的HDM进行修改。

修改HDM缺省用户密码的方法如下:

(1)     登录HDM,具体方法请参见7.2  登录刀片服务器HDM

(2)     修改HDM缺省用户密码。密码的设置规则及具体设置方法请参见HDM联机帮助。

5.6.2  修改HDM缺省IP地址

1. 通过OM修改

(1)     登录OM,具体方法请参见OM联机帮助。

(2)     修改HDM缺省IP地址。具体修改方法,请参见OM联机帮助。

2. 通过HDM修改

(1)     登录HDM,具体方法请参见7.2  登录刀片服务器HDM

(2)     修改HDM缺省IP地址。具体修改方法,请参见HDM联机帮助。

5.7  登录刀片服务器

登录刀片服务器的具体方法,请参见7.1  登录刀片服务器操作系统

5.8  设置BIOS

5.8.1  设置服务器启动顺序

用户可以根据需要修改刀片服务器的启动顺序。缺省启动顺序和启动顺序的修改方法请参见产品的BIOS用户指南。

5.8.2  设置BIOS密码

BIOS密码包括管理员密码和用户密码。缺省情况下,系统没有设置管理员密码和用户密码。

为防止未授权人员设置和修改服务器的BIOS系统配置,请您同时设置BIOS的管理员密码和用户密码,并确保两者密码不相同。

设置管理员密码和用户密码后,进入系统时,必须输入管理员密码或用户密码。

·     当输入的密码为管理员密码时,获取的BIOS权限为管理员权限。

·     当输入的密码为用户密码时,获取的BIOS权限为用户权限。

管理员权限和用户权限的区别,请参见产品的BIOS用户指南。

BIOS的管理员密码和用户密码的具体设置方法,请参见产品的BIOS用户指南。

5.9  配置RAID

存储控制卡型号不同,支持的RAID级别和配置RAID的方法会有所不同,详细信息请参见产品的存储控制卡用户指南。

5.10  安装操作系统和驱动程序

介绍如何安装操作系统和驱动程序。

5.10.1  安装驱动程序

刀片服务器安装新硬件后,如果操作系统中没有该硬件的驱动程序,则该硬件无法使用。

安装驱动程序的具体方法,请参见产品的操作系统安装指导。

注意

更新驱动程序之前,请备份原驱动程序,以防止更新失败而导致对应硬件无法使用。


6 更换部件

说明

更换多个部件时,请阅读所有部件的更换方法并确定相似步骤,以便简化更换过程。

 

6.1  可更换的部件及其视频

各部件更换的具体方法请参见部件安装&更换视频,服务器可更换部件如下:

·     SAS/SATA硬盘(6.2  更换SAS/SATA硬盘

·     NVMe硬盘(6.3  更换NVMe硬盘

·     Riser卡和PCIe卡(6.4  更换Riser卡和PCIe卡

·     前置Mezz存储控制卡及其掉电保护模块(6.5  更换前置Mezz存储控制卡及其掉电保护模块

·     后置Mezz RAID卡(6.6  更换后置Mezz RAID卡

·     直通卡(6.7  更换直通卡

·     GPU卡(6.8  更换GPU卡

·     网卡(6.9  更换网卡

·     SATA M.2 SSD卡(6.10  更换SATA M.2 SSD卡

·     SATA M.2 SSD模块(6.11  更换SATA M.2 SSD模块

·     SATA M.2 SSD适配盒(6.12  更换SATA M.2 SSD适配盒

·     Micro SD卡(6.13  更换Micro SD卡

·     NVMe VROC模块(6.14  更换NVMe VROC模块

·     内存(6.15  更换内存

·     CPU(6.16  更换CPU6.17  安装CPU选件

·     系统电池(6.18  更换系统电池

·     主板(6.19  更换主板

·     硬盘背板(6.20  更换硬盘背板

·     TPM/TCM模块(6.21  安装TPM/TCM模块

6.2  更换SAS/SATA硬盘

介绍如何更换SAS/SATA硬盘。

6.2.1  操作场景

·     SAS/SATA硬盘故障。

·     扩容SAS/SATA硬盘。

·     更换空间已满的SAS/SATA硬盘。

·     更换其他类型的SAS/SATA硬盘。

·     SAS/SATA硬盘阻碍其他部件维护。

6.2.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     明确待更换硬盘在服务器中的安装位置。

·     待更换硬盘上已安装操作系统,且硬盘未配置RAID或在无冗余功能的RAID组内时,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     明确待更换硬盘在刀片服务器中的安装位置。

·     明确刀片服务器的RAID配置信息。如果更换其他型号的硬盘或空间已满的硬盘,且硬盘所配置的RAID无冗余功能,请提前备份待更换的硬盘中的数据。

·     了解SAS/SATA硬盘安装准则2.8.1  SAS/SATA硬盘

6.2.3  更换SAS/SATA硬盘

1. 拆卸SAS/SATA硬盘

(1)     拆卸SAS/SATA硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后从硬盘槽位中拔出硬盘。对于HDD硬盘,硬盘扳手自动打开后,先将硬盘向外拔出3cm,使硬盘脱机;然后等待至少30秒,硬盘完全停止转动后,再将硬盘从槽位中拔出。

(2)     拆卸硬盘支架。移除硬盘支架上的所有固定螺钉,并将硬盘从硬盘支架上移除。

2. 安装SAS/SATA硬盘

(1)     (可选)安装硬盘到硬盘支架。将新硬盘安装到拆卸下来的硬盘支架,并使用固定螺钉固定。

(2)     (可选)拆卸待安装硬盘槽位的假面板。向右按住假面板上的按钮,同时向外拉假面板。

(3)     安装SAS/SATA硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后将硬盘插入硬盘槽位。

(4)     (可选)如果新安装的SAS/SATA硬盘中有RAID信息,请清除。

(5)     当存储控制卡检测到新SAS/SATA硬盘后,请根据实际情况确认是否进行RAID配置,配置RAID的方法请参见产品的存储控制卡用户指南。

3. 确认工作

可通过以下一种或多种方法判断SAS/SATA硬盘工作状态,以确保SAS/SATA硬盘更换成功。

·     登录OM Web界面,查看配置RAID后的SAS/SATA硬盘容量等信息是否正确。具体方法请参见OM联机帮助。

·     登录HDM Web界面,查看配置RAID后的SAS/SATA硬盘容量等信息是否正确。具体方法请参见HDM联机帮助。

·     根据SAS/SATA硬盘指示灯状态,确认SAS/SATA硬盘是否正常工作。指示灯详细信息请参见2.6.1  2. 硬盘指示灯

·     通过BIOS查看SAS/SATA硬盘容量等信息是否正确。配置RAID的方法不同,BIOS下查看SAS/SATA硬盘信息的具体方法也有所不同,详细信息请参见产品的存储控制卡用户指南。

·     进入操作系统后,查看SAS/SATA硬盘容量等信息是否正确。

6.3  更换NVMe硬盘

介绍如何更换NVMe硬盘。

6.3.1  操作场景

·     NVMe硬盘故障。

·     扩容NVMe硬盘。

·     更换空间已满的NVMe硬盘。

·     更换其他型号的NVMe硬盘。

·     NVMe硬盘阻碍其他部件维护。

6.3.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     明确待更换硬盘在服务器中的安装位置。

·     待更换硬盘上已安装操作系统,且硬盘未配置RAID或在无冗余功能的RAID组内时,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     明确待更换硬盘在刀片服务器中的安装位置。

·     明确刀片服务器的RAID配置信息。如果更换其他型号的硬盘或空间已满的硬盘,且硬盘所配置的RAID无冗余功能,请提前备份待更换的硬盘中的数据。

·     了解NVMe硬盘安装准则2.8.2  NVMe硬盘

·     做预知性热拔操作,具体步骤请参见附录中的“附录B”章节。

6.3.3  拆卸NVMe硬盘

说明

拆卸两块以上NVMe硬盘时,请按顺序执行NVMe硬盘拔出操作,即在完全拔出一块NVMe硬盘后,请等待5秒,再拔出下一块NVMe硬盘。

 

(1)     拆卸NVMe硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后从硬盘槽位中拔出硬盘。

(2)     拆卸硬盘支架。移除硬盘支架上的所有固定螺钉,并将硬盘从硬盘支架上移除。

6.3.4  安装NVMe硬盘

(1)     安装前,请先确认安装准则,详细信息请参见2.8.2  NVMe硬盘

(2)     (可选)安装硬盘到硬盘支架。将新硬盘安装到拆卸下来的硬盘支架,并使用固定螺钉固定。

(3)     (可选)拆卸待安装NVMe硬盘槽位的假面板。向右按住假面板上的按钮,同时向外拉假面板。

(4)     安装NVMe硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后将硬盘插入硬盘槽位。

(5)     (可选)如果新安装的NVMe硬盘中有RAID信息,请清除。

(6)     请根据实际情况确认是否进行RAID配置,配置RAID的方法请参见产品的BIOS用户指南。

6.3.5  确认工作

可通过以下一种或多种方法判断NVMe硬盘工作状态,以确保NVMe硬盘更换成功。

·     登录HDM Web界面,查看NVMe硬盘容量等信息是否正确。具体方法请参见HDM联机帮助。

·     登录OM Web界面,查看NVMe硬盘是否正确。具体方法请参见OM联机帮助。

·     根据NVMe硬盘指示灯状态,确认NVMe硬盘是否正常工作。指示灯详细信息请参见2.6.1  2. 硬盘指示灯

·     通过BIOS查看NVMe硬盘容量等信息是否正确。

·     进入操作系统后,查看NVMe硬盘容量等信息是否正确。

6.4  更换Riser卡和PCIe卡

介绍如何更换Riser卡和PCIe卡。

6.4.1  操作场景

·     Riser卡故障。

·     PCIe卡故障。

·     安装其他型号的Riser卡。

·     安装其他型号的PCIe卡。

·     扩容Riser卡。

·     扩容PCIe卡。

·     Riser卡和PCIe卡阻碍其他部件维护。

6.4.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解Riser卡和PCIe卡安装准则,具体请参见2.8.4  Riser卡与PCIe卡

6.4.3  拆卸Riser卡和PCIe卡

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸带有PCIe卡的Riser卡。向上提起Riser卡,使其脱离刀片服务器机箱

(3)     拆卸Riser卡上的PCIe卡。

a.     按下固定卡扣上的锁定按钮的同时,打开固定卡扣。

b.     向上提起PCIe卡,使其脱离Riser卡。

6.4.4  安装Riser卡和PCIe卡

(1)     安装PCIe卡到Riser卡。

a.     打开Riser卡上的固定卡扣。按下固定卡扣上的锁定按钮,并将固定卡扣打开。

b.     (可选)拆卸PCIe卡假面板。向上提起假面板,使其脱离Riser卡。

c.     安装PCIe卡到Riser卡。沿着Riser卡上的PCIe连接器插入PCIe卡,然后闭合PCIe卡固定卡扣。

(2)     将带有PCIe卡的Riser卡安装到刀片服务器。

a.     (可选)拆卸假面板。向上提起假面板。

b.     将带有PCIe卡的Riser卡安装到刀片服务器。将Riser卡上的两个蘑菇头对准刀片服务器上的两个豁口,向下插入Riser卡。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

6.5  更换前置Mezz存储控制卡及其掉电保护模块

介绍如何更换前置Mezz存储控制卡。

6.5.1  操作场景

·     前置Mezz存储控制卡故障。

·     更换其他型号的前置Mezz存储控制卡。

·     前置Mezz存储控制卡阻碍其他部件的维护。

·     掉电保护模块故障。

·     掉电保护模块阻碍其他部件的维护。

·     扩容前置Mezz存储控制卡。

·     扩容掉电保护模块。

6.5.2  准备工作

·     更换相同型号的前置Mezz存储控制卡,请明确待更换前置Mezz存储控制卡及BIOS的信息。

¡     前置Mezz存储控制卡的型号、工作模式、固件版本。

¡     明确BIOS的启动模式。

¡     明确Legacy启动模式下前置Mezz存储控制卡的第一启动项设置。

·     更换其他型号的前置Mezz存储控制卡,请提前备份待更换的前置Mezz存储控制卡所控制的硬盘中的数据并清除RAID配置信息。

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解前置Mezz存储控制卡及其掉电保护模块安装准则,具体参见2.8.5  1. 前置Mezz存储控制卡和板载软RAID

6.5.3  拆卸前置Mezz存储控制卡及其掉电保护模块

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)如果已安装超级电容,请断开前置Mezz存储控制卡与超级电容之间的线缆。

(3)     拆卸前置Mezz存储控制卡。移除前置Mezz存储控制卡的固定螺钉,然后将前置Mezz存储控制卡向上提起,使其脱离刀片服务器

6.5.4  安装前置Mezz存储控制卡

(1)     安装前置Mezz存储控制卡。将前置Mezz存储控制卡上的三个螺孔对准主板上的三个螺柱,向下插入前置Mezz存储控制卡,并用螺钉固定。

(2)     (可选)如果选配了超级电容,请安装超级电容到导风罩,并连接前置Mezz存储控制卡和超级电容之间的线缆。

说明

随超级电容发货的附件中有一个超级电容固定座、一根无编码的转接线缆和一根编码为0404A0X1的转接线缆,其中固定座和无编码的转接线缆均用不到。安装超级电容时,请将超级电容直接固定到刀片服务器的导风罩上,且使用编码为0404A0X1的转接线缆来连接存储控制卡与超级电容。

 

a.     安装超级电容到导风罩。斜置电容,将电容一端与电容槽位一端对齐,放入电容槽位,然后将电容另一端放入电容槽位。

b.     连接前置Mezz存储控制卡和超级电容之间的线缆。取出编码为0404A0X1的转接线缆,将转接线缆一端连接到前置Mezz存储控制卡,另一端连接到超级电容。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

6.6  更换后置Mezz RAID

介绍后置Mezz RAID卡更换的详细步骤。

6.6.1  操作场景

·     后置Mezz RAID卡故障。

·     后置Mezz RAID卡阻碍其他部件维护。

6.6.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见对应刀片服务器的用户指南。

·     拆卸刀片服务器,具体步骤请参见对应刀片服务器的用户指南。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解后置Mezz RAID卡的安装准则,具体请参见2.8.5  2. 后置Mezz RAID卡安装准则

6.6.3  拆卸后置Mezz RAID卡

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)拆卸阻碍用户接触待用Mezz卡连接器的其他Mezz卡。

(3)     拆卸后置Mezz RAID卡。用电动螺丝刀拧开后置Mezz RAID卡上的松不脱螺钉,然后向上提起后置Mezz RAID卡,使其脱离刀片服务器。

6.6.4  安装后置Mezz RAID

(1)     (可选)拆卸阻碍用户接触待用Mezz卡连接器的其他Mezz卡。

(2)     安装后置Mezz RAID卡。将后置Mezz RAID卡上的连接器对准刀片服务器后部的Mezz卡连接器,向下插入后置Mezz RAID卡,并用螺钉固定。

(3)     (可选)将拆卸的其他Mezz卡重新安装到位。

(4)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(5)     安装刀片服务器。

(6)     将刀片服务器上电。

6.7  更换直通卡

介绍如何更换直通卡。

6.7.1  操作场景

·     直通卡故障。

·     扩容直通卡。

·     直通卡阻碍其他部件维护。

6.7.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.7.3  拆卸直通卡

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)拆卸阻碍用户接触直通卡的Riser卡和PCIe卡。

(3)     拆卸直通卡。移除直通卡的固定螺钉,握持直通卡中部,将直通卡水平向上提起。需要注意的是,切勿握持直通卡两端提起直通卡,否则可能导致直通卡损坏。

6.7.4  安装直通卡

(1)     安装直通卡。从防静电包装袋中取出待安装的直通卡,对准主板上的连接器,向下插入。然后拧紧2颗螺钉。

(2)     (可选)将拆卸的Riser卡和PCIe卡重新安装。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

6.8  更换GPU

介绍如何更换GPU卡。

6.8.1  操作场景

·     GPU卡故障。

·     扩容GPU卡。

·     GPU卡阻碍其他部件维护。

6.8.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解GPU卡的安装规则,具体请参见2.8.6  GPU卡

6.8.3  拆卸GPU

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸GPU卡。向上提起GPU卡,使其脱离服务器。

2. 安装GPU卡

(1)     安装GPU卡。

a.     (可选)拆卸假面板。向上提起假面板。

b.     将GPU卡上的两个蘑菇头对准刀片服务器上的两个豁口,向下插入GPU卡。

(2)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(3)     安装刀片服务器。

(4)     将刀片服务器上电,具体步骤请参见4.1  上电

6.9  更换网卡

介绍如何更换标准PCIe网卡和Mezz网卡。

6.9.1  操作场景

·     标准PCIe网卡或Mezz网卡故障。

·     扩容标准PCIe网卡或Mezz网卡。

·     更换其他型号的标准PCIe网卡。

·     标准PCIe网卡或Mezz网卡阻碍其他部件维护。

6.9.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解标准PCIe网卡或Mezz网卡的安装准则,具体请参见2.8.7  网卡

1. 拆卸标准PCIe网卡

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸带有标准PCIe网卡的Riser卡。向上提起Riser卡

(3)     拆卸Riser卡上的标准PCIe网卡。按下固定卡扣上的锁定按钮的同时,打开固定卡扣,然后向上提起标准PCIe网卡,使其脱离Riser卡。

2. 安装标准PCIe网卡

(1)     安装标准PCIe网卡到Riser卡。沿着Riser卡上的PCIe插槽插入标准PCIe网卡,并闭合固定卡扣。

(2)     将带有标准PCIe网卡的Riser卡安装到刀片服务器。使Riser卡上的两个蘑菇头对准刀片服务器机箱上的两个豁口,沿PCIe插槽插入Riser卡。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     上电刀片服务器,具体步骤请参见4.1  上电

6.9.3  更换Mezz网卡

1. 拆卸Mezz网卡

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸Mezz网卡。拧开Mezz网卡上的松不脱螺钉,然后向上提起Mezz网卡,使其脱离刀片服务器。

2. 安装Mezz网卡

(1)     (可选)拆卸阻碍用户接触待用Mezz网卡连接器的其他Mezz网卡。

(2)     安装Mezz网卡。将Mezz网卡上的连接器对准主板上的Mezz卡连接器,向下插入Mezz网卡,并用螺钉固定。

(3)     (可选)将拆卸的其他Mezz网卡重新安装。

(4)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(5)     安装刀片服务器。

(6)     将刀片服务器上电,具体步骤请参见4.1  上电

6.10  更换SATA M.2 SSD

介绍如何更换SATA M.2 SSD卡。

6.10.1  操作场景

·     SATA M.2 SSD卡故障。

·     扩容SATA M.2 SSD卡。

·     更换其他型号SATA M.2 SSD卡。

·     SATA M.2 SSD卡阻碍其他部件维护。

6.10.2  准备工作

·     明确待更换SATA M.2 SSD卡在刀片服务器中的安装位置。

·     确保待更换SATA M.2 SSD卡中的数据均做备份保存。如果待更换SATA M.2 SSD卡不在RAID组内或者在无冗余功能的RAID组内,请提前备份SATA M.2 SSD卡上的数据。

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解SATA M.2 SSD卡安装准则,具体请参见2.8.8  SATA M.2 SSD卡

6.10.3  拆卸SATA M.2 SSD

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)拆卸用户接触SATA M.2 SSD卡的Riser卡和PCIe卡。

(3)     拆卸SATA M.2 SSD卡。移除SATA M.2 SSD卡的固定螺钉,然后将SATA M.2 SSD卡从插槽中拔出。

6.10.4  安装SATA M.2 SSD

(1)     斜置SATA M.2 SSD卡,然后将SATA M.2 SSD卡一端插入插槽,另一端向下放置,然后使用固定螺钉固定。

(2)     (可选)安装已拆卸的Riser卡和PCIe卡。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

6.11  更换SATA M.2 SSD模块

介绍如何更换SATA M.2 SSD模块。

6.11.1  操作场景

·     SATA M.2 SSD模块故障。

·     扩容SATA M.2 SSD模块。

·     更换其他型号SATA M.2 SSD模块。

6.11.2  准备工作

·     明确待更换SATA M.2 SSD模块在刀片服务器中的安装位置。

·     确保待更换SATA M.2 SSD模块中的数据均做备份保存。如果待更换SATA M.2 SSD模块不在RAID组内或者在无冗余功能的RAID组内,请提前备份SATA M.2 SSD模块上的数据。

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     如果待更换SATA M.2 SSD模块上已安装操作系统,且SATA M.2 SSD模块未配置RAID或在无冗余功能的RAID组内时,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解SATA M.2 SSD模块安装准则,具体请参见2.8.9  SATA M.2 SSD模块

6.11.3  拆卸SATA M.2 SSD模块

拆卸SATA M.2 SSD模块。握持SATA M.2 SSD模块的手柄,将SATA M.2 SSD模块从槽位中拔出。

6.11.4  安装SATA M.2 SSD模块

(1)     将SATA M.2 SSD模块推入SATA M.2 SSD适配盒。

(2)     (可选)如果已将服务器下电,请将服务器上电,具体参见4.1  上电

(3)     为SATA M.2 SSD模块配置RAID,具体方法请参见产品的存储控制卡用户指南。

6.12  更换SATA M.2 SSD适配盒

介绍如何更换SATA M.2 SSD适配盒。

6.12.1  操作场景

·     扩容SATA M.2 SSD模块。

·     SATA M.2 SSD适配盒故障。

·     SATA M.2 SSD适配盒阻碍其他部件维护。

6.12.2  准备工作

·     了解SATA M.2 SSD适配盒安装准则,具体请参见2.8.10  SATA M.2 SSD适配盒

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     如果SATA M.2 SSD适配盒上安装的SATA M.2 SSD模块已安装操作系统,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.12.3  拆卸SATA M.2 SSD适配盒

(1)     拆卸SATA M.2 SSD适配盒。

a.     按下适配盒上的手柄,此时手柄会自动弹出。

b.     握持手柄,将适配盒从槽位中拔出。

(2)     拆卸SATA M.2 SSD适配盒中的SATA M.2 SSD模块。握持SATA M.2 SSD模块上的手柄,将SATA M.2 SSD模块从槽位中拔出。

6.12.4  安装SATA M.2 SSD适配盒

(1)     安装SATA M.2 SSD模块到SATA M.2 SSD适配盒。将SATA M.2 SSD模块推入槽位。

(2)     将带有SATA M.2 SSD模块的SATA M.2 SSD适配盒安装到刀片服务器。将带有SATA M.2 SSD模块的SATA M.2 SSD适配盒推入槽位。

(3)     (可选)如果已将刀片服务器下电,请将刀片服务器上电,具体步骤请参见4.1  上电

6.13  更换Micro SD

介绍如何更换Micro SD卡。

6.13.1  操作场景

·     Micro SD卡故障。

·     扩容Micro SD卡。

·     Micro SD卡阻碍其他部件维护。

6.13.2  准备工作

·     明确待更换Micro SD卡在刀片服务器中的安装位置。

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.13.3  拆卸Micro SD

(1)     打开Micro SD卡固定盖。向服务器前方轻推以解锁固定盖,然后向上掰起固定盖。

(2)     从槽位中取出Micro SD卡。

6.13.4  安装Micro SD

(1)     安装Micro SD卡。

a.     从防静电包装袋中取出Micro SD卡。

b.     (可选)打开Micro SD卡固定盖。向服务器前方轻推以解锁固定盖,然后向上掰起固定盖。

c.     安装Micro SD卡。金手指朝下,将SD卡放入槽位,闭合并向服务器后方推动固定盖,以锁定固定盖。

(2)     安装刀片服务器。

(3)     将刀片服务器上电,具体步骤请参见4.1  上电

6.14  更换NVMe VROC模块

介绍如何更换NVMe VROC模块。

6.14.1  操作场景

·     NVMe VROC模块故障。

·     扩容NVMe VROC模块。

·     更换其他型号NVMe VROC模块。

·     NVMe VROC模块阻碍其他部件维护。

6.14.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.14.3  拆卸NVMe VROC模块

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)拆卸阻碍用户接触NVMe VROC模块的Riser卡。

(3)     拆卸NVMe VROC模块。将手指伸进NVMe VROC模块的指环中,然后将NVMe VROC模块从连接器中拔出。

6.14.4  安装NVMe VROC模块

(1)     安装NVMe VROC模块。对准主板上的NVMe VROC模块连接器,向下缓缓用力插入NVMe VROC模块。

(2)     (可选)将拆卸的Riser卡和PCIe卡重新安装。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

(6)     (可选)为NVMe硬盘配置RAID,具体方法请参见产品的BIOS用户指南。

6.15  更换内存

介绍如何更换内存。

6.15.1  操作场景

·     内存故障。

·     更换其他型号的内存。

·     扩容内存。

·     内存阻碍其他部件维护。

6.15.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换内存前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换内存前,请拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解内存安装准则,具体请参见2.8.11  内存

6.15.3  拆卸内存

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸阻碍用户接触内存的导风罩。

(3)     拆卸内存。打开内存插槽两侧的固定夹,并向上拔出内存。

6.15.4  安装内存

(1)     (可选)如果是首次安装内存,请打开内存两侧的固定夹。

(2)     安装内存,内存底边的缺口与插槽上的缺口对齐,然后均匀用力将内存沿插槽竖直插入,此时固定夹会自动锁住。请确保固定夹已锁住内存且咬合紧密。

(3)     将拆卸的导风罩重新安装。

(4)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(5)     安装刀片服务器。

(6)     将刀片服务器上电,具体步骤请参见4.1  上电

(7)     (可选)如果需要修改内存的内存模式,请进入BIOS完成操作,具体请参见产品BIOS用户指南。

2. 确认工作

请通过以下任意方式查看显示的内存容量与实际是否一致。

·     操作系统:

¡     Windows操作系统下,点击开始 > 运行,输入msinfo32,在弹出的页面查看内存容量。

¡     Linux操作系统下,可通过cat /proc/meminfo命令查看。

·     OM:

登录OM Web界面,查看内存容量。具体方法请参见OM联机帮助。

·     HDM:

登录HDM Web界面,查看内存容量。具体操作请参见HDM联机帮助。

·     BIOS:

选择Socket Configuration页签 > Memory Configuration > Memory Topology,然后按Enter,即可查看内存容量。

如果显示的内存容量与实际不一致,请重新插拔或更换内存。需要注意的是,当内存的内存模式为Mirror Mode开启了Memory Rank Sparing时,操作系统下显示的内存容量比实际内存容量小属于正常情况。

6.16  更换CPU

介绍如何更换CPU。

6.16.1  操作场景

·     CPU故障。

·     更换其他型号的CPU。

·     CPU阻碍其他部件维护。

6.16.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解CPU的安装准则,具体请参见2.8.12  CPU

6.16.3  拆卸CPU

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸阻碍用户接触CPU散热器的导风罩。

(3)     拆卸CPU散热器。

注意

CPU底座中的针脚极为脆弱,容易损坏。为避免该针脚损坏而导致更换主板,请勿触摸针脚。

 

a.     将电动螺丝刀扭矩调节到1.4N·m,并严格按照CPU散热器表面标签④~①的顺序依次拧开散热器上的松不脱螺钉。

b.     缓缓向上提起CPU和散热器,使其脱离刀片服务器。

(4)     拆卸带有CPU的夹持片。

a.     查找夹持片上的“TIM BREAKER”标识,然后使用扁平工具(例如一字螺丝刀)插入“TIM BREAKER”标识旁边的豁口,轻轻旋转螺丝刀使夹持片从散热器上松开,。

b.     松开夹持片的四个角。将夹持片一角和其对角上的固定弹片向外掰开,夹持片另一角和其对角上的固定弹片向内推入。

c.     将带有CPU的夹持片向上抬起,使其脱离散热器。

(5)     拆卸夹持片中的CPU。

a.     将夹持片一端轻轻向下掰,对应的CPU一端会自动脱离槽位。

b.     从夹持片中取出CPU。

6.16.4  安装CPU

(1)     在CPU上涂抹导热硅脂。

a.     用异丙醇擦拭布将CPU顶部和散热器表面清理干净,如果散热器表面有残余的导热硅脂也要擦拭干净,确保表面干净无油。待异丙醇挥发后再进行下一步操作。

b.     用导热硅脂注射器将导热硅脂挤出0.6ml,然后采用五点法将导热硅脂涂抹在CPU顶部。

(2)     将CPU安装到夹持片。斜置CPU,使CPU一端的导向口与夹持片一端的导向柱相扣。需要注意的是,CPU上带有三角形标记的一角必须和夹持片上带有三角形标记的一角对齐。

(3)     将带有CPU的夹持片安装到散热器。使夹持片上带有三角形标记的一角和散热器上带有缺口的一角对齐,向下放置并按压夹持片,直到听见咔哒提示音,夹持片的四个角和散热器的四个角已紧紧相扣。

(4)     将带有CPU和夹持片的散热器安装到刀片服务器。

注意

请务必将随CPU发货的条码标签,粘贴到散热器侧面,覆盖散热器上原有条码标签,否则将无法提供该CPU的后续保修服务。

 

a.     使夹持片上的三角形和CPU底座上带有缺口的一角对齐,散热器上的两个孔对准CPU底座上的两个导向销,将散热器向下放置在CPU底座上。

b.     依次拧紧散热器上的松不脱螺钉。请严格按照CPU散热器表面标签①~④的顺序固定螺钉,错误的顺序可能会造成螺钉脱落。

(5)     将拆卸的导风罩重新安装。

(6)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(7)     安装刀片服务器。

(8)     将刀片服务器上电,具体步骤请参见4.1  上电

2. 确认工作

可通过以下一种或多种方法判断CPU工作状态,以确保CPU更换成功。

·     登录BIOS界面,查看CPU信息是否正确。具体方法请参见产品BIOS用户指南。

·     登录OM Web界面,查看CPU信息是否正确。具体方法请参见OM联机帮助。

·     登录HDM Web界面,查看CPU信息是否正确。具体操作请参见HDM联机帮助。

6.17  安装CPU选件

介绍安装CPU选件的详细操作步骤。

6.17.1  操作场景

刀片服务器扩容CPU。

6.17.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     安装前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     安装部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:安装目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

·     了解CPU的安装准则,具体请参见2.8.12  CPU

6.17.3  安装CPU选件

(1)     将CPU安装到夹持片。

注意

拿取CPU时,请小心夹持CPU的边缘,勿碰触CPU底面的触点,避免损坏CPU。

 

a.     斜置CPU,使CPU一端的导向口与夹持片一端的导向柱相扣。需要注意的是,CPU上带有三角形标记的一角必须和夹持片上带有三角形标记的一角对齐。

b.     向下放置CPU,确保CPU另一端的导向口与夹持片另一端的导向柱相扣。

(2)     将带有CPU的夹持片安装到散热器

a.     移除散热器上的吸塑盒。将吸塑盒向上提起,使其脱离散热器。

说明

移除吸塑盒时,请注意不要触碰到散热器上的导热硅脂。

 

b.     将带有CPU的夹持片安装到散热器。使夹持片上带有三角形标记的一角和散热器上带有缺口的一角对齐,向下放置并按压夹持片,直到听见咔哒提示音,夹持片的四个角和散热器的四个角已紧紧相扣。

(3)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(4)     拆卸导风罩。向上提起导风罩使其脱离刀片服务器。

(5)     拆卸刀片服务器中CPU底座上的CPU支架。

注意

·     CPU底座中的针脚极为脆弱,容易损坏。为避免因针脚损坏而更换主板,请勿触摸针脚。

·     请保持CPU底座中的针脚清洁,避免将任何杂物掉落到CPU底座中。

 

握持CPU支架并向上提起。请妥善保管CPU支架以备将来使用。

(6)     将带有CPU和夹持片的散热器安装到刀片服务器。

a.     使夹持片上的三角形和CPU底座上带有缺口的一角对齐,散热器上的两个孔对准CPU底座上的两个导向销,将散热器向下放置在CPU底座上。

b.     依次拧紧散热器上的松不脱螺钉。请严格按照CPU散热器表面标签①~④的顺序固定螺钉,错误的顺序可能会造成螺钉脱落。

注意

请使用1.4N·m(12in-lbs)的扭矩拧紧螺钉,否则可能会导致CPU接触不良或者损坏CPU底座中的针脚。

 

(7)     新增CPU后,需安装与CPU对应的内存,内存安装准则请参见2.8.11  内存

(8)     将拆卸的导风罩重新安装。

(9)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(10)     安装刀片服务器。

(11)     将刀片服务器上电,具体步骤请参见4.1  上电

6.18  更换系统电池

介绍如何更换系统电池。

6.18.1  操作场景

缺省情况下,刀片服务器主板上配置有系统电池(型号为Panasonic BR2032)。一般情况下,系统电池寿命为3至5年。

出现以下情况时,请更换系统电池。建议用户选择的电池型号为Panasonic BR2032。

·     电池故障。

·     电池电力消耗完毕,刀片服务器不再自动显示正确的日期和时间。

说明

电池故障或电力消耗完毕,会导致BIOS除BIOS密码以外的信息恢复为缺省设置。更换电池后,如有需要,请重新设置BIOS,具体方法请参见产品的BIOS用户指南。

 

6.18.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.18.3  拆卸系统电池

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     拆卸阻碍用户接触系统电池的2SFF硬盘笼。

a.     拆卸2SFF硬盘背板。握持硬盘背板提手并向上抬起硬盘背板。

b.     拆卸2SFF硬盘框。移除硬盘框的固定螺钉,然后将硬盘框向刀片服务器后方滑动并取出。

(3)     拆卸系统电池。将电池一侧轻轻向上掰起,电池会自动脱离槽位。

说明

拆卸下来的系统电池,请弃于专门的电池处理点,勿随垃圾一起丢弃。

 

6.18.4  安装系统电池

(1)     安装系统电池。

a.     使电池“+”面朝上,将电池放入槽位。

b.     向下按压电池,将其固定到位。

(2)     将拆卸的2SFF硬盘笼重新安装。

a.     安装2FF硬盘框。将硬盘框两侧的蘑菇头对准刀片服务器机箱上的两处豁口,向刀片服务器前方滑动硬盘框使其嵌入到位,然后用螺钉固定硬盘框。

b.     安装2SFF硬盘背板。将硬盘背板两侧对准硬盘框上的两个导槽,向下插入硬盘背板。

(3)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

(6)     请在BIOS中修改日期和时间。BIOS中修改日期和时间的具体方法请参见产品的BIOS用户指南。

6.19  更换主板

介绍如何更换主板。

6.19.1  操作场景

主板故障。

6.19.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.19.3  更换主板

1. 拆卸主板

注意

·     为防止静电释放,当从故障主板上移除敏感电子器件后,请将移除的器件放在防静电工作平台或独立的防静电包装袋中。

·     如果已安装TCM/TPM模块,请勿拆卸该模块,否则可能会导致连接器损坏。

 

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)如果已安装超级电容,请拆卸。

(3)     拆卸所有导风罩。

(4)     (可选)断开主板上的所有线缆。

(5)     拆卸前部2SFF硬盘笼和3SFF硬盘笼的硬盘背板。

·     拆卸前部2SFF硬盘笼。

·     拆卸前部3SFF硬盘笼的3SFF硬盘背板。

(6)     (可选)如果已安装Riser卡和PCIe卡,请拆卸。

(7)     (可选)如果已安装存储控制卡,请拆卸。

(8)     (可选)如果已安装直通卡,请拆卸。

(9)     (可选)如果已安装NVMe VROC模块,请拆卸。

(10)     (可选)如果已安装SATA M.2 SSD卡,请拆卸。

(11)     (可选)如果已安装SATA M.2 SSD卡,请拆卸。

(12)     (可选)如果已安装Mezz网卡,请拆卸。

(13)     (可选)如果已安装Micro SD卡,请拆卸。

(14)     拆卸所有内存。

(15)     拆卸所有CPU和散热器。

(16)     安装CPU支架到所有CPU底座。

(17)     拆卸主板。

a.     拧开主板上的2颗松不脱螺钉。

b.     由于主板上部分连接器(如USB、SUV连接器)嵌入在刀片服务器前面板中,所以需要先往后拉一点,再慢慢抬起。

6.19.4  安装主板

请按照与拆卸相反的顺序和方向,进行安装。

6.20  更换硬盘背板

介绍如何更换硬盘背板。

6.20.1  操作场景

硬盘背板故障。

6.20.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     更换前,请拆卸刀片服务器。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.20.3  拆卸硬盘背板

(1)     拆卸硬盘背板上的所有硬盘。

(2)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(3)     拆卸硬盘背板。握持背板上的提手,将背板向上提起。

6.20.4  安装硬盘背板

(1)     安装硬盘背板。将硬盘背板两侧对准硬盘框上的两个导槽,向下插入硬盘背板。

(2)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(3)     将拆卸的所有硬盘重新安装。

(4)     安装刀片服务器。

(5)     将刀片服务器上电,具体步骤请参见4.1  上电

6.21  安装TPM/TCM模块

介绍TPM/TCM模块的详细安装步骤,以及如何开启TPM/TCM模块功能。

6.21.1  操作场景

扩容TPM/TCM模块。

6.21.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     操作前,请做好业务备份并确保业务已停止运行,并将刀片服务器下电,具体步骤请参见4.2  下电

·     拆卸刀片服务器。

·     操作前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     注意:更换目标部件前,可能会拆卸其他部件。为确保这些部件能正确归位,请在更换前做好标记。比如对部件安装位置拍照、线缆连接方式拍照、用标签标注易混淆的线缆。

6.21.3  安装TPM/TCM模块

1. TPM/TCM模块简介

·     TPM/TCM是内置在主板上的微芯片,拥有独立的处理器和存储单元,用于存储加密信息(如密钥),为刀片服务器提供加密和安装认证服务。TPM需要与驱动器加密技术配合使用,如Microsoft Windows BitLocker驱动器加密技术,BitLocker使用TPM帮助保护Windows操作系统和用户数据,并确保刀片服务器中的数据即使在无人参与、丢失或被盗的情况下也不会被篡改,关于BitLocker的更多信息,请访问Microsoft网站(http://www.microsoft.com)。

·     TPM/TCM模块是可信计算平台的硬件模块,为可信计算平台提供密码运算功能,具有受保护的存储空间。

2. 开启TPM/TCM功能流程

开启TPM/TCM功能的流程如图6-1所示。

图6-1 开启TPM/TCM功能流程

 

3. 安装步骤

(1)     拆卸机箱盖。按下机箱盖解锁按钮并向刀片服务器后方滑动,然后向上抬起机箱盖。

(2)     (可选)拆卸阻碍您接触TPM/TCM连接器的Riser卡和PCIe卡。

(3)     安装TPM模块。

a.     对准主板上的TPM/TCM连接器,向下缓缓用力插入TPM模块。

b.     对准TPM模块上的孔,向下插入销钉。

c.     对准销钉上的孔,向下缓缓用力插入TPM模块的固定铆钉。

(4)     将拆卸的Riser卡和PCIe卡重新安装。

(5)     安装机箱盖。将机箱盖上的蘑菇头对准机箱上的凹槽,水平向下放置机箱盖,并将机箱盖向服务器前方滑动,直到锁定为止。

(6)     安装刀片服务器。

(7)     将刀片服务器上电,具体步骤请参见4.1  上电

4. 在BIOS中开启TPM/TCM功能

(1)     进入BIOS,具体步骤请参见产品的BIOS用户指南。

(2)     选择Advanced页签 > Trusted Computing,然后按Enter

(3)     开启TPM/TCM功能。刀片服务器缺省开启TPM/TCM功能。

·     如果用户安装了TPM模块,请执行以下操作:

a.     选择TPM State > Enabled,然后按Enter

b.     选择TPM版本。单击Device Select,按Enter,然后选择TPM版本。详细信息请参见产品的BIOS用户指南。按F4保存设置。

·     如果用户安装了TCM模块,请执行以下操作:

a.     选择TCM State > Enabled,然后按Enter

b.     选择TCM版本。单击Device Select,按Enter,然后选择TCM版本。详细信息请参见产品的BIOS用户指南。按F4保存设置。

(4)     登录HDM Web界面,查看TPM/TCM模块工作状态是否正常。详细信息请参见HDM联机帮助。

5. 在操作系统中设置加密技术

在操作系统中设置加密技术的详细信息请参见操作系统提供的加密技术文档。

有关Microsoft Windows BitLocker驱动器加密技术的详细信息,请访问Microsoft网站(http://technet.microsoft.com/en-us/library/cc732774.aspx)获取。开启BitLocker驱动器加密技术时,系统会自动生成恢复密钥,您可将该密钥打印或保存到外部存储设备中。系统启动过程中,当BitLocker检测到系统完整性受损或软硬件变更时,数据访问将处于锁定状态,需要用户手动输入该恢复密钥。为确保安全性,保管恢复密钥过程中请注意:

·     为避免恢复密钥丢失,请将密钥保存到多个外部存储设备(例如U盘)中,形成备份。

·     请勿将恢复密钥保存到加密硬盘中。

6. 安装后注意事项

·     禁止拆卸已安装的TPM/TCM模块。一旦安装后,TPM/TCM模块就会成为主板的永久组成部分。

·     为确保信息安全,安装或更换其他部件时,仅用户可以开启TPM/TCM功能或输入恢复密钥,H3C技术人员不能执行上述操作。

·     更换主板时,请勿从主板上拆卸TPM/TCM模块。当用户需要更换主板或更换TPM/TCM模块时,H3C技术人员将提供新的TPM/TCM模块和备用主板。

·     试图从主板上拆卸已安装的TPM/TCM模块,可能会毁坏或损伤TPM/TCM固定铆钉。一旦发现铆钉毁坏或损伤,管理员应认为系统已受损,请采取适当的措施确保系统数据的完整性。

·     H3C对于因TPM/TCM模块使用不当而导致无法访问数据的问题不承担任何责任。更多操作说明请参见操作系统提供的加密技术文档。

·     禁止用户自行拆卸TPM/TCM模块,否则可能会毁坏或损伤TPM/TCM模块的固定铆钉,从而导致系统受损。

·     当您怀疑TPM/TCM模块故障时,请拆卸带有故障TPM/TCM模块的主板,并联系H3C技术人员更换主板和TPM/TCM模块。


7 常用操作

说明

本文中的软件界面可能会不定期更新,请以产品实际显示界面为准。

 

7.1  登录刀片服务器操作系统

7.1.1  本地登录

介绍本地登录的具体步骤。本地登录即通过SUV连接器,连接鼠标、显示器和键盘,完成服务器本地登录。

7.1.2  远程登录

介绍通过OM远程登录的具体步骤。

(1)     登录OM。如图7-1所示,在Web浏览器网址栏输入https://<OM IP地址>,回车,然后输入OM账号、密码单击<登录>。

图7-1 登录OM管理软件

 

(2)     登录刀片服务器。如图7-2所示,在OM管理页面中单击“计算节点管理>对应刀片服务器>远程控制台><KVM>或<H5 KVM>”。

图7-2 登录刀片服务器

 

 

7.2  登录刀片服务器HDM

(1)     登录OM。如图7-3所示,在Web浏览器网址栏输入https://<OM IP地址>,回车,然后输入OM账号、密码单击<登录>。

图7-3 登录OM管理软件

 

(2)     登录HDM。如图7-4所示,在OM管理页面中单击“计算节点管理>对应刀片服务器>远程控制台>免认证登录”。

图7-4 登录HDM


8 日常维护指导

介绍刀片服务器的日常维护方法。

8.1  维护基本原则

·     刀片服务器所在机房应保持整洁,温度和湿度符合服务器运行要求,机房内不放置无关设备和物品。

·     定期通过HDM或OM检查刀片服务器的健康状态,如果不健康,则需要立即检查并排除故障。

·     了解操作系统和应用软件最近的更新情况,并根据需求更新软件。

·     制定可靠的备份计划。

¡     根据刀片服务器的运行情况,定时备份数据。

¡     如果数据频繁改变则需随时备份。

¡     定时检查备份以确保数据保存正确。

·     现场保留一定数量的备件,以便部件出现故障时可及时更换。备件使用后,请及时补充。

·     为方便解决组网方面的问题,请保存最新的网络拓扑图。

8.2  维护工具

维护刀片服务器需要以下工具:

·     通过温湿度计监控刀片服务器运行环境。

·     通过HDM和OM监控刀片服务器运行状态。

8.3  维护操作

介绍刀片服务器的日常维护任务操作和操作方法。

8.3.1  任务列表

日常维护任务如表8-1所示。

表8-1 日常维护任务

任务

所需工具

查看服务器监控指示灯

/

监测机房温度和湿度

温湿度计

查看服务器状态

/

收集服务器日志

/

升级服务器固件

/

 

8.3.2  查看服务器监控指示灯

检查刀片服务器前面板上的所有指示灯状态是否正常。关于指示灯的详细说明,请参见2.4.2  指示灯和按钮

8.3.3  监测机房温度和湿度

请使用温湿度计测量机房温度和湿度,确保温湿度控制在服务器的工作范围内。关于服务器工作和贮存环境温湿度要求,请参见2.2.2  技术参数

8.3.4  查看服务器状态

·     查看刀片服务器的健康状态、运行状态、上电状态等状态信息,具体操作请参见OM联机帮助的“状态诊断”章节。

·     查看刀片服务器各子系统的基本状态信息,具体操作请参见HDM联机帮助的“基本状态”章节。

8.3.5  收集服务器日志

收集刀片服务器日志信息的具体操作请参见《OM日志信息参考》的“如何获取日志信息”章节或OM联机帮助的“日志收集”章节。

8.3.6  升级服务器固件

升级刀片服务器HDM、BIOS、CPLD等部件固件版本的具体操作请参见《H3C UIS 9000一体机 升级指导》。

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们