• 产品与解决方案
  • 行业解决方案
  • 服务
  • 支持
  • 合作伙伴
  • 新华三人才研学中心
  • 关于我们

H3C UIS 5300 G3系列超融合一体机 安装部署指导-5W101

  • 发布时间:2022/2/9 16:36:46
  • 浏览量:
  • 下载量:

01-正文

本章节下载  (8.14 MB)

docurl=/cn/Service/Document_Software/Document_Center/H3Cloud/Catalog/H3C_UIS/H3C_UIS_5300_G3/Installation/Installation_Manual/H3C_UIS_5300_G3_IG-1876/202202/1542118_30005_0.htm

01-正文

目 

1 安全

1.1 安全信息

1.1.1 运行安全

1.1.2 电气安全

1.1.3 电池安全

1.2 安全注意事项

1.3 静电防护

1.3.1 防止静电释放

1.3.2 防止静电释放的接地方法

1.4 设备标识

2 认识H3C UIS 5300 G3系列超融合一体机

2.1 简介

2.1.1 超融合硬件服务器

2.1.2 超融合内核和管理软件

2.2 规格参数

2.2.1 产品规格

2.2.2 技术参数

2.3 GPU配置方案

2.4 部件

2.5 前面板

2.5.1 服务器前面板组件

2.5.2 指示灯和按钮

2.5.3 接口

2.6 后面板

2.6.1 后面板组件

2.6.2 后面板指示灯

2.6.3 接口

2.7 GPU计算模块

2.7.1 GPU计算模块类型

2.7.2 GPU节点板布局

2.8 主板

2.8.1 主板布局

2.8.2 内存插槽

2.9 硬盘

2.9.1 硬盘配置

2.9.2 硬盘编号

2.9.3 硬盘指示灯

2.10 风扇模块

2.11 安装准则

2.11.1 SAS/SATA硬盘安装准则

2.11.2 NVMe硬盘安装准则

2.11.3 电源模块安装准则

2.11.4 存储控制卡及掉电保护模块安装准则

2.11.5 GPU卡安装准则

2.11.6 网卡安装准则

2.11.7 SATA M.2 SSD卡安装准则

2.11.8 风扇模块安装准则

2.11.9 CPU安装准则

2.11.10 内存安装准则

3 安装和拆卸 UIS 5300 G3

3.1 安装流程

3.2 安装规划

3.2.1 机柜要求

3.2.2 空间和通风要求

3.2.3 温度和湿度要求

3.2.4 高度要求

3.2.5 洁净度要求

3.2.6 接地要求

3.3 工具准备

3.4 安装 UIS 5300 G3

3.4.1 安装滑道

3.4.2 安装UIS 5300 G3

3.4.3 (可选)安装理线架

3.5 连接外部线缆

3.5.1 连接鼠标、键盘和VGA接口线缆

3.5.2 连接网线

3.5.3 连接USB接口

3.5.4 连接电源线缆

3.5.5 固定线缆

3.5.6 布线指导

3.6 拆卸UIS 5300 G3

4 上电和下电

4.1 上电

4.1.1 操作场景

4.1.2 前提条件

4.1.3 操作步骤

4.2 下电

4.2.1 操作场景

4.2.2 前提条件

4.2.3 操作步骤

5 配置UIS 5300 G3

5.1 上电启动

5.2 更新固件

5.3 超融合管理平台初始化部署及软件注册

6 更换部件

6.1 可更换部件

6.2 安装和拆卸所有模块假面板

6.3 更换安全面板

6.3.1 更换场景

6.3.2 更换步骤

6.4 更换SAS/SATA硬盘

6.4.1 更换场景

6.4.2 准备工作

6.4.3 更换步骤

6.5 更换NVMe硬盘

6.5.1 更换场景

6.5.2 准备工作

6.5.3 更换步骤

6.6 更换电源模块

6.6.1 更换场景

6.6.2 准备工作

6.6.3 更换步骤

6.7 更换GPU卡

6.7.1 更换场景

6.7.2 准备工作

6.7.3 更换步骤

6.8 更换网卡

6.8.1 更换场景

6.8.2 准备工作

6.8.3 更换步骤(适用于OCP网卡)

6.8.4 更换步骤(适用于标准PCIe网卡)

6.9 更换OCP转接模块

6.9.1 更换场景

6.9.2 准备工作

6.9.3 更换步骤

6.10 更换存储控制卡及其掉电保护模块

6.10.1 操作场景

6.10.2 准备工作

6.10.3 更换Mezz存储控制卡及其掉电保护模块

6.10.4 更换标准存储控制卡及其掉电保护模块

6.11 更换SATA M.2 SSD卡

6.11.1 更换场景

6.11.2 准备工作

6.11.3 更换步骤

6.12 更换NVMe VROC模块

6.12.1 更换场景

6.12.2 准备工作

6.12.3 更换步骤

6.13 更换风扇模块

6.13.1 更换场景

6.13.2 准备工作

6.13.3 更换步骤

6.14 更换CPU

6.14.1 更换场景

6.14.2 准备工作

6.14.3 更换步骤

6.14.4 确认工作

6.15 更换内存

6.15.1 更换场景

6.15.2 准备工作

6.15.3 更换步骤

6.15.4 确认工作

6.16 更换硬盘背板

6.16.1 更换场景

6.16.2 更换步骤

6.17 安装24LFF硬盘扩展模块

6.17.1 应用场景

6.17.2 安装步骤

6.18 更换电源转接板

6.18.1 更换场景

6.18.2 准备工作

6.18.3 更换步骤

6.19 更换CPU主板

6.19.1 更换场景

6.19.2 准备工作

6.19.3 更换步骤

6.20 更换节点板

6.20.1 更换场景

6.20.2 准备工作

6.20.3 更换步骤

6.21 更换系统电池

6.21.1 更换场景

6.21.2 准备工作

6.21.3 更换步骤

6.22 更换智能挂耳

6.22.1 更换场景

6.22.2 准备工作

6.22.3 更换步骤

6.23 安装TPM/TCM模块

6.23.1 操作场景

6.23.2 准备工作

6.23.3 安装TPM/TCM模块

7 布线

7.1 连接硬盘线缆

7.1.1 12LFF硬盘配置

7.1.2 24LFF硬盘配置

7.2 连接GPU计算模块线缆

7.2.1 连接8GPU-AI线缆

7.2.2 连接8GPU-HPC线缆

7.2.3 连接16GPU线缆

7.3 连接GPU卡电源线缆

7.4 连接超级电容线缆

7.4.1 连接Mezz存储控制卡的超级电容线缆

7.4.2 连接标准存储控制卡的超级电容线缆

7.5 连接智能挂耳线缆

8 日常维护指导

8.1 基本维护原则

8.2 维护工具

8.3 维护操作

8.3.1 任务列表

8.3.2 查看服务器监控指示灯

8.3.3 监测机房温度和湿度

8.3.4 检查线缆

 

 


1 安全

1.1  安全信息

操作服务器之前,请仔细了解以下安全信息。

1.1.1  运行安全

·     H3C授权人员或专业的服务器工程师才能运行该服务器。

·     请将服务器放在干净、平稳的工作台或地面上进行维护。

·     运行服务器前,请确保所有线缆均连接正确。

·     为确保服务器充分散热,服务器上的空闲槽位(比如硬盘、后面板上的OCP网卡、PCIe卡和电源模块的空闲槽位)必须安装假面板。

·     为避免散热不充分而损坏服务器,请勿阻塞服务器的通风孔。

·     为确保服务器充分散热,请不要在未安装机箱盖、导风罩、PCIe卡/硬盘/电源模块假面板的情况下运行服务器。维护机箱内部的热插拔组件时,请最大限度地减少机箱盖打开的时间。

·     为避免组件表面过热造成人身伤害,请确保设备和内部系统组件冷却后再操作。

·     当服务器与其他设备上下叠加安装在机柜中时,请确保两个设备之间留出垂直方向2mm以上的空隙。

1.1.2  电气安全

警告

前面板上的“开机/待机”按钮不能彻底切断系统电源,此时部分电源和内部电路仍在工作,为避免人身伤害、触电或设备损坏,请将服务器完全断电,即先按下“开机/待机”按钮,当系统电源指示灯变为橙色常亮时,将服务器上的所有电源线拔出。

 

·     为避免人身伤害或服务器损坏,请使用随机附带的电源线缆。

·     电源线缆只能用于配套的服务器,请勿在其他设备上使用。

·     为避免触电风险,在安装或拆卸任何非热插拔部件时,请先将设备下电。

1.1.3  电池安全

服务器管理模块上配置有系统电池,一般情况下,电池寿命为5~10年。

当服务器不再自动显示正确的日期和时间时,需更换电池。更换电池时,请注意以下安全措施:

·     请勿尝试给电池充电。

·     请勿将电池置于60°C以上的环境中。

·     请勿拆卸/碾压/刺穿电池、使电池外部触点短路或将其投入火中/水中。

·     请将电池弃于专门的电池处理点,勿随垃圾一起丢弃。

1.2  安全注意事项

说明

为避免电源波动或临时断电对服务器造成影响,建议使用UPS为服务器供电。这种电源可防止服务器硬件因电涌和电压峰值的影响而受损,并且可在电源故障时确保服务器正常运行。

 

为避免人身伤害或设备损坏,操作服务器时,还需注意以下事项:

·     服务器必须安装在标准19英寸机柜中。

·     机柜的支撑脚要完全触地,且机柜的全部重量应由支撑脚承担。

·     当有多个机柜时,请将机柜连接在一起。

·     请做好机柜安装的部署工作,将最重的设备安装在机柜底部。安装顺序为从机柜底部到顶部,即优先安装最重的设备。

·     将服务器安装到机柜或从机柜中拉出时(尤其当服务器脱离滑道时),要求四个人协同工作,以平稳抬起服务器。当安装位置高于胸部时,则可能需要第五个人帮助调整服务器的方位。

·     每次只能从机柜中拉出一台设备,否则会导致机柜不稳固。

·     将服务器从机柜中拉出或推入前,请确保机柜稳固。

·     为确保充分散热,请在未使用的机柜位置安装假面板。

1.3  静电防护

1.3.1  防止静电释放

人体或其它导体释放的静电可能会损坏对静电敏感的部件,由静电造成的损坏会缩短部件的使用寿命。

为避免静电损害,请注意以下事项:

·     在运输和存储设备时,请将部件装入防静电包装中。

·     将静电敏感部件送达不受静电影响的工作区前,请将它们放在防静电包装中保管。

·     先将部件放置在防静电工作台上,然后再将其从防静电包装中取出。

·     在没有防静电措施的情况下,请勿触摸组件上的插针、线缆和电路元器件等静电敏感元件。

1.3.2  防止静电释放的接地方法

在取放或安装部件时,用户可采取以下一种或多种接地方法以防止静电释放。

·     佩戴防静电腕带,并将腕带的另一端良好接地。请将腕带紧贴皮肤,且确保其能够灵活伸缩。

·     在工作区内,请穿上防静电服和防静电鞋,并佩戴防静电手套。

·     请使用导电的现场维修工具。

·     请使用防静电的可折叠工具垫和便携式现场维修工具包。

1.4  设备标识

为避免维护服务器过程中可能造成的任何伤害,请熟悉服务器上可能出现的安全标识。

表1-1 安全标识

图示

说明

警告

该标识表示存在危险电路或触电危险。所有维修工作应由H3C授权人员或专业的服务器工程师完成。

警告

为避免电击造成人身伤害,请勿打开符号标识部件。所有维护、升级和维修工作都应由H3C授权人员或专业的服务器工程师完成。

该标识表示存在触电危险。不允许用户现场维修此部件。用户任何情况下都不能打开此部位。

警告

为避免电击造成人身伤害,请勿打开符号标识部件。

该标识表示存在高温表面或组件。如果触摸该表面或组件,可能会造成人身伤害。

警告

为避免组件表面过热造成人身伤害,请确保服务器和内部系统组件冷却后再操作。

该标识表示组件过重,已超出单人安全取放的正常重量。

警告

为避免人身伤害或设备损坏,请遵守当地关于职业健康与安全的要求,以及手动处理材料的指导。

电源或系统上的这些标识表示服务器由多个电源模块供电。

警告

为避免电击造成人身伤害,请先断开所有电源线缆,并确保服务器已完全断电。

 


2 认识H3C UIS 5300 G3系列超融合一体机

说明

·     本手册为产品通用资料。对于定制化产品,请用户以产品实际情况为准。

·     本手册中,所有部件的型号都做了简化(比如删除前缀和后缀)。比如内存型号DDR4-2666-8G-1Rx8-R,代表用户可能看到的以下型号:UN-DDR4-2666-8G-1Rx8-R、UN-DDR4-2666-8G-1Rx8-R-F、UN-DDR4-2666-8G-1Rx8-R-S。

·     图片仅供参考,具体请以实物为准。

2.1  简介

H3C UIS 5300 G3系列超融合一体机是H3C自主研发的新一代业界领先的UIS 6.5超融合解决方案产品,基于新华三全新自研的机架服务器集成计算虚拟化、网络虚拟化、存储虚拟化、安全虚拟化、运维监控管理、云业务流程交付等软件技术,利用高速网络聚合多套超融合设备,实现资源模块化的横向弹性伸缩,形成统一的计算与存储资源池,不仅可以精简数据中心服务器数量,整合数据中心IT基础设施资源,精简IT操作,提高管理效率,达到提高物理资源利用率和降低整体拥有成本的目的,而且,利用先进的云管理理念和互联网化的软件定义存储技术,建立安全的、可审核的、资源可按需调配和近线性扩展的数据中心环境,为业务部门提供成本更低、服务水平更高的基础架构,从而能够针对业务部门的需求做出快速的响应。

H3C UIS 5300 G3系列超融合一体机由超融合硬件服务器、超融合内核和管理软件三部分构成,软硬件在实验室完成充分预优化与预验证,供应链预集成与预安装,并可根据客户对硬件配件的要求灵活自定义,超融合一体机设备到达客户现场之后,开箱即云,简化现场实施部署复杂度,加速业务上线速度与效率。

2.1.1  超融合硬件服务器

H3C UIS 5300 G3是一款面对人工智能应用场景的超融合一体机,最大可配置8块双宽GPU或20块单宽GPU,可提供全所未有的GPU资源。基于标准的4U机架式服务器,支持2颗英特尔®至强®可扩展处理器,可配置Skylake系列或者Cascade Lake系列,搭载最新的2933MHz或者AEP内存条。针对CPU/GPU异构计算特点,采用PCIe4.0通信链路设计,可以实现GPU之间高速低延迟的数据通信,为用户带来卓越性能体验。另外为主机配置了高速低延迟的网络适配器、NVMe驱动器并对最新的APE内存进行了适配,可提供更强大的性能。系统采用易用访问的模块化设计,更加方便维护和升级。N+N的冗余电源与N+1热插拔冗余风扇保证系统安全稳定运行。优化的散热设计,降低系统功耗,节约运行成本。

服务器的外观如图2-1所示。

图2-1 服务器外观

 

2.1.2  超融合内核和管理软件

1. 超融合内核

UIS超融合内核集成了H3C CAS计算虚拟化软件。CAS是面向数据中心的企业级虚拟化软件,提供强大的虚拟化功能和资源池管理能力,独有的内核数据加速、存储块多队列等技术,极大提升业务在虚拟机中的运行效率,相同硬件条件下,国际权威虚拟化性能基准测试SPECvirt表现最优,并提供业内创新性的动态资源扩展(Dynamic Resource eXtension,DRX)、无代理杀毒、云彩虹等技术。

UIS超融合内核集成了H3C UIS-ONEStor存储软件。UIS-ONEStor是业内领先的软件定义存储产品,提供多维度的数据保护机制,支持以卷为单位设置数据的冗余策略,纠删码、多副本机制灵活选择,无需热备盘即可快速完成数据重构。UIS-ONEStor提供丰富的企业级特性,支持用户数据强一致性,保障数据可靠安全。

UIS超融合内核集成了UIS-Sec网络、安全虚拟化组件,为租户提供NFV形态的网络、安全服务。可提供vFW(虚拟防火墙)、vRouter(虚拟路由器)、vLB(虚拟负载均衡)、vDBA(虚拟数据库审计)、vACG(虚拟应用控制网关)、vNGFW(虚拟下一代防火墙)、vWAF(虚拟WEB应用防火墙)等服务,实现虚拟机互访控制、安全防护以及多租户的安全隔离。

2. H3C UIS超融合管理平台

H3C UIS超融合管理平台可提供数据中心基础资源的统一门户,通过单点登录方式,提供对数据中心内服务器、虚拟机、网络、存储、上层业务等资源的一体化管理,可以支持大屏展示、健康度检查与一键巡检、数据中心资源统计报表、所画即所得部署业务,使运维可视化、自动化、智能化,无需跳转不同的管理界面就可实现对数据中心统一管理。同时,H3C UIS超融合管理平台还可以实现集群的分级管理和自助服务,在大规模分布式部署或者分支机构场景下,H3C UIS超融合管理平台可实现多个集群和租户进行的统一管理和虚拟资源的自助申请。

 

2.2  规格参数

介绍服务器的产品规格和技术参数。

2.2.1  产品规格

说明

产品规格的计算,以产品支持的所有部件为基准。比如单颗CPU最大支持功耗,是以所有CPU中功耗最大的为准进行计算的。对于定制化产品,请用户以产品实际情况为准。

 

表2-1 产品规格

功能特性

说明

处理器

最多支持2路Intel Purley CPU

·     单颗CPU最大支持功耗205W

·     最高主频支持3.6GHz

·     单颗CPU三级缓存最高支持38.5MB

·     单颗CPU最高支持28个计算核心

内存

最多可支持24根DRAM内存,支持DRAMDCPMM内存,单根内存最大支持的频率为2933MHz

存储控制卡

l     支持板载RSTe阵列控制器

l     高性能存储控制卡

l     NVMe VROC模块

芯片组

Intel C621 Lewisburg芯片组

网络接口

l     板载1个1Gbit/s HDM专用网络接口

l     1OCP网卡插槽,可以选配OCP3.0网卡

I/O端口

·     最多支持5USB 3.0接口(前面板1个,后面板2个,主板2个)和2USB 2.0接口(前面板)

·     内置1x4 Mini-SAS-HD接口、3x8 SlimSAS接口、4x16 LP SlimSAS接口

·     1RJ45 HDM专用网络接口(后面板)

·     最多支持2VGA接口(前面板1个,后面板1个)

·     支持1BIOS串口(后面板)

扩展插槽

·     主板:支持1Mezz存储控制卡专用插槽和1OCP网卡专用插槽

·     8GPU节点板:最多支持12PCIe可用插槽,其中最多可以支持10PCIe4.0插槽和2PCIe3.0插槽

·     16GPU节点板:最多支持20PCIe3.0可用插槽

电源

4个热插拔电源模块,支持N+N冗余

认证

通过CQCSEPACE EMCCE RoHSFCC EMCICESVCCI等认证

 

2.2.2  技术参数

表2-2 技术参数

类别

项目

说明

物理参数

尺寸(高xx深)

不含安全面板及挂耳:174.8mm x 447mm x 807mm

最大重量

63kg

环境参数

温度

工作环境温度:5°C40°C

说明

某些配置下,服务器支持的最高工作环境温度会降低,具体请参见附录中的“工作环境温度规格”章节。

贮存环境温度:-40°C~70°C

湿度

·     工作环境湿度:8%90%(无冷凝)

·     贮存环境湿度:5%95%(无冷凝)

海拔高度

·     工作环境高度:-60m3000m(海拔高于900m时,每升高100m,规格最高温度降低0.33°C

·     贮存环境高度:-60m~5000m

 

2.3  GPU配置方案

服务器包括3种GPU配置方案,以满足不同应用场景的需求,GPU模块的详细信息请参见2.7  GPU计算模块

·     8GPU-AI

适合深度学习应用,特别适用于能够轻易、有效地在GPU卡上直接产生代码的应用。该GPU配置方案最多支持8张全高全长双宽GPU卡,8张GPU卡从属于1个CPU。该GPU配置方案线缆连接方式请参见7.2.1  连接8GPU-AI线缆

·     8GPU-HPC

适合大多数的HPC应用,适用于CPU和GPU卡频繁通信的场景。该GPU配置方案最多支持8张全高全长双宽GPU卡,8张GPU卡从属于2个CPU。该GPU配置方案线缆连接方式请参见7.2.2  连接8GPU-HPC线缆

·     16GPU

适合推理场景。该GPU配置方案支持16张半高半长单宽GPU卡和4个PCIe3.0插槽,最多支持20张半高半长单宽GPU卡,20张GPU卡从属于2个CPU。该GPU配置方案线缆连接方式请参见7.2.3  连接16GPU线缆

2.4  部件

介绍服务器各部件含义。

图2-2 服务器部件

 

表2-3 服务器部件说明

序号

名称

说明

1

GPU扩展笼

用于安装GPU节点板,安装了GPU节点板的扩展笼统称GPU计算模块。

2

16GPU节点板

最多支持安装20张半高半长单宽GPU卡,其中4个槽位可选标准半长单宽PCIe卡。GPU节点板经过GPU电源转接板进行供电,当GPU计算模块被抽出时,GPU节点板将断电。

3

8GPU节点板

最多支持安装8张全高全长双宽GPU卡和4张标准半长单宽PCIe卡。GPU节点板经过GPU电源转接板进行供电,当GPU计算模块被抽出时,GPU节点板将断电。

4

主板

服务器最重要的部件之一,用于安装CPU、内存和风扇等,集成了服务器的基础元器件,包括BIOS芯片、PCIe插槽等。

5

风扇笼

用于安装风扇模块。

6

安全面板

-

7

导风罩

为CPU散热器和内存提供散热风道,同时为超级电容提供安装位置。

8

24LFF硬盘背板

为24LFF硬盘供电并提供数据传输通道。

9

GPU稳定架

帮助固定在位的GPU,提升GPU的稳定性。

10

12LFF硬盘背板

为12LFF硬盘供电并提供数据传输通道。

11

机箱

机箱将所有部件集中到一起。

12

机箱盖

-

13

CPU夹持片

用于将CPU固定到散热器。

14

CPU

集成内存控制器和PCIe控制器,为服务器提供强大的数据处理功能。

15

CPU散热器

用于为CPU散热。

16

风扇模块

为服务器散热提供动力,支持热插拔,支持7+1冗余。

17

硬盘

为服务器提供数据存储介质,支持热插拔。

18

OCP转接模块

用于安装OCP网卡。

19

OCP网卡

一种网卡,安装在机箱后部,可以在不打开机箱盖的情况下进行安装和更换。

20

左挂耳(含开箱检测模块)

用于将服务器固定到机柜,其中左侧挂耳集成了开箱检测模块,同时带VGA和USB 2.0接口。

开箱检测模块用于检测机箱盖是否被打开,检测结果通过HDM界面显示。

21

右挂耳

用于将服务器固定到机柜,其中右侧挂耳中集成了前面板I/O组件。

22

超级电容

用于在系统意外掉电时为存储控制卡上的Flash卡供电,实现存储控制卡上数据的掉电保护。

23

坦克链

用于包裹GPU数据线缆和AUX信号线缆,确保在抽拉GPU计算模块时,机箱内的线缆保持整齐有序

24

电源模块

为服务器运行提供电力转换功能。电源模块支持热插拔,支持N+N冗余。

25

GPU

为服务器提供图像处理和人工智能等计算服务。

26

Mezz存储控制卡

一种存储控制卡,仅支持安装到主板上的Mezz存储控制卡插槽。

27

GPU电源转接板

安装在主板的通流铜柱上,为GPU计算模块供电。

28

加密模块

用于为服务器提供加密服务,提高服务器数据安全性。

29

NVMe VROC模块

NVMe VROC模块用于激活NVMe硬盘阵列特性,配合VMD技术实现NVMe硬盘阵列功能。

30

系统电池

为系统时钟供电,确保系统日期和时间正确。

31

SATA M.2 SSD卡

为服务器提供数据存储介质

32

内存

用于暂时存放CPU中的运算数据,以及与硬盘等外部存储设备交换的数据。

 

2.5  前面板

介绍计算模块前面板上的组件和服务器前面板上的组件、指示灯含义和接口用途。

2.5.1  服务器前面板组件

图2-3 前面板-24LFF硬盘

 

表2-4 前面板-24LFF硬盘组件说明

编号

说明

1

VGA接口

2

USB 2.0接口(2个)

3

抽拉式资产标签

4

24LFF SAS/SATA硬盘

5

可选NVMe硬盘

6

USB 3.0接口

 

图2-4 前面板-12LFF硬盘

 

表2-5 前面板-12LFF硬盘组件说明

编号

说明

1

VGA接口

2

USB 2.0接口(2个)

3

抽拉式资产标签

4

8LFF SAS/SATA硬盘

5

4LFF NVMe硬盘

6

USB 3.0接口

 

2.5.2  指示灯和按钮

图2-5 前面板指示灯和按钮

 

表2-6 前面板指示灯说明

编号

说明

状态

1

开机/待机按钮和系统电源指示灯

·     绿灯常亮:系统已启动

·     绿灯闪烁(1Hz):系统正在开机

·     橙灯常亮:系统处于待机状态

·     灯灭:未通电

2

UID按钮/指示灯

·     蓝灯常亮:UID指示灯被激活。UID指示灯可通过以下任意方法被激活:

¡     UID按钮被按下

¡     通过HDM开启UID指示灯

·     蓝灯闪烁:

¡     1Hz:系统正在被HDM远程管理或固件升级

¡     4Hz:HDM正在重启(长按UID按钮/指示灯10秒可重启HDM)

·     灯灭:UID指示灯未激活

3

Health指示灯

·     绿灯常亮:系统状态正常

·     橙灯闪烁(1Hz):系统出现一般性告警

·     红灯闪烁(1Hz):系统出现严重错误告警

4

OCP网卡以太网接口指示灯

·     绿灯常亮:网口链路已经连通

·     绿灯闪烁(1Hz):网口正在接收或发送数据

·     灯灭:网口链路没有连通

·     如果Health指示灯显示系统出现问题,请通过HDM查看系统运行状态。

·     系统电源指示灯灭的原因可能有:没有接通电源、未安装电源模块、电源模块故障或系统电源指示灯线缆未连接。

 

2.5.3  接口

表2-7 前面板接口

接口名称

类型

用途

USB接口

USB 3.0/2.0

用于连接USB设备,以下情况下需要使用该接口:

·     连接U盘

·     连接USB键盘或鼠标

·     安装操作系统时,连接USB光驱

VGA接口

DB15

用于连接显示终端,如显示器或KVM设备

 

2.6  后面板

介绍服务器后面板上的组件、指示灯含义和接口用途。

2.6.1  后面板组件

图2-6 后面板组件-8GPU计算模块

 

图2-7 后面板组件-16GPU计算模块

 

表2-8 后面板组件说明

编号

说明

1

GPU计算模块

2

抽拉式资产标签

3

电源模块1

4

电源模块2

5

BIOS串口

6

USB 3.0接口(2个)

7

HDM专用网络接口(1Gb/s,RJ45,缺省IP地址:192.168.1.2/24)

8

可选OCP3.0网卡

9

VGA接口

10

电源模块3

11

电源模块4

 

2.6.2  后面板指示灯

图2-8 后面板指示灯

 

表2-9 后面板指示灯说明

编号

说明

状态

1、2、6、7

电源模块状态指示灯

·     绿灯常亮:电源模块工作正常

·     绿灯闪烁(1Hz):电源模块输入正常,系统处于待机状态未上电

·     绿灯闪烁(0.33Hz):电源模块处于备用电源模式,无功率输出

·     绿灯闪烁(2Hz):电源模块处于固件更新状态

·     橙灯常亮:

¡     电源模块出现严重故障

¡     该电源模块无输入,其他电源模块最少有1块输入正常

·     橙灯闪烁(1Hz):电源模块出现告警

·     灯灭:电源模块无输入,存在以下一种或两种情况:

¡     电源线缆连接故障

¡     外部供电系统断电

3

UID指示灯

·     蓝灯常亮:UID指示灯被激活。UID指示灯可通过以下任意方法被激活:

¡     UID按钮被按下

¡     通过HDM开启UID指示灯

·     蓝灯闪烁:

¡     1Hz:系统正在被HDM远程管理或固件升级

¡     4Hz:HDM正在重启(长按UID按钮/指示灯10秒可重启HDM)

·     灯灭:UID指示灯未激活

4

以太网接口连接状态指示灯

·     绿色常亮:网口链路已经连通

·     灯灭:网口链路没有连通

5

以太网接口数据传输状态指示灯

·     绿色闪烁(1Hz):网口正在接收或发送数据

·     灯灭:网口没有接收或发送数据

 

2.6.3  接口

表2-10 后面板接口

接口名称

类型

用途

HDM专用网络接口

RJ45

用于登录HDM管理界面,进行服务器管理

USB接口

USB 3.0

用于连接USB设备,以下情况下需要使用该接口:

·     连接U盘

·     连接USB键盘或鼠标

·     安装操作系统时,连接USB光驱

VGA接口

DB15

用于连接显示终端,如显示器或KVM设备

BIOS串口

RJ45

·     服务器网络故障,远程连接服务器失败时,可通过连接服务器的BIOS串口,登录服务器进行故障定位

·     用于加密狗、短信猫等应用

电源接口

标准单相电源接头

用于连接电源模块和外部供电系统,为设备供电

 

2.7  GPU计算模块

介绍如下内容:

·     服务器支持的GPU计算模块类型。

·     每种GPU计算模块节点板布局(简称GPU节点板)。

2.7.1  GPU计算模块类型

服务器支持2种类型的GPU计算模块:8GPU计算模块和16GPU计算模块。

·     8GPU计算模块:最多支持安装8张全高全长双宽GPU卡和4张标准半长单宽PCIe卡。

·     16GPU计算模块:最多支持安装20张半高半长单宽GPU卡,其中4个槽位可选标准半长单宽PCIe卡。

2.7.2  GPU节点板布局

介绍2种GPU节点板布局。

1. 16GPU节点板布局

图2-9 16GPU节点板布局

 

表2-11 16GPU节点板布局说明

编号

说明

1

PCIe slot 4

2

PCIe slot 3

3

从右到左依次为PCIe slot 7~22(用户位于服务器前方)

4

PCIe slot 2

5

PCIe slot 1

6

x16 LP SlimSAS接口N1

7

x16 LP SlimSAS接口N3

8

x16 LP SlimSAS接口N5

9

x16 LP SlimSAS接口N6

10

GPU节点AUX接口

 

2. 8GPU节点板布局

图2-10 8GPU节点板布局

 

表2-12 8GPU节点板布局说明

编号

说明

1

PCIe slot 4

2

PCIe slot 3

3

从右到左依次为PCIe slot 7~14(用户位于服务器前方)

4

PCIe slot 2

5

PCIe slot 1

6

GPU电源接口(8个)

7

x16 LP SlimSAS接口N1

8

x16 LP SlimSAS接口N3

9

x16 LP SlimSAS接口N2

10

x16 LP SlimSAS接口N4

11

x16 LP SlimSAS接口N5

12

x16 LP SlimSAS接口N6

13

GPU节点AUX接口

 

2.8  主板

介绍服务器主板布局和主板上的组件含义。

2.8.1  主板布局

图2-11 主板布局

 

表2-13 主板布局说明

序号

含义

1

OCP转接模块插槽

2

内置USB 3.0接口(2个)

3

SATA M.2 SSD卡接口(2个)

4

SlimSAS接口(x8 SATA接口)

5

Mini-SAS-HD接口(x4 SATA接口)

6

通流铜柱1

7

NVMe AUX接口

8

x16 LP SlimSAS接口M1或A1/A2/A3/A4 NVMe接口*

9

x16 LP SlimSAS接口M3

10

前面板I/O接口

11

前部硬盘背板电源接口3

12

前部硬盘背板电源接口2

13

x8 SlimSAS接口B1/B2

14

x8 SlimSAS接口B3/B4

15

前部硬盘背板电源接口1

16

前部硬盘背板AUX接口

17

开箱检测模块、前部VGA和2个USB 2.0接口

18

x16 LP SlimSAS接口M5

19

x16 LP SlimSAS接口M6

20

GPU计算模块AUX接口

21

通流铜柱2

22

系统电池

23

NVMe VROC模块接口

24

Mezz存储控制卡插槽

25

TPM/TCM插槽

*:表示复用接口,即该接口支持连接线缆到硬盘背板(仅配置8GPU节点板时支持连接线缆到24LFF硬盘背板),或连接线缆到GPU节点板。

·     当该接口支持连接线缆到硬盘背板(仅配置8GPU节点板时支持连接线缆到24LFF硬盘背板)时,服务器支持8NVMe硬盘,支持NVMe硬盘的槽位如2-3所示;但不支持PCIe slot 1,PCIe slot编号如图2-6所示。

·     当该接口连接线缆到GPU节点板时,服务器不支持8NVMe硬盘,但是支持PCIe slot 1,PCIe slot编号请参见2.6.1  后面板组件

 

2.8.2  内存插槽

内存插槽布局如图2-12所示,A1、A2…A12,B1、B2…B12用于备件更换时指示内存的插槽ID。内存的具体安装准则请参见2.11.10  内存安装准则

图2-12 内存插槽编号

 

2.9  硬盘

介绍如下内容:

·     服务器支持的典型硬盘配置。

·     每种硬盘配置所需的存储控制卡配置和线缆连接方法。

·     所有硬盘配置对应的硬盘编号。

·     硬盘指示灯的含义。

2.9.1  硬盘配置

服务器支持多种不同的硬盘配置,可供用户灵活选择,具体硬盘配置如表2-14

表2-14 服务器硬盘配置说明

硬盘配置

硬盘具体配置

存储控制卡配置和主板SlimSAS接口连线方式

线缆连接方法

12LFF

8LFF SAS/SATA硬盘 + 4LFF NVMe硬盘

支持以下任意一种配置:

l     配置一:RSTe板载软RAID,同时,硬盘背板上的SlimSAS接口需要连接到主板上的SlimSAS接口

l     配置二:Mezz存储控制卡或标准存储控制卡,同时,硬盘背板上的SlimSAS接口需要连接到主板上的SlimSAS接口

7.1.1  12LFF硬盘配置

24LFF

16LFF SAS/SATA硬盘 + 8LFF UniBay硬盘

Mezz存储控制卡或标准存储控制卡,同时,硬盘背板上的SlimSAS接口需要连接到主板上的SlimSAS接口和LP SlimSAS M1接口

7.1.2  24LFF硬盘配置

·     硬盘配置不同,SAS/SATA硬盘和NVMe硬盘的安装位置也不同,详细信息请参见2.5.1  服务器前面板组件

·     UniBay硬盘:SAS/SATA HDD/SSD硬盘或NVMe硬盘。

·     RSTe板载软RAID仅支持SATA硬盘;Mezz存储控制卡或标准存储控制卡均支持SAS/SATA硬盘。

·     硬盘槽位的具体信息请参见2.9.2  硬盘编号

 

2.9.2  硬盘编号

硬盘编号用于指示硬盘位置,与服务器前后面板上的丝印完全一致。

图2-13 12LFF硬盘编号

 

图2-14 24LFF硬盘编号

 

2.9.3  硬盘指示灯

服务器支持SAS/SATA硬盘和NVMe硬盘,SAS/SATA硬盘支持热插拔。硬盘指示灯指示硬盘状态,硬盘指示灯位置如图2-15所示。

图2-15 硬盘指示灯

(1):硬盘Fault/UID指示灯

(2):硬盘Present/Active指示灯

 

SAS/SATA硬盘指示灯含义请参见表2-15,NVMe硬盘指示灯含义请参见表2-16

表2-15 SAS/SATA硬盘指示灯说明

硬盘Fault/UID指示灯(橙色/蓝色)

硬盘Present/Active指示灯(绿色)

说明

橙色闪烁(0.5Hz

常亮/闪烁(4Hz)

硬盘预告性故障报警,请及时更换硬盘

橙色常亮

常亮/闪烁(4Hz)

硬盘出现故障,请立即更换硬盘

蓝色常亮

常亮/闪烁(4Hz)

硬盘状态正常,且被阵列管理工具选中

灯灭

闪烁(4Hz)

硬盘在位,有数据读写操作或正在进行阵列迁移/重建

灯灭

常亮

硬盘在位,但没有数据读写操作

灯灭

灯灭

硬盘未安装到位

 

表2-16 NVMe硬盘指示灯说明

硬盘Fault/UID指示灯(橙色/蓝色)

硬盘Present/Active指示灯(绿色)

说明

橙色闪烁(0.5Hz)

灯灭

硬盘已完成预知性热拔出流程,允许拔出硬盘

橙色闪烁(4Hz)

灯灭

硬盘处于热插入过程

橙色灯常亮

常亮/闪烁(4Hz)

硬盘出现故障,请立即更换硬盘

蓝色灯常亮

常亮/闪烁(4Hz)

硬盘状态正常,且被阵列管理工具选中

灯灭

闪烁(4Hz)

硬盘在位,有数据读写操作或正在进行阵列迁移/重建

灯灭

常亮

硬盘在位,但无数据读写操作

灯灭

灯灭

硬盘未安装到位

 

2.10  风扇模块

服务器最多支持4个热插拔风扇模块,每个风扇模块由2个风扇组成,风扇模块布局如图2-16所示。服务器支持N+1风扇冗余,即支持单风扇失效。

服务器支持可变的风扇速度,即风扇会根据系统实际温度调整转速。转速策略上兼顾了系统散热和系统噪音,使系统的散热和噪音达到最优。

说明

POST期间和操作系统运行过程中,如果系统检测到监控点温度达到致命阈值,HDM会将服务器系统正常关机。如果系统检测到CPU等关键模块温度超过最高门限值时,服务器将直接关机。监控点的实际温度和致命阈值可通过HDM Web界面查看,具体方法请参见HDM联机帮助。

 

图2-16 风扇布局

 

2.11  安装准则

本章节介绍各个模块的安装准则。

2.11.1  SAS/SATA硬盘安装准则

·     SAS/SATA硬盘支持热插拔。

·     建议用户安装没有RAID信息的硬盘。

·     请确保组建同一RAID的所有硬盘类型相同,否则会因硬盘性能不同而造成RAID性能下降或者无法创建RAID。即同时满足如下两点。

¡     所有硬盘均为SAS或SATA硬盘。

¡     所有硬盘均为HDD或SSD硬盘。

·     建议组建同一RAID的所有硬盘容量相同。当硬盘容量不同时,系统以最小容量的硬盘为准,即将所有硬盘容量都视为最小容量。

·     需要注意的是,一个硬盘属于多个RAID的情况会使后期维护变得复杂,并影响RAID的性能。

·     HDD硬盘如果被频繁插拔,且插拔时间间隔小于30秒,可能会导致该硬盘无法被系统识别。

2.11.2  NVMe硬盘安装准则

·     硬盘的详细配置请参见2.9.1  硬盘配置

·     NVMe硬盘支持热插。

·     部分操作系统下NVMe硬盘支持热拔和预知性热拔。有关NVMe硬盘支持的拔出方式,请参见附录中的“NVMe硬盘的热拔和预知性热拔操作”。

·     建议用户安装没有RAID信息的硬盘。

·     建议组建同一RAID的所有硬盘容量相同。当硬盘容量不同时,系统以最小容量的硬盘为准,即将所有硬盘容量都视为最小容量。对于容量较大的硬盘,其多余容量无法用于配置当前RAID,也无法用于配置其他RAID。

·     当配置16GPU计算模块时,最多支持4个NVMe硬盘。

¡     当服务器前部配置12LFF硬盘时,支持NVMe硬盘的槽位为编号8~11,硬盘编号如图2-13所示。

¡     当服务器前部配置24LFF硬盘时,支持NVMe硬盘的槽位为编号20~23,硬盘编号如图2-14所示。

·     当配置8GPU计算模块,且PCIe slot 1需要安装部件时,最多支持4个NVMe硬盘。

¡     当服务器前部配置12LFF硬盘时,支持NVMe硬盘的槽位为编号8~11,硬盘编号如图2-13所示。

¡     当服务器前部配置24LFF硬盘时,支持NVMe硬盘的槽位为编号20~23,硬盘编号如图2-14所示。

·     当配置8GPU计算模块,且需要支持8个NVMe硬盘时,此时,需要配置24LFF硬盘背板,支持NVMe硬盘的槽位如图2-3所示。

注意

当配置8GPU计算模块且支持8个NVMe硬盘时,主板上的PCIe slot 1不可用,PCIe slot编号请参见2.6.1  后面板组件。PCIe slot 1不可用原因:主板上的LP SlimSAS接口M1为复用接口,当该接口连接线缆到硬盘背板支持8个NVMe硬盘时,就无法连接线缆到GPU节点板,即PCIe slot 1不可用。

 

2.11.3  电源模块安装准则

·     请确保服务器上安装的所有电源模块型号相同。HDM会对电源模块型号匹配性进行检查,如果型号不匹配将提示严重告警错误。

·     电源模块支持热插拔。

·     服务器支持N+N电源模块冗余。

·     请勿使用第三方电源模块,否则可能会导致硬件损坏。

·     请按电源模块1到电源模块4的顺序依次安装电源模块到服务器。

·     当电源模块温度超过正常工作温度,电源将自动关闭,当温度恢复到正常范围后,电源将会自动开启。电源模块正常工作温度范围请参见附录中的“电源模块”章节。

2.11.4  存储控制卡及掉电保护模块安装准则

1. 存储控制卡

根据存储控制卡在服务器中的安装位置,将其分为三类,详细信息请如表2-17所示。

表2-17 存储控制卡说明

类型

安装位置

RSTe板载软RAID

缺省内嵌于服务器主板PCH中

Mezz存储控制卡

直接安装到主板的Mezz存储控制卡插槽

标准存储控制卡

安装到GPU节点板上的PCIe插槽

·     服务器支持的存储控制卡请参见附录的“存储控制卡”章节。

·     Mezz存储控制卡插槽在主板的具体位置请参见2.8.1  主板布局

 

2. 掉电保护模块

掉电保护模块是一个总称,包含一张内嵌在存储控制卡上的Flash卡和一个超级电容。

服务器系统意外掉电时,超级电容可为Flash卡供电20秒以上,在此期间,缓存数据会从存储控制卡的DDR存储器传输到Flash卡中。由于Flash卡是非易失性存储介质,故可实现缓存数据的永久保存或者保存到服务器系统上电,存储控制卡检索到这些数据为止。

说明

安装超级电容后,可能会出现电量不足,此时无需采取任何措施,服务器上电后,内部电路会自动为超级电容充电并启用超级电容。关于超级电容的状态,通过BIOS可以查看。

 

3. 安装准则

·     服务器配置标准存储控制卡时,建议安装到PCIe slot 3或PCIe slot 4,slot编号详见2.6.1  后面板组件

·     支持掉电保护功能的存储控制卡必须与对应的掉电保护模块或超级电容配合使用,详细信息请参见附录的“存储控制卡”章节。

2.11.5  GPU卡安装准则

1. 简介

服务器支持的GPU卡如表2-18所示。

表2-18 GPU卡说明

GPU卡型号

适配的GPU计算模块类型

电源线缆

GPU-T4

16GPU计算模块

GPU-P40-X

8GPU计算模块

1根,线缆编码0404A0UC

GPU-V100

GPU-V100-32G

·     为避免造成GPU卡损坏,请使用GPU卡自带的或相同编码的电源线缆。

·     GPU线缆连接方法请参见7.3  连接GPU卡电源线缆

 

2. 安装准则

GPU卡支持的配置和安装槽位如表2-19所示,GPU计算模块槽位的具体位置请参见2.7  GPU计算模块

表2-19 支持的GPU配置数量与建议安装的槽位

GPU计算模块类型

GPU配置数量

GPU安装槽位

8GPU计算模块

4

Slot7、Slot8、Slot11、Slot12

8

Slot7、Slot8、Slot9、Slot10、Slot11、Slot12、Slot13、Slot14

16GPU计算模块

4

Slot7、Slot8、Slot9、Slot10

8

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

12

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

16

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

Slot19、Slot20、Slot21、Slot22

17

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

Slot19、Slot20、Slot21、Slot22

Slot1

18

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

Slot19、Slot20、Slot21、Slot22

Slot1、Slot2

19

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

Slot19、Slot20、Slot21、Slot22

Slot1、Slot2、Slot3

20

Slot7、Slot8、Slot9、Slot10

Slot11、Slot12、Slot13、Slot14

Slot15、Slot16、Slot17、Slot18

Slot19、Slot20、Slot21、Slot22

Slot1、Slot2、Slot3、Slot4

 

2.11.6  网卡安装准则

服务器支持OCP3.0网卡和标准PCIe网卡。

1. OCP网卡安装准则

OCP网卡通过OCP转接模块安装到服务器,OCP转接模块必须安装到主板上的OCP转接模块插槽,插槽的具体位置请参见图2-11

2. 标准PCIe网卡安装准则

·     标准PCIe网卡必须安装在GPU计算模块上的PCIe slot 1~4,各slot的具体位置请参见2.6.1  后面板组件

·     当配置不同的GPU计算模块时,标准PCIe网卡的安装准则也不同,详细信息请参见表2-20表2-21

表2-20 8GPU计算模块上标准PCIe网卡的安装准则

标准PCIe网卡配置数量(张)

Slot 1

Slot 2

Slot 3

Slot 4

1

×

×

×

2

×

×

3

×

4

·     √表示建议安装标准PCIe网卡的槽位。

·     ×表示不建议安装标准PCIe网卡的槽位。

·     如需使GPU计算模块上对应的slot可用,需要连接对应的线缆,不同应用场景线缆连接方法不同,详细信息请参见7.2.1  连接8GPU-AI线缆7.2.2  连接8GPU-HPC线缆

 

表2-21 16GPU计算模块上标准PCIe网卡的安装准则

标准PCIe网卡配置数量(张)

Slot 1

Slot 2

Slot 3

Slot 4

1

×

×

×

2

×

×

3

×

4

·     √表示建议安装标准PCIe网卡的槽位。

·     ×表示不建议安装标准PCIe网卡的槽位。

·     当PCIe slot 1~4已安装GPU卡时,则可以安装标准PCIe网卡的slot编号按表格中的准则顺延。若全部slot均已安装GPU卡时,则服务器不再支持标准PCIe网卡。

 

2.11.7  SATA M.2 SSD卡安装准则

为确保SATA M.2 SSD卡配置RAID时的可靠性,建议安装2张相同型号的SATA M.2 SSD卡。

2.11.8  风扇模块安装准则

4个风扇模块必须全部在位。

2.11.9  CPU安装准则

·     服务器上的CPU必须满配。

·     为避免损坏CPU或主板,只限H3C授权人员或专业的服务器工程师安装CPU。

·     请确保同一服务器上安装的CPU型号相同。

·     为避免CPU底座中针脚损坏,请确保在未安装CPU的底座中安装了CPU盖片。

·     为防止人体静电损坏电子组件,请在操作前佩戴防静电手腕,并将防静电手腕的另一端良好接地。

2.11.10  内存安装准则

内存,又称DIMM,DIMM包括DRAM和DCPMM两类内存,其中DRAM又包括LRDIMM和RDIMM。

1. 内存基本概念

(1)     DRAM和DCPMM

·     DRAM是最为常见的内存类型。服务器系统意外掉电时,DRAM中的数据会丢失。

·     DCPMM具有如下两个特点。

¡     相比于DRAM,DCPMM具有更大的单根内存容量。

¡     DCPMM(如Apache Pass)具有数据掉电保护功能。服务器系统意外掉电时,DCPMM中的数据不会丢失。

(2)     RDIMM和LRDIMM

·     RDIMM提供了地址奇偶校验保护功能。

·     LRDIMM可为系统提供更大的容量和带宽。

(3)     Rank

内存的RANK数量通常为1、2、4、8,一般简写为1R/SR、2R、4R、8R,或者Single-Rank、Dual-Rank、Quad-Rank、8-Rank。

·     1R DIMM具有一组内存芯片,在DIMM中写入或读取数据时,将会访问这些芯片。

·     2R DIMM相当于一个模块中包含两个1R DIMM,但每次只能访问一个Rank。

·     4R DIMM相当于一个模块中包含两个2R DIMM,但每次只能访问一个Rank。

·     8R DIMM相当于一个模块中包含两个4R DIMM,但每次只能访问一个Rank。

在DIMM中写入或读取数据时,服务器内存控制子系统将在DIMM中选择正确的Rank。

(4)     内存规格

可通过内存上的标签确定内存的规格。

图2-17 内存标识

 

表2-22 内存标识说明

编号

说明

定义

1

容量

·     8GB

·     16GB

·     32GB

2

Rank数量

·     1R = Rank数量为1

·     2R = Rank数量为2

·     4R = Rank数量为4

·     8R = Rank数量为8

3

数据宽度

·     x4 = 4位

·     x8 = 8位

4

DIMM代数

DDR4

5

DIMM等效速度

·     2133P:2133MHz

·     2400T:2400MHz

·     2666V:2666MHz

·     2933Y:2933MHz

6

DIMM类型

·     R = RDIMM

·     L = LRDIMM

 

2. 内存模式

服务器支持通过以下内存模式来保护DIMM中的数据。缺省情况下,服务器的内存模式为Independent Mode,用户可根据需要修改内存模式。内存模式的含义和修改方法请参见产品的BIOS用户指南。

·     Independent Mode

·     Mirror Mode

·     Memory Rank Sparing Mode

3. 内存安装准则

服务器支持2路CPU,每路CPU支持6个通道,每个通道支持2根DIMM,服务器支持24根DIMM。不同CPU平台,支持的内存类型不同,详细信息请参见如表2-23

表2-23 不同CPU平台的DIMM支持情况

CPU平台

DIMM支持情况

SkyLake

支持仅配置DRAM

Cascade Lake

·     支持仅配置DRAM

·     支持混配DCPMM和DRAM

·     仅配置DRAM时,DIMM安装准则请参见仅配置DRAM时的内存安装准则

·     混配DCPMM和DRAM时,DIMM安装准则请参见混配DCPMM和DRAM时的内存安装准则

 

说明

仅当同时满足以下条件时,DIMM的工作频率可达到2933MHz:

·     使用支持的最高内存频率为2933MHz的Cascade Lake CPU。

·     使用最高频率为2933MHz的DIMM。

·     配置DIMM的通道均仅配置一根DIMM。

 

仅配置DRAM时的内存安装准则

·     确保相应的CPU已安装到位。

·     不同规格(类型、容量、Rank、数据宽度、速率)的DRAM不支持混插,即一台服务器上配置的所有DRAM产品编码必须相同,产品编码信息请参见附录中的“DIMM”章节。

·     每个通道最多支持8个Rank。

·     一般的内存安装准则,如图2-18所示。

·     除上述准则外,不同DIMM模式还有各自特定的准则,具体请参见表2-24。需要注意的是,当实际DIMM安装不满足这些特定准则时,无论用户配置了何种DIMM模式,系列均会自动降级并使用缺省的Independent Mode。

表2-24 不同内存模式的特定安装准则

内存模式

特定安装准则

Independent Mode(缺省)

·     遵循一般的内存安装准则,如图2-18所示。

Mirror Mode

·     确保每个CPU至少安装2根内存。

·     遵循一般的内存安装准则,如图2-18所示。需要注意的是,该模式不支持一般内存安装准则中不推荐的内存配置。

Memory Rank Sparing

·     确保安装了内存的通道,每个通道的内存Rank总数大于等于2。

·     遵循一般的内存安装准则,如图2-18所示。

 

说明

图2-18(内存安装准则)中:

·     “”和橙色行表示推荐的内存安装准则,“*”表示不推荐的内存安装准则。

·     灰显的内存槽位(如A12)表示黑色的内存槽位,非灰显(如A6)的表示白色的内存槽位。

 

图2-18 内存安装准则

 

混配DCPMM和DRAM时的内存安装准则

·     确保相应的CPU已安装到位。

·     不同规格(类型、容量、Rank、数据宽度、速率)的DRAM不支持混插,即服务器上配置的所有DRAM产品编码必须相同;不同规格的DCPMM不支持混插,即服务器上配置的所有DCPMM产品编码必须相同。产品编码信息请参见附录中的“DIMM”章节。

·     DCPMM内存和DRAM尽量分布在不同的通道上,以提升内存访问带宽。

·     每个通道最多支持1根DCPMM,同一服务器上所有DCPMM容量必须相同。

·     对于每个CPU,DCPMM内存尽量在两个内存控制器对称分布。

·     一个通道内,如果同时安装DCPMM和DRAM,DCPMM安装在黑色插槽,DRAM安装在白色插槽;一个通道内,如果仅安装一根DCPMM,则DCPMM安装在白色槽位。

 


3 安装和拆卸 UIS 5300 G3

介绍安装和拆卸服务器的操作方法。

3.1  安装流程

服务器安装流程如图3-1所示。

图3-1 安装流程

 

3.2  安装规划

在安装服务器前,请先规划和准备满足设备正常运行的物理环境,包括空间和通风、温度、湿度、洁净度、高度和接地等。

3.2.1  机柜要求

机箱高4U,深度800mm,对机柜的要求如下:

·     标准19英寸机柜。

·     建议机柜深度1200mm及以上。不同深度机柜的安装限制如表3-1所示,建议技术支持人员现场工勘,排除潜在问题。

表3-1 不同深度机柜的安装限制

机柜深度

安装限制

1000mm

·     不支持安装H3C CMA。

·     如配置H3C滑道,可能存在滑道与PDU相互干涉的风险,需工勘确认是否可调整PDU的安装位置或配置合适尺寸的PDU。如不能满足,则建议使用托盘等其他的固定方式。

·     机箱后部需预留60mm走线空间。

1100mm

如安装H3C CMA,需确认CMA不会与机柜后部PDU干涉,否则请更换更大深度尺寸的机柜或者调整PDU的安装位置。

1200mm

需确认H3C CMA不会与机柜后部PDU、线缆等相互干涉,否则请调整PDU的安装位置。

 

·     机柜前方孔条距离机柜前门大于50mm。

·     服务器在1200mm机柜中的安装建议,请参考图3-2

图3-2 服务器在1200mm机柜中的安装建议(机柜俯视图)

机柜尺寸建议与要求

(1):机柜深度,建议1200mm

(2):机柜前方孔条与机柜前门间距,大于50mm

·     建议PDU采用向后直出线的方式,以免与机箱之间产生干涉。

·     若PDU采用侧向出线的方式,建议技术支持人员现场工勘,确认PDU是否会与机箱后部相互干涉。

服务器相关尺寸参数

(3):机柜前方孔条与机箱后端(含电源后部拉手,图中未展示)间距,为830mm

(4):机箱深度(含挂耳),为830mm

(5):机柜前方孔条与CMA后端间距,为970mm

(6):机柜前方孔条与滑道后端间距,为880mm

 

3.2.2  空间和通风要求

为方便服务器维护和正常通风,在确定机柜位置时,应满足以下空间和通风要求。

·     搬运服务器的通道,净宽不应小于1.5m。

·     面对面布置的机柜,正面之间的距离不宜小于1.2m

·     背对背布置的机柜,背面之间的距离不宜小于0.8m。

·     机柜与墙之间的距离不宜小于1m。

·     为避免散热不充分而损坏服务器,请勿阻塞服务器的通风口。

·     确保服务器前后部通风良好,以便周围的空气进入机柜,并将热气从机柜中排出。

·     服务器所在位置的空调送风量应足够提供服务器所需的风量,保证服务器内部各组件散热。

服务器的空气流动方向如图3-3所示。

图3-3 机箱风道示意图

(1)~(11):机箱进风方向

(12)~(13):机箱出风方向

 

3.2.3  温度和湿度要求

为确保服务器正常工作,机房内需维持一定的温度和湿度。关于服务器环境温度和湿度要求,请参见2.2.2  技术参数

3.2.4  高度要求

为确保服务器正常工作,对机房的高度有一定要求,详细信息请参2.2.2  技术参数

3.2.5  洁净度要求

灰尘对服务器运行安全会造成危害。室内灰尘落在机体上,可以造成静电吸附,使金属接插件或金属接点接触不良。尤其是在室内相对湿度偏低的情况下,更易造成静电吸附,不但会影响服务器寿命,而且容易造成通信故障。

对机房内灰尘含量及粒径要求请参见表3-2

表3-2 机房灰尘含量要求

灰尘粒子(直径)

含量

单位

灰尘粒子(≥5 μm)

≤3×104(3天内桌面无可见灰尘)

粒/m3

悬浮尘埃(≤75 μm)

≤0.2

mg/m3

可降尘埃(75 μm~150 μm)

≤1.5

mg/(m2h)

沙砾(≥150 μm)

≤30

mg/m3

 

除灰尘外,机房对空气中所含的盐、酸、硫化物也有严格的要求。这些有害气体会加速金属的腐蚀和某些部件的老化过程。机房内应防止有害气体(如SO2、H2S、NO2、NH3、Cl2等)的侵入,其具体限制值请参见表3-3

表3-3 机房有害气体限值

气体

最大值((mg/m3

SO2(二氧化硫)

0.2

H2S(硫化氢)

0.006

NO2(二氧化氮)

0.04

NH3(氨)

0.05

Cl2(氯气)

0.01

 

3.2.6  接地要求

良好的接地系统是服务器稳定可靠运行的基础,是服务器防雷击、抗干扰、防静电及安全的重要保障。服务器通过供电系统的接地线缆接地,用户无需额外连接接地线缆。

3.3  工具准备

在安装、使用和维护服务器时,需准备以下工具和设备。

表3-4 工具要求

图示

名称

说明

T25 Torx星型螺丝刀

用于智能挂耳上的松不脱螺钉(一字螺丝刀也可用于该螺钉)

T30 Torx星型螺丝刀

用于CPU散热器上的松不脱螺钉

T15 Torx星型螺丝刀(随服务器发货)

用于PCIe卡的固定螺钉及拆卸机箱运输螺钉等

T10 Torx星型螺丝刀(随服务器发货)

/

一字螺丝刀

用于更换CPU、管理模块等

十字螺丝刀

用于PCIe M.2 SSD卡的固定螺钉等

浮动螺母安装条

用于牵引浮动螺母,使其安装在机柜的固定导槽孔位上

斜口钳

用于剪切绝缘套管等

卷尺

用于测量距离

万用表

用于测量电阻、电压,检查电路

防静电腕带

用于操作服务器时使用

防静电手套

防静电服

梯子

用于高处作业

接口线缆(如网线、光纤)

用于服务器与外接网络互连

显示终端(如PC)

用于服务器显示

 

3.4  安装 UIS 5300 G3

介绍安装服务器的操作方法。

3.4.1  安装滑道

将滑道的外导轨安装到机柜上,内导轨安装到服务器上,具体方法请参见滑道附带的文档。

3.4.2  安装UIS 5300 G3

(1)     利用机箱两侧抬手水平抬起服务器,将服务器沿滑轨缓缓推入机柜。

警告

为了减少人身伤害的危险,一定要小心将服务器滑入机柜。滑动的导轨可能会挤压到您的手指。

 

(2)     固定服务器。将服务器两侧挂耳紧贴机柜方孔条,打开智能挂耳的锁扣,用螺丝刀拧紧里面的松不脱螺钉。

3.4.3  (可选)安装理线架

如果已配置理线架,请安装。具体方法请参见理线架附带的文档。

3.5  连接外部线缆

介绍服务器外部线缆的连接方法。

3.5.1  连接鼠标、键盘和VGA接口线缆

1. 操作场景

在对服务器进行BIOS、HDM、iFIST、RAID以及进入操作系统等操作和配置时,可能需要连接鼠标、键盘和显示终端。

服务器前、后面板最多可提供2个DB15 VGA接口,用来连接显示终端;但未提供标准的PS2鼠标、键盘接口,用户可通过前面板和后面板的USB接口,连接鼠标和键盘。

注意

前后面板上的2个VGA接口不支持同时使用。

 

根据鼠标、键盘的接口类型不同,连接方法有两种:

·     直接连接USB鼠标和键盘,连接方法与一般的USB线缆相同。

·     通过USB转PS2线缆连接PS2鼠标和键盘。

2. 操作步骤

(1)     如图3-4所示,将视频线缆的一端插入服务器的VGA接口,并通过插头两侧的螺钉固定。

图3-4 连接VGA接口

R170_048.png

 

(2)     将视频线缆的另一端插入显示终端的VGA接口,并通过插头两侧的螺钉固定。

(3)     如图3-5所示,将USB转PS2线缆的USB接口一端插入服务器的USB接口,另一端的PS2接口分别连接到鼠标和键盘。

图3-5 连接USB转PS2线缆

R170_048-USB转接线.png

 

3.5.2  连接网线

1. 操作场景

·     通过以太网搭建服务器的网络环境。

·     通过HDM专用网络接口,登录HDM管理界面进行服务器管理。

·     网络不通或网线长度不适合时,更换网线。

2. 操作步骤

(1)     确定服务器上的网络接口。

·     通过网卡上的以太网接口将服务器接入网络。

说明

服务器缺省未安装网卡,请先选配并安装网卡。

 

·     通过服务器上的HDM专用网络接口或OCP3.0网卡的共享网络接口,登录HDM进行设备管理。HDM专用网络接口的具体位置请参见2.6.1  后面板组件

(2)     确定网线型号。

请确保网线导通(使用网线测试仪),网线型号与旧网线的型号一致或兼容。

(3)     为网线编号。

·     网线编号应与旧网线相同。

·     建议使用统一规格的标签。在标签上分别填写本端设备和对端设备的名称、编号。

(4)     连接网线。如图3-6所示,将网线一端连接到服务器的以太网接口,另一端连接对端设备。

图3-6 连接网线

R170_049.png

 

(5)     检查网线连通性。

服务器上电后,可使用ping命令检查网络通信是否正常。如果通信不正常,请交叉测试网线或检查网线接头是否插紧。

(6)     绑扎网线,具体请参见3.5.5  固定线缆

3.5.3  连接USB接口

1. 操作场景

服务器最多提供7个USB接口:

·     5个位于前、后面板,用于连接经常插拔的USB设备。

·     2个位于内部,用于连接不经常插拔的USB设备。

以下情况需要连接USB接口:

·     服务器上电后,需要键盘和鼠标进行系统操作和设置。

·     通过连接USB设备传输数据或安装操作系统。

2. 操作注意事项

·     确保USB设备功能正常。

·     确保已将需要的数据拷贝到USB设备中。

3. 操作步骤

说明

·     USB接口支持热插拔。

·     建议用户使用H3C认证的USB设备。对于其他品牌的USB设备,不保证一定兼容。

 

(1)     (可选)如果用户要连接内部USB接口,请拆卸机箱盖,具体请参见6.7.3  1. 中的步骤(2)

(2)     连接USB设备。内部USB接口所在位置请参见2.8.1  主板布局

(3)     (可选)如果已拆卸机箱盖,请安装,具体请参见6.7.3  2. 中的步骤(4)

(4)     检查服务器能否识别USB设备。如果无法识别,请下载并安装USB设备的驱动程序;安装后如果仍然无法识别,请更换其他USB设备。

3.5.4  连接电源线缆

1. 操作注意事项

·     为避免人身伤害或设备损坏,请使用配套的电源线缆。

·     连接电源线缆前,请确保服务器和各个部件已安装完毕。

2. 操作步骤

(1)     将电源线缆一端插入服务器后面板上的电源模块插口。

(2)     将电源线缆另一端插入外部供电系统,如机柜的交流插线板。

(3)     为防止电源线缆意外断开,请固定电源线缆。

a.     (可选)当线扣离电源模块太近时,会导致电源线缆无法放入线扣中。此时请将线扣上的锁扣掰开,同时滑动线扣。

b.     将线扣两端掰开,打开线扣。

c.     将电源线缆放入线扣中,并合上线扣。

d.     将线扣向前滑动,直到固定住电源线缆插头。

3.5.5  固定线缆

完成所有布线后,可通过如下两种方法固定线缆。

1. 方法一:将线缆固定到理线架

具体方法请参见理线架附带的文档。

2. 方法二:使用线缆绑扎带(服务器随机附带)将线缆固定到机柜滑道

说明

·     线缆绑扎带可以安装在左侧或右侧机柜滑道上,建议用户安装在左侧,以便更好的进行线缆管理。

·     在一个机柜中使用多个线缆绑扎带时,请交错排列绑扎带的位置,比如从上向下看时绑扎带彼此相邻,这种布置有利于滑道的滑动。

 

(1)     将线缆与机柜滑道贴紧,然后用线缆绑扎带固定。

(2)     用线缆绑扎带固定线缆。如图3-7中①和②所示,将线缆绑扎带的末端穿过扣带,使绑扎带的多余部分和扣带朝向滑道外部。

图3-7 将线缆固定到机柜滑道

Orch_140.png

 

3.5.6  布线指导

·     所有线缆在走线时,请勿遮挡服务器的进出风口,否则会影响服务器散热。

·     确保线缆连接时无交叉现象,便于端口识别和线缆的插拔。

·     确保所有线缆都进行了有效标识,使用标签书写正确的名词,便于检索。

·     当前不需要装配的线缆,建议将其盘绕整理,绑扎在机柜的合适位置。

·     为避免触电、火灾或设备损坏,请不要将电话或通信设备连接到服务器的RJ45以太网接口。

·     使用理线架时,每条线缆要保持松弛,以免从机柜中拉出服务器时损坏线缆。

3.6  拆卸UIS 5300 G3

介绍拆卸服务器的操作方法。

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     断开所有外部线缆。

(3)     从机柜中拉出服务器。打开智能挂耳上的锁扣,用螺丝刀拧松里面的松不脱螺钉,并沿滑道将服务器从机柜中缓缓拉出,拉出过程中请依次打开机箱抬手,使用机箱抬手将服务器移出机柜。

(4)     将服务器放在干净、平稳的防静电工作台或地面上,进行部件安装、更换和设备维护。

 


4 上电和下电

介绍服务器的上电和下电方法。

说明

在服务器连接了外部数据存储设备的组网中,请确保服务器是第一个下电且最后一个恢复上电的设备。该方法可确保服务器上电时,不会误将外部数据存储设备标记为故障设备。

 

4.1  上电

介绍服务器的上电方法。

4.1.1  操作场景

·     服务器安装完毕,上电运行。

·     服务器维护完毕,重新上电运行。

4.1.2  前提条件

·     服务器及内部部件已经安装完毕。

·     服务器已连接外部供电系统。

4.1.3  操作步骤

根据场景不同,有四种上电方式。

1. 方式一:通过前面板上的开机/待机按钮为服务器上电

按下服务器前面板上的开机/待机按钮,使服务器上电。

此时服务器退出待机状态,电源向服务器正常供电。当系统电源指示灯由橙色常亮变为绿色闪烁,最后变为绿色常亮时,表明服务器完成上电。系统电源指示灯的具体位置请参见图2-8

2. 方式二:通过HDM Web界面的电源管理为服务器上电

具体步骤请参见HDM联机帮助。

3. 方式三:通过HDM Web界面的远程控制台为服务器上电

具体步骤请参见HDM联机帮助。

4. 方式四:服务器自动上电

通过以下方法之一开启服务器自动上电功能后,服务器一旦连接外部供电系统,会自动上电。

·     通过HDM Web开启设备自动上电功能,具体步骤请参见HDM联机帮助。

·     通过BIOS开启设备自动上电功能,具体步骤请参见产品的BIOS用户指南。

4.2  下电

介绍服务器的下电方法。

4.2.1  操作场景

·     维护服务器。

·     服务器需要搬迁。

4.2.2  前提条件

·     下电前,请确保所有数据已提前保存。

·     下电后,所有业务将终止,因此下电前请确保服务器的所有业务已经停止或者迁移到其他服务器上。

4.2.3  操作步骤

根据场景不同,有四种下电方式。

1. 方式一:通过关闭操作系统为服务器下电

(1)     将显示器、鼠标和键盘连接到服务器,关闭服务器操作系统。

(2)     断开服务器与外部供电系统之间的电源线缆。

2. 方式二:通过前面板上的开机/待机按钮为服务器下电

·     服务器正常关机流程

(1)     按下服务器前面板上的开机/待机按钮,使服务器下电。

(2)     当系统电源指示灯变为橙色常亮时,断开服务器与外部供电系统之间的电源线缆。

·     服务器非正常关机流程

(3)     按住服务器前面板上的开机/待机按钮5秒以上,使服务器下电。

说明

采用该方式,应用程序和操作系统为非正常关闭。当应用程序停止响应时,可采用这种方式。

 

(4)     断开服务器与外部供电系统之间的电源线缆。

3. 方式三:通过HDM Web界面的电源管理为服务器下电

具体步骤请参见HDM联机帮助。

4. 方式四:通过HDM Web界面的远程控制台为服务器下电

具体步骤请参见HDM联机帮助。

 


5 配置UIS 5300 G3

介绍服务器安装完毕后,对其进行软件配置的过程。

5.1  上电启动

(1)     服务器的上电操步骤请参见4.1  上电

(2)     上电启动后,请检查服务器前面板的Health指示灯是否正常,正常状态为绿色常亮。关于Health指示灯的详细说明,请参见2.5.2  指示灯和按钮

5.2  更新固件

说明

更新固件时,请注意软硬件版本之间的配套要求,详细信息请参见软件版本说明书。

介绍如何更新固件。

用户可通过FIST或HDM更新以下固件,具体方法请参见产品的固件更新指导书。

·     HDM

·     BIOS

·     CPLD

5.3  超融合管理平台初始化部署及软件注册

关于UIS超融合管理平台初始化部署请参见《H3C UIS超融合管理平台标准版安装指导》,关于UIS超融合管理平台软件注册请参见《H3C UIS 6.5超融合管理软件标准版产品注册配置指导》。


 

6 更换部件

介绍服务器有哪些可更换部件,以及部件更换的详细操作步骤。

说明

更换多个部件时,请阅读所有部件的更换方法并确定相似更换步骤,以便简化更换过程。

 

6.1  可更换部件

服务器可更换部件如下:

·     安全面板(6.3  更换安全面板

·     SAS/SATA硬盘(6.4  更换SAS/SATA硬盘

·     NVMe硬盘(6.5  更换NVMe硬盘

·     电源模块(6.6  更换电源模块

·     GPU卡(6.7  更换GPU卡

·     网卡(6.8  更换网卡

·     OCP转接模块(6.9  更换OCP转接模块

·     存储控制卡及其掉电保护模块(6.10  更换存储控制卡及其掉电保护模块

·     SATA M.2 SSD卡(6.11  更换SATA M.2 SSD卡

·     NVMe VROC模块(6.12  更换NVMe VROC模块

·     风扇模块(6.13  更换风扇模块

·     CPU(6.14  更换CPU

·     内存(6.15  更换内存

·     硬盘背板(6.16  更换硬盘背板

·     安装24LFF硬盘扩展模块(6.17  安装24LFF硬盘扩展模块

·     电源转接板(6.18  更换电源转接板

·     CPU主板(6.19  更换CPU主板

·     节点板(6.20  更换节点板

·     系统电池(6.21  更换系统电池

·     智能挂耳(6.22  更换智能挂耳

·     TPM/TCM模块(6.23  安装TPM/TCM模块

6.2  安装和拆卸所有模块假面板

1. 操作场景

扩容模块以及从12LFF硬盘配置扩展为24LFF硬盘配置时,需要拆卸对应的假面板;反之,需要安装对应的假面板。相关假面板如下。

·     硬盘假面板。

·     服务器前部假面板。12LFF硬盘配置时,空闲槽位配置该假面板。

·     电源模块假面板。

·     计算模块上的PCIe卡假面板。

2. 准备工作

请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

3. 操作步骤

表6-1 安装和拆卸所有模块假面板步骤

项目

操作步骤

拆卸步骤

安装步骤

硬盘假面板

按住假面板上的按钮,同时向外拉假面板。

将假面板沿槽位推入。

服务器前部假面板

用尖且细的工具(如尖头镊子)穿过假面板右侧的散热孔,将假面板右侧撬起,假面板右侧会自动弹出,顺势将假面板取出。

不涉及。

电源模块假面板

将假面板水平向外拉出。

TOP字样朝上,将假面板水平推入槽位。

计算模块上的PCIe卡假面板

移除假面板的固定螺钉,将假面板向上提起

将假面板沿槽位推入,然后用螺钉固定假面板。

 

6.3  更换安全面板

6.3.1  更换场景

·     安全面板故障。

·     安全面板阻碍其他部件的维护操作。

6.3.2  更换步骤

1. 拆卸安全面板

(1)     用钥匙将面板解锁。插入钥匙,按压钥匙的同时,沿顺时针方向将钥匙旋转90°。

注意

请勿在未按压钥匙的情况下,强行旋转钥匙,否则会导致锁损坏。

 

(2)     按下面板上的按钮,同时将面板一侧向外拉。

(3)     将面板另一侧向外拉,拆卸完毕。

2. 安装安全面板

(1)     将面板一侧卡在机箱上。

(2)     按住面板上的按钮,同时将面板另一侧固定到机箱。

(3)     用钥匙锁住面板。向内按压钥匙的同时,沿逆时针方向将钥匙旋转90°,然后拔出钥匙。

注意

请勿在未按压钥匙的情况下,强行旋转钥匙,否则会导致锁损坏。

 

6.4  更换SAS/SATA硬盘

6.4.1  更换场景

·     硬盘故障。

·     更换空间已满的硬盘。

·     更换其他型号的硬盘。

6.4.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     明确待更换硬盘在服务器中的安装位置。

·     明确服务器的RAID配置信息。如果更换其他型号的硬盘或空间已满的硬盘,且硬盘所配置的RAID无冗余功能,请提前备份待更换的硬盘中的数据。

·     SAS/SATA硬盘支持热插拔。

·     了解硬盘安装准则,具体请参见2.11.1  SAS/SATA硬盘安装准则

6.4.3  更换步骤

1. 拆卸SAS/SATA硬盘

(1)     通过硬盘的指示灯状态确认硬盘状态,判断其是否可以拆卸。指示灯详细信息请参见2.9.3  硬盘指示灯

(2)     拆卸硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后从硬盘槽位中拔出硬盘。对于HDD硬盘,硬盘扳手自动打开后,先将硬盘向外拔出3cm,使硬盘脱机;然后等待至少30s,硬盘完全停止转动后,再将硬盘从槽位中拔出。

(3)     拆卸硬盘支架。移除硬盘支架上的所有固定螺钉,并将硬盘从硬盘支架上移除。

2. 安装SAS/SATA硬盘

说明

建议用户安装没有RAID信息的硬盘。

 

(1)     安装硬盘到硬盘支架。将硬盘放入硬盘支架,并使用螺钉固定。

(2)     安装硬盘。将硬盘推入硬盘槽位,直到推不动为止,然后闭合硬盘扳手。

(3)     (可选)如果新安装的硬盘中有RAID信息,请清除。

(4)     当存储控制卡检测到新硬盘后,请根据实际情况确认是否进行RAID配置,详细信息请参见产品的存储控制卡用户指南。

3. 确认工作

可通过以下一种或多种方法判断硬盘工作状态,以确保硬盘更换成功。

·     登录HDM Web界面,查看配置RAID后的硬盘容量等信息是否正确。具体方法请参见HDM联机帮助。

·     根据硬盘指示灯状态,确认硬盘是否正常工作。指示灯详细信息请参见2.9.3  硬盘指示灯

·     通过BIOS查看硬盘容量等信息是否正确。配置RAID的方法不同,BIOS下查看硬盘信息的具体方法也有所不同,详细信息请参见产品的存储控制卡用户指南。

·     进入操作系统后,查看硬盘容量等信息是否正确。

6.5  更换NVMe硬盘

6.5.1  更换场景

·     硬盘故障。

·     更换空间已满的硬盘。

·     更换其他型号的硬盘。

6.5.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     明确待更换硬盘在服务器中的安装位置。

·     明确待更换硬盘所属RAID信息。如果用户更换其他型号的硬盘或空间已满的硬盘,且待更换硬盘所属RAID无冗余功能,请提前备份RAID中的数据。

·     了解硬盘安装准则,具体请参见2.11.2  NVMe硬盘安装准则

6.5.3  更换步骤

1. 拆卸NVMe硬盘

(1)     根据NVMe硬盘支持的拔出方式,明确NVMe硬盘拆卸方法。

¡     如果NVMe硬盘支持热拔和预知性热拔,操作方法请直接参见附录中的“NVMe硬盘的热拔和预知性热拔操作”。

¡     如果NVMe硬盘不支持热拔和预知性热拔,请先将服务器下电,再执行步骤(2)(3)

(2)     拆卸NVMe硬盘。按下硬盘面板按钮,硬盘扳手会自动打开,然后从硬盘槽位中拔出硬盘。

(3)     拆卸硬盘支架。移除硬盘支架上的所有固定螺钉,并将硬盘从硬盘支架上移除。

2. 安装NVMe硬盘

(1)     安装硬盘到硬盘支架。先将四颗固定螺钉固定到四个螺孔中,然后依次拧紧螺钉。

(2)     安装NVMe硬盘。将硬盘推入硬盘槽位,然后闭合硬盘扳手。

3. 确认工作

可通过以下一种或多种方法判断NVMe硬盘工作状态,以确保NVMe硬盘安装成功。

·     登录HDM Web界面,查看NVMe硬盘容量等信息是否正确。具体方法请参见HDM联机帮助。

·     根据NVMe硬盘指示灯状态,确认NVMe硬盘是否正常工作。指示灯详细信息请参见2.9.3  硬盘指示灯

·     通过BIOS查看NVMe硬盘容量等信息是否正确。详细信息请参见产品的BIOS用户指南。

·     进入操作系统后,查看NVMe硬盘容量等信息是否正确。

6.6  更换电源模块

6.6.1  更换场景

·     电源模块故障。

·     更换其他型号的电源模块。

·     电源模块阻碍其他部件维护。

6.6.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解电源模块安装准则,具体请参见2.11.3  电源模块安装准则

6.6.3  更换步骤

1. 拆卸电源模块

电源模块支持热插拔,当服务器后部有足够空间可供更换电源模块时,请从步骤(3)开始执行,否则请从步骤(1)开始执行。

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     断开电源线缆。

a.     松开电源线缆。请根据线缆实际固定方式,选择对应的线缆松开方法。

¡     如果线缆通过魔术贴固定,请将魔术贴打开。

¡     如果线缆通过线扣固定。请将线扣上的锁扣掰开,同时向外滑动线扣;将线扣一端掰开,打开线扣,然后将电源线缆从线扣中取出。

b.     从电源线缆插口中拔出电源线缆。

(4)     拆卸电源模块。按下电源模块解锁弹片的同时,握持电源模块后部的拉手环将电源模块从槽位中拔出。

2. 安装电源模块

(1)     安装电源模块。将电源模块推入电源插槽中,直到听到咔哒提示音,电源模块安装成功。

(2)     (可选)如果已拆卸服务器,请安装。具体步骤请参见3.4.2  安装

(3)     (可选)请连接已断开电源线缆。

(4)     (可选)如果服务器已下电,请将其上电。

6.7  更换GPU

6.7.1  更换场景

·     GPU卡故障。

·     更换其他型号的GPU卡。

·     GPU卡阻碍其他部件维护。

6.7.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解GPU卡安装准则,具体请参见2.11.5  GPU卡安装准则

6.7.3  更换步骤

1. 拆卸GPU

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(3)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(4)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(5)     拆卸GPU卡。

a.     (可选)断开GPU卡端电源线缆。

b.     拆卸GPU卡。移除GPU卡的固定螺钉,向上拔出GPU卡,使其脱离PCIe插槽。

c.     从主板上拔出电源线缆。

2. 安装GPU

(1)     (可选)对于GPU-P40-X、GPU-V100和GPU-V100-32G GPU卡,请安装附带的固定片到GPU卡。

a.     使GPU卡固定片上的三个螺孔和GPU卡对应位置的三个螺孔对齐,将GPU固定片紧贴GPU卡。

b.     用螺钉固定GPU卡固定片。

(2)     安装GPU卡到服务器。

a.     连接电源线缆到GPU卡和主板。

b.     (可选)对于已安装固定片的GPU卡,将固定片插入中间支架上的固定插槽。

c.     沿PCIe插槽插入GPU卡,并用螺钉固定。

d.     (可选)如果已拆卸GPU卡电源线缆,请连接。

(3)     推回计算模块。

a.     缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

b.     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     将服务器上电,具体步骤请参见4.1  上电

6.8  更换网卡

6.8.1  更换场景

·     OCP网卡故障。

·     标准PCIe网卡故障。

·     更换其他型号的OCP网卡。

·     更换其他型号的标准PCIe网卡。

6.8.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解网卡安装准则,具体请参见2.11.6  网卡安装准则

6.8.3  更换步骤(适用于OCP网卡)

1. 拆卸OCP网卡

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     断开OCP网卡上的所有线缆。

(3)     拆卸OCP网卡。拧开OCP网卡的松不脱螺钉,然后将OCP网卡从槽位中拔出。

2. 安装OCP网卡

(1)     安装OCP网卡。将OCP网卡推入槽位,并拧紧网卡上的松不脱螺钉。

(2)     连接OCP网卡的线缆。

(3)     将服务器上电,具体步骤请参见4.1  上电

(4)     (可选)OCP网卡支持NCSI特性,可设置HDM共享网络接口。缺省情况下,OCP网卡上的Port1接口为HDM共享网络接口。用户可通过HDM Web界面,将OCP网卡上的其他接口设置为HDM共享网络接口。需要注意的是,同一时间,仅支持将服务器的一个网口设置为HDM共享网络接口。

6.8.4  更换步骤(适用于标准PCIe网卡)

1. 拆卸标准PCIe网卡

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(3)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(4)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(5)     拆卸标准PCIe网卡。移除网卡的固定螺钉,向上拔出网卡,使其脱离PCIe插槽。

2. 安装标准PCIe网卡

(1)     安装标准PCIe网卡到服务器。沿PCIe插槽插入网卡,并用螺钉固定。

(2)     推回计算模块。

a.     缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

b.     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(3)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(4)     将服务器上电,具体步骤请参见4.1  上电

6.9  更换OCP转接模块

6.9.1  更换场景

·     OCP转接模块故障。

·     OCP转接模块阻碍其他部件维护。

6.9.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.9.3  更换步骤

1. 拆卸OCP转接模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸阻碍OCP转接模块操作的OCP网卡。拧开OCP网卡的松不脱螺钉,然后将OCP网卡从槽位中拔出。

(5)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(6)     完全拉出阻碍操作的计算模块。

a.     半拉出计算模块。掰开计算模块的固定弹片,扳手会自动弹出;打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

b.     断开阻碍拉出计算模块的坦克链。拧开坦克链机箱端的固定螺钉,松开坦克链;将连接到CPU主板的坦克链线缆拔出。

c.     完全拉出计算模块。将计算模块机框内侧的固定弹片向中心拉出,同时继续将计算模块向后滑动,直到滑不动为止。

(7)     拆卸OCP转接模块。移除转接卡的固定螺钉,将转接卡向上抬起,使其脱离服务器。

2. 安装OCP转接模块

(1)     安装OCP转接模块。将OCP转接模块插入连接器,并用螺钉固定。

(2)     推回计算模块。

a.     缓缓用力推回计算模块到半程位置。

b.     安装坦克链到机箱。将所有断开的线缆重新插入到CPU主板的接口;将坦克链重新固定到机箱。

c.     完全推回计算模块,并闭合扳手,计算模块会自动锁定。

d.     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(3)     安装OCP网卡。将OCP网卡推入槽位,并拧紧网卡上的松不脱螺钉。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.10  更换存储控制卡及其掉电保护模块

6.10.1  操作场景

·     存储控制卡故障。

·     更换其他型号的存储控制卡。

·     存储控制卡阻碍其他部件的维护。

·     掉电保护模块故障。

·     更换其他型号的掉电保护模块。

·     掉电保护模块阻碍其他部件的维护。

6.10.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     更换为相同型号的存储控制卡,请明确待更换存储控制卡及BIOS信息。

¡     存储控制卡在服务器中的位置以及线缆连接方法。

¡     存储控制卡的型号、工作模式、固件版本。

¡     明确BIOS的启动模式。

¡     明确Legacy启动模式下存储控制卡的第一启动项设置。

·     更换为其他型号的存储控制卡,请提前备份待更换的存储控制卡所控制的硬盘中的数据并清除RAID配置信息。

·     了解存储控制卡及其掉电保护模块安装准则,具体请参见2.11.4  存储控制卡及掉电保护模块安装准则

6.10.3  更换Mezz存储控制卡及其掉电保护模块

1. 拆卸Mezz存储控制卡及其掉电保护模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     (可选)拆卸超级电容及其固定座。

a.     拆卸超级电容。向外掰开超级电容的固定卡扣,从槽位中取出超级电容。

b.     拆卸超级电容固定座。向上掰开固定座的弹片,滑动固定座,并将其取出。

(7)     拆卸存储控制卡。

a.     断开存储控制卡上的所有线缆。

b.     拆卸存储控制卡。拧开存储控制卡的松不脱螺钉,然后将存储控制卡向上提起,使其脱离服务器。

2. 安装Mezz存储控制卡及其掉电保护模块

(1)     安装存储控制卡。将存储控制卡上的两个导向孔对准主板上的两个导向柱,向下插入存储控制卡,并用松不脱螺钉固定。

(2)     (可选)如果选配了超级电容,请安装超级电容到导风罩,并连接存储控制卡和超级电容之间的线缆。

a.     安装超级电容固定座到导风罩。将固定座底部的两个边沿,沿着导风罩上的两个卡槽推入槽位,直到听见咔哒一声,固定座安装成功。

b.     安装超级电容到固定座。斜置电容,将电容一端与电容槽位一端对齐,放入电容槽位;然后将电容另一端放入电容槽位。

c.     连接存储控制卡和超级电容之间的线缆。取出编码为0404A169的转接线缆,将转接线缆一端连接到存储控制卡,另一端连接到超级电容。

(3)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(4)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(5)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(6)     安装服务器,具体步骤请参见3.4.2  安装

(7)     将服务器上电,具体步骤请参见4.1  上电

6.10.4  更换标准存储控制卡及其掉电保护模块

1. 拆卸标准存储控制卡及其掉电保护模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸标准存储控制卡。

a.     拆卸存储控制卡。移除存储控制卡的固定螺钉,然后将存储控制卡向上提起,使其脱离计算模块。

b.     (可选)拆卸存储控制卡上的Flash卡。移除Flash卡的固定螺钉,然后将Flash卡从槽位中拔出。

c.     断开存储控制卡上的所有线缆。

(5)     (可选)拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     (可选)拆卸超级电容及其固定座。

a.     拆卸超级电容。向外掰开超级电容的固定卡扣,从槽位中取出超级电容。

b.     拆卸超级电容固定座。向上掰开固定座的弹片,滑动固定座,并将其取出。

2. 安装标准存储控制卡及其掉电保护模块

(1)     (可选)安装超级电容到导风罩,并连接存储控制卡和超级电容之间的线缆。

a.     安装超级电容固定座到导风罩。将固定座底部的两个边沿,沿着导风罩上的两个卡槽推入槽位,直到听见咔哒一声,固定座安装成功。

b.     安装超级电容到固定座。斜置电容,将电容一端与电容槽位一端对齐,放入电容槽位;然后将电容另一端放入电容槽位。

(2)     (可选)推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(3)     安装标准存储控制卡到计算模块。

a.     (可选)安装Flash卡到标准存储控制卡。对准控制卡上的插槽,向下缓缓用力插入Flash卡,并用螺钉固定。

b.     沿PCIe插槽插入控制卡,并用螺钉固定。

c.     连接存储控制卡上的所有线缆。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.11  更换SATA M.2 SSD

6.11.1  更换场景

·     SATA M.2 SSD卡故障。

·     更换其他型号的SATA M.2 SSD卡。

6.11.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解SATA M.2 SSD卡安装准则,具体请参见2.11.7  SATA M.2 SSD卡安装准则

6.11.3  更换步骤

1. 拆卸SATA M.2 SSD卡

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     拆卸SATA M.2 SSD卡。按下SATA M.2 SSD卡的固定锁扣,SATA M.2 SSD卡一端会自动弹起,另一端从插槽中拔出。

2. 安装SATA M.2 SSD卡

(1)     安装SATA M.2 SSD卡。斜置SATA M.2 SSD卡,将SATA M.2 SSD卡一端插入插槽,另一端向下按压,直到固定锁扣将其紧紧扣住。

(2)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(3)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.12  更换NVMe VROC模块

6.12.1  更换场景

·     NVMe VROC模块故障。

·     更换其他型号的NVMe VROC模块。

·     NVMe VROC模块阻碍其他部件维护。

6.12.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.12.3  更换步骤

1. 拆卸NVMe VROC模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     拆卸NVMe VROC模块。将手指伸入模块指环中,然后按住模块两侧并向上拔出模块。

2. 安装NVMe VROC模块

(1)     安装NVMe VROC模块。沿NVMe VROC模块接口缓缓用力插入模块。

(2)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(3)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.13  更换风扇模块

6.13.1  更换场景

风扇模块故障。

6.13.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.13.3  更换步骤

1. 拆卸风扇模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸风扇模块。握持风扇模块提手,将风扇模块从槽位中提起,使其脱离服务器风扇。

2. 安装风扇模块

(1)     安装风扇模块,将风扇模块水平向下放入槽位。

(2)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(3)     安装服务器,具体步骤请参见3.4.2  安装

(4)     将服务器上电,具体步骤请参见4.1  上电

6.14  更换CPU

6.14.1  更换场景

·     CPU故障。

·     更换其他型号的CPU。

·     CPU阻碍其他部件维护。

6.14.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解CPU安装准则,具体请参见2.11.9  CPU安装准则

6.14.3  更换步骤

1. 拆卸CPU

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     拆卸阻碍接触CPU的导风罩。

(7)     拆卸带有CPU的散热器。

注意

CPU底座中的针脚极为脆弱,容易损坏。为避免该针脚损坏而导致更换主板,请勿触摸针脚。

 

请严格按照CPU表面标签④~①的顺序,依次拧开散热器上的松不脱螺钉,然后缓缓向上提起散热器。

(8)     拆卸带有CPU的夹持片。

a.     查找夹持片上的“TIM BREAKER”标识,然后使用扁平工具(例如一字螺丝刀)插入“TIM BREAKER”标识旁边的豁口,轻轻旋转螺丝刀使夹持片从散热器上松开。

b.     松开夹持片的四个角。将夹持片一角和其对角上的固定弹片向外掰开,夹持片另一角和其对角上的固定弹片向内推入。

c.     将带有CPU的夹持片向上抬起,使其脱离散热器。

(9)     拆卸夹持片中的CPU。将夹持片一端轻轻向下掰,对应的CPU一端会自动脱离夹持片,从夹持片中取出CPU。

2. 安装CPU

(1)     将CPU安装到夹持片。斜置CPU,使CPU一端的导向口与夹持片一端的导向柱相扣。需要注意的是,CPU上带有三角形标记的一角必须和夹持片上带有三角形标记的一角对齐。

(2)     在CPU上涂抹导热硅脂。

a.     用异丙醇擦拭布将CPU顶部和散热器表面清理干净,如果表面有残余的导热硅脂也要擦拭干净,确保表面干净无油。待异丙醇挥发后再进行下一步操作。

b.     用导热硅脂注射器将导热硅脂挤出0.6ml,然后采用五点法将导热硅脂涂抹在CPU顶部。

(3)     将带有CPU的夹持片安装到散热器。使夹持片上带有三角形标记的一角和散热器上带有缺口的一角对齐,向下放置并按压夹持片,直到听见咔哒提示音,夹持片的四个角和散热器的四个角已紧紧相扣。

(4)     将带有CPU和夹持片的散热器安装到服务器。

注意

请使用1.4N·m(12in-lbs)的扭矩拧紧螺钉,否则可能会造成CPU接触不良或者损坏CPU底座中的针脚。

 

a.     使夹持片上的三角形和CPU底座上带有缺口的一角对齐,散热器上的两个孔对准CPU底座上的两个导向销,将散热器向下放置在CPU底座上。

b.     依次拧紧散热器上的松不脱螺钉。请严格按照CPU散热器表面标签①~④的顺序固定螺钉,错误的顺序可能会造成螺钉脱落。

注意

请务必将随CPU发货的条码标签,粘贴到散热器侧面,覆盖散热器上原有条码标签,否则将无法提供该CPU的后续保修服务。

 

(5)     (可选)拆卸或安装导风罩面板。

·     拆卸导风罩面板。当更换前CPU对应标准散热器,更换后CPU对应高性能散热器时,为确保CPU正常散热,需要拆卸导风罩上的两个面板。

a.     向上掰开导风罩面板上的固定弹片。

b.     将导风罩面板向外滑动并向上提起,使其脱离导风罩。

·     安装导风罩面板。当更换前CPU对应高性能散热器,更换后CPU对应标准散热器时,为确保CPU正常散热,需要安装导风罩上的两个面板。

将导风罩面板放入槽位,然后向下按压同时向内滑动,直到听见咔哒一声,导风罩上的锁扣将导风罩面板紧紧扣住为止。

(6)     安装已拆卸的导风罩。将导风罩向下放入槽位。

(7)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(8)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(9)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(10)     安装服务器,具体步骤请参见3.4.2  安装

(11)     将服务器上电,具体步骤请参见4.1  上电

6.14.4  确认工作

可通过以下一种或多种方法判断CPU工作状态,以确保CPU安装成功。

·     登录BIOS界面,查看CPU信息是否正确。具体方法请参见产品BIOS用户指南。

·     登录HDM Web界面,查看CPU信息是否正确。具体操作请参见HDM联机帮助。

6.15  更换内存

6.15.1  更换场景

·     内存故障。

·     更换其他型号的内存。

·     内存阻碍其他部件维护。

6.15.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

·     了解内存安装准则,具体请参见2.11.10  内存安装准则

6.15.3  更换步骤

1. 拆卸内存

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声;然后将计算模块机框内侧的固定弹片向中心拉出,同时继续将计算模块向后滑动,直到滑不动为止。

(6)     拆卸阻碍接触内存的导风罩。

(7)     拆卸内存。打开内存插槽两侧的固定夹,并向上拔出内存。

2. 安装内存

(1)     安装内存。

说明

内存插槽的结构设计可以确保正确安装。将内存插入插槽时如果感觉很费力,则可能安装不正确,此时请将内存调换方向后再次插入。

 

内存底边的缺口与插槽上的缺口对齐,然后均匀用力将内存沿插槽竖直插入,此时固定夹会自动锁住。请确保固定夹已锁住内存且咬合紧密。

(2)     安装已拆卸的导风罩。将导风罩向下放入槽位。

(3)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(4)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(5)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(6)     安装服务器,具体步骤请参见3.4.2  安装

(7)     将服务器上电,具体步骤请参见4.1  上电

6.15.4  确认工作

请通过以下任意方式查看显示的内存容量与实际是否一致。

·     操作系统:

¡     Windows操作系统下,点击开始 > 运行,输入msinfo32,在弹出的页面查看内存容量。

¡     Linux操作系统下,可通过cat /proc/meminfo命令查看。

·     HDM:

登录HDM Web界面,查看内存容量。具体操作请参见HDM联机帮助。

·     BIOS:

选择Socket Configuration页签 > Memory Configuration > Memory Topology,然后按Enter,即可查看内存容量。

如果显示的内存容量与实际不一致,请重新插拔或安装内存。需要注意的是,当内存的内存模式为Mirror Mode或开启了Memory Rank Sparing时,操作系统下显示的内存容量比实际内存容量小属于正常情况。

6.16  更换硬盘背板

6.16.1  更换场景

硬盘背板故障。

6.16.2  更换步骤

1. 拆卸硬盘背板

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸所有风扇模块。握持风扇模块提手,将风扇模块从槽位中提起,使其脱离服务器。

(5)     拆卸风扇笼。

a.     依次拧开风扇笼的三个固定螺钉,松开风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿逆时针方向将螺钉旋转180°,螺钉会自动向上弹起。

b.     向上抬起风扇笼。

(6)     拆卸待更换硬盘背板上的所有硬盘。解锁硬盘扳手,然后将硬盘从槽位中拔出。

(7)     拆卸硬盘背板。

a.     断开硬盘背板上的所有线缆。

b.     拆卸硬盘背板。拧开硬盘背板上的松不脱螺钉,向上提起背板使其脱离服务器。

2. 安装硬盘背板

(1)     安装硬盘背板。

a.     向下放置硬盘背板,然后拧紧背板上的松不脱螺钉。

b.     连接硬盘背板上的所有线缆。

(2)     安装已拆卸的所有硬盘。

(3)     安装风扇笼。

a.     将风扇笼向下放入槽位。

b.     依次拧紧风扇笼的三个固定螺钉,固定风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿顺时针方向将螺钉旋转180°。

(4)     安装已拆卸的所有风扇模块。握持风扇提手,将风扇向下放入槽位。

(5)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(6)     安装服务器,具体步骤请参见3.4.2  安装

(7)     将服务器上电,具体步骤请参见4.1  上电

6.17  安装24LFF硬盘扩展模块

6.17.1  应用场景

从12LFF硬盘配置扩容为24LFF硬盘配置。

6.17.2  安装步骤

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸所有前部假面板。用尖且细的工具(如尖头镊子)穿过假面板右侧的散热孔,将假面板右侧撬起,假面板右侧会自动弹出,顺势将假面板取出。

(4)     拆卸所有硬盘。解锁硬盘扳手,然后将硬盘从槽位中拔出。

(5)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(6)     拆卸所有风扇模块。握持风扇模块提手,将风扇模块从槽位中提起,使其脱离服务器。

(7)     拆卸风扇笼。

a.     依次拧开风扇笼的三个固定螺钉,松开风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿逆时针方向将螺钉旋转180°,螺钉会自动向上弹起。

b.     向上抬起风扇笼。

(8)     拆卸12LFF硬盘背板。

a.     断开硬盘背板上的所有线缆。

b.     拆卸硬盘背板。拧开硬盘背板上的松不脱螺钉,向上提起背板使其脱离服务器。

(9)     安装24LFF硬盘扩展板。

a.     向下放置硬盘背板,然后拧紧背板上的松不脱螺钉。

b.     连接硬盘背板上的所有线缆。

(10)     安装风扇笼。

a.     将风扇笼向下放入槽位。

b.     依次拧紧风扇笼的三个固定螺钉,固定风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿顺时针方向将螺钉旋转180°。

(11)     安装已拆卸的所有风扇模块。握持风扇提手,将风扇向下放入槽位。

(12)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(13)     安装所有硬盘。将硬盘推入硬盘槽位,直到推不动为止,然后闭合硬盘扳手。

(14)     安装服务器,具体步骤请参见3.4.2  安装

(15)     将服务器上电,具体步骤请参见4.1  上电

6.18  更换电源转接

6.18.1  更换场景

·     电源转接板故障。

·     电源转接板阻碍其他部件维护。

6.18.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.18.3  更换步骤

1. 拆卸电源转接板

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     拆卸电源转接板。

a.     移除电源转接板的四颗固定螺钉。

b.     向上提起电源转接板,使其脱离服务器。

2. 安装电源转接板

(1)     安装电源转接板。水平向下放置电源转接板,并用四颗螺钉固定。

(2)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(3)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.19  更换CPU主板

介绍CPU主板(以下简称主板)的详细更换步骤。

6.19.1  更换场景

主板故障。

6.19.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.19.3  更换步骤

1. 拆卸主板

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     完全拉出阻碍操作的计算模块。

a.     半拉出计算模块。掰开计算模块的固定弹片,扳手会自动弹出;打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

b.     断开阻碍拉出计算模块的坦克链。拧开坦克链机箱端的固定螺钉,松开坦克链;将连接到CPU主板的坦克链线缆拔出。

c.     完全拉出计算模块。将计算模块机框内侧的固定弹片向中心拉出,同时继续将计算模块向后滑动,直到滑不动为止。

(6)     (可选)拆卸超级电容。

(7)     拆卸导风罩。按下导风罩两端按钮,同时向上提起导风罩。

(8)     拆卸所有内存。

(9)     拆卸所有CPU。

(10)     安装CPU底座上的盖片。向下放置盖片,然后按压盖片两个对角,使其固定在CPU底座上。

(11)     拆卸所有电源转接板。

(12)     拆卸系统电池。

(13)     拆卸Mezz存储控制卡。

(14)     拆卸所有SATA M.2 SSD卡。

(15)     拆卸所有风扇模块。握持风扇模块提手,将风扇模块从槽位中提起,使其脱离服务器风扇。

(16)     拆卸风扇笼。

a.     依次拧开风扇笼的三个固定螺钉,松开风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿逆时针方向将螺钉旋转180°,螺钉会自动向上弹起。

b.     向上抬起风扇笼。

(17)     移除主板上的所有线缆。

(18)     拆卸机箱两侧挡线板。掰开挡线板的固定锁扣,同时向上提起挡线板。

(19)     拆卸主板。

a.     拧开主板上的松不脱螺钉。

b.     拆卸主板。由于主板上部分接口(如USB接口、网口)嵌入在机箱中,所以需要将主板先往前拉一点,再慢慢抬起。

(20)     拆卸所有通流铜柱。将主板翻转,移除通流铜柱的固定螺钉,取出通流铜柱。

2. 安装主板

(1)     将拆卸的所有通流铜柱安装到新主板。将通流铜柱一端紧贴主板上的方孔,在主板反面用螺钉固定通流铜柱。

(2)     安装主板。

a.     将主板放入机箱槽位。将主板缓缓向下放置到机箱中,并往机箱后方推一点,使主板上部分接口(如USB接口、网口)嵌入到位。

b.     拧紧主板上的松不脱螺钉。

(3)     安装机箱两侧挡线板。使挡线板上的凹槽,对准机箱侧壁的铆钉,将挡线板向下放入槽位,直到听见咔哒一声,表示挡线板已紧紧固定。

(4)     连接所有线缆。

(5)     安装风扇笼。

a.     将风扇笼向下放入槽位。

b.     依次拧紧风扇笼的三个固定螺钉,固定风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿顺时针方向将螺钉旋转180°。

(6)     安装所有风扇模块。握持风扇提手,将风扇向下放入槽位。

(7)     安装SATA M.2 SSD卡。

(8)     安装Mezz存储控制卡。

(9)     安装系统电池。

(10)     安装所有电源转接板。

(11)     拆卸CPU底座上盖片。握持盖片,然后向上拿起盖片。

(12)     安装CPU和散热器。

(13)     安装所有内存。

(14)     安装导风罩。将导风罩的边沿紧贴固定支架,缓缓向下放入槽位,直到听见卡咔哒一声,导风罩两端完全固定。

(15)     (可选)安装超级电容。

(16)     推回计算模块。

a.     缓缓用力推回计算模块到半程位置。

b.     安装坦克链到机箱。将所有断开的线缆重新插入到CPU主板的接口;将坦克链重新固定到机箱。

c.     完全推回计算模块,并闭合扳手,计算模块会自动锁定。

(17)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(18)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(19)     安装服务器,具体步骤请参见3.4.2  安装

(20)     将服务器上电,具体步骤请参见4.1  上电

6.20  更换节点板

节点板位于计算模块内部,包含多个PCIe插槽,用于支持GPU卡、网卡等PCIe部件。

6.20.1  更换场景

节点板故障。

6.20.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.20.3  更换步骤

1. 拆卸节点板

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸计算模块上的所有PCIe卡。

(5)     拆卸中间支架。拧开支架的松不脱螺钉,向上抬起支架。

(6)     断开阻碍操作的坦克链。将连接到计算模块接口的坦克链线缆拔出;拧开计算模块端坦克链的固定螺钉,松开坦克链。

(7)     拆卸节点板。移除节点板的固定螺钉,然后向上抬起节点板。需要注意的是,请妥善保管已拆卸的小挡风板,以备后续使用。

2. 安装节点板

(1)     安装节点板。使节点板上的导向孔对准机框的导向销,将节点板放入槽位,并用螺钉固定。需要注意的是,已拆卸的小挡风板需要通过螺钉固定到新主板。

(2)     固定坦克链,并连接坦克链中的线缆到计算模块。通过固定螺钉将坦克链固定到计算模块,将所有断开的线缆重新插入到计算模块的接口。

(3)     安装中间支架。使支架两侧的导向孔对准计算模块上的导向销,将支架放入槽位,并拧紧支架的松不脱螺钉。

(4)     安装计算模块上已拆卸的所有PCIe卡。

(5)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(6)     安装服务器,具体步骤请参见3.4.2  安装

(7)     将服务器上电,具体步骤请参见4.1  上电

6.21  更换系统电池

6.21.1  更换场景

缺省情况下,服务器主板上已配置系统电池(型号为Panasonic BR2032)。一般情况下,系统电池寿命为5至10年。

出现以下情况时,请更换系统电池。建议用户选择的电池型号为Panasonic BR2032。

·     电池故障。

·     电池电力消耗完毕,服务器不再自动显示正确的日期和时间。

说明

电池故障或电力消耗完毕,会导致BIOS恢复为缺省设置。更换电池后,如有需要,请重新设置BIOS,具体方法请参见产品的BIOS用户指南。

 

6.21.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.21.3  更换步骤

1. 拆卸系统电池

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     拆卸系统电池。向外轻掰电池,然后将电池移出。

说明

拆卸下来的系统电池,请弃于专门的电池处理点,勿随垃圾一起丢弃。

 

2. 安装系统电池

(1)     安装系统电池。沿电池插槽插入系统电池。

(2)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(3)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(4)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(5)     安装服务器,具体步骤请参见3.4.2  安装

(6)     将服务器上电,具体步骤请参见4.1  上电

6.22  更换智能挂耳

6.22.1  更换场景

·     智能挂耳故障。

·     智能挂耳阻碍其他部件维护。

6.22.2  准备工作

·     请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

·     更换部件前,请检查插槽或连接器,确保针脚没有损坏(比如针脚弯曲、连接器上有异物)。

6.22.3  更换步骤

1. 拆卸智能挂耳

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     拆卸所有风扇模块。握持风扇模块提手,将风扇模块从槽位中提起,使其脱离服务器。

(5)     拆卸风扇笼。

a.     依次拧开风扇笼的三个固定螺钉,松开风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿逆时针方向将螺钉旋转180°,螺钉会自动向上弹起。

b.     向上抬起风扇笼。

(6)     拆卸阻碍操作的开箱检测模块。

a.     拆卸开箱检测模块固定支架。移除支架的固定螺钉,将支架沿着导向柱拉出,使其脱离服务器。

b.     取出开箱检测模块。

(7)     从主板上拔出左右侧智能挂耳线缆。

(8)     拆卸机箱两侧的线缆保护盖。移除保护盖的固定螺钉,然后将保护盖取出。

(9)     拆卸智能挂耳。移除智能挂耳的四颗固定螺钉,从槽位中拉出智能挂耳。

2. 安装智能挂耳

(1)     安装智能挂耳。将智能挂耳紧贴服务器,并用螺钉固定。

(2)     安装线缆保护盖。将保护盖紧贴机箱,并用螺钉固定。

(3)     连接挂耳线缆到主板。

(4)     安装开箱检测模块。

a.     将开箱检测模块放置到槽位。

b.     安装开箱检测模块固定支架。使支架上的导向孔对准机箱上的导向销,将支架放入槽位,然后用螺钉固定支架。

(5)     安装风扇笼。

a.     将风扇笼向下放入槽位。

b.     依次拧紧风扇笼的三个固定螺钉,固定风扇笼。向上抬起固定螺钉的弹片,握持弹片将螺钉用力向下按压,同时沿顺时针方向将螺钉旋转180°。

(6)     安装已拆卸的所有风扇模块。握持风扇提手,将风扇向下放入槽位。

(7)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(8)     安装服务器,具体步骤请参见3.4.2  安装

(9)     将服务器上电,具体步骤请参见4.1  上电

6.23  安装TPM/TCM模块

介绍TPM/TCM模块的详细安装步骤,以及如何开启TPM/TCM模块功能。

6.23.1  操作场景

扩容TPM/TCM模块。

6.23.2  准备工作

请提前做好防静电措施:穿上防静电工作服;正确佩戴防静电腕带并良好接地;去除身体上携带的易导电物体(如首饰、手表)。

6.23.3  安装TPM/TCM模块

1. TPM/TCM模块简介

·     TPM/TCM是内置在主板上的微芯片,拥有独立的处理器和存储单元,用于存储加密信息(如密钥),为服务器提供加密和安装认证服务。TPM需要与驱动器加密技术配合使用,如Microsoft Windows BitLocker驱动器加密技术,BitLocker使用TPM帮助保护Windows操作系统和用户数据,并确保服务器中的数据即使在无人参与、丢失或被盗的情况下也不会被篡改,关于BitLocker的更多信息,请访问Microsoft网站(http://www.microsoft.com/)。

·     TPM/TCM模块是可信计算平台的硬件模块,为可信计算平台提供密码运算功能,具有受保护的存储空间。

2. 开启TPM/TCM功能流程

开启TPM/TCM功能的流程如图6-1所示。

图6-1 开启TPM/TCM功能流程

 

3. 安装TPM/TCM模块

(1)     将服务器下电,具体步骤请参见4.2  下电

(2)     拆卸服务器,具体步骤请参见3.6  拆卸

(3)     拆卸机箱盖。

a.     (可选)如果机箱盖已上锁,请使用T15 Torx星型螺丝刀将箱盖扳手上的螺钉旋转90°到解锁标识,使其解锁。

b.     按下机箱盖扳手并向上掰起,此时机箱盖会自动向机箱后方滑动。

c.     向上抬起机箱盖。

(4)     (可选)如果已安装RAID卡,请拆卸RAID卡,并断开RAID卡上的所有线缆。

(5)     拉出阻碍操作的计算模块。

a.     解锁计算模块。掰开计算模块的固定弹片,扳手会自动弹出。

b.     从槽位拉出计算模块。打开扳手,计算模块会自动向服务器后方滑动;握持扳手将计算模块继续向后方滑动,直到咔哒一声。

(6)     安装TPM/TCM模块。

a.     对准CPU主板上的TPM/TCM连接器,向下缓缓用力插入TPM/TCM模块。

b.     对准TPM/TCM模块上的孔,向下插入销钉。

c.     对准销钉上的孔,向下缓缓用力插入TPM/TCM模块的固定铆钉。

(7)     推回计算模块。缓缓用力推回计算模块,并闭合扳手,计算模块会自动锁定。

(8)     (可选)安装RAID卡。重新连接RAID线缆到RAID卡,并将RAID卡安装到计算模块。

(9)     安装机箱盖。

a.     按下扳手上的按钮并将扳手向上掰起。

b.     将机箱盖水平向下放置,使机箱盖扳手上的孔对准机箱中的定位销。

c.     闭合机箱盖扳手,机箱盖会自动滑到闭合位置。

d.     (可选)如果需要为机箱盖上锁,请使用T15 Torx星型螺丝刀将机箱盖扳手上的螺钉旋转90°到锁定标识,锁定机箱盖。

(10)     安装服务器,具体步骤请参见3.4.2  安装

(11)     将服务器上电,具体步骤请参见4.1  上电

4. 在BIOS中开启TPM/TCM功能

(1)     进入BIOS,具体步骤请参见产品的BIOS用户指南。

(2)     服务器缺省开启支持TPM/TCM功能,在BIOS中开启或禁用TPM/TCM功能的具体方法请参见产品的BIOS用户指南。

(3)     登录HDM Web界面,查看TPM/TCM模块工作状态是否正常。详细信息请参见HDM联机帮助。

5. 在操作系统中设置加密技术

在操作系统中设置加密技术的详细信息请参见操作系统提供的加密技术文档。

有关Microsoft Windows BitLocker驱动器加密技术的详细信息,请访问Microsoft网站(http://technet.microsoft.com/en-us/library/cc732774.aspx)获取。开启BitLocker驱动器加密技术时,系统会自动生成恢复密钥,您可将该密钥打印或保存到外部存储设备中。系统启动过程中,当BitLocker检测到系统完整性受损或软硬件变更时,数据访问将处于锁定状态,需要用户手动输入该恢复密钥。为确保安全性,保管恢复密钥过程中请注意:

·     为避免恢复密钥丢失,请将密钥保存到多个外部存储设备(例如U盘)中,形成备份。

·     请勿将恢复密钥保存到加密硬盘中。

6. 安装后注意事项

·     禁止拆卸已安装的TPM/TCM模块。一旦安装后,TPM/TCM模块就会成为主板的永久组成部分。

·     为确保信息安全,安装或更换其他部件时,仅用户可以开启TPM/TCM功能或输入恢复密钥,H3C技术人员不能执行上述操作。

·     更换主板时,请勿从主板上拆卸TPM/TCM模块。当用户需要更换主板或更换TPM/TCM模块时,H3C技术人员将提供新的TPM/TCM模块和备用主板。

·     试图从主板上拆卸已安装的TPM/TCM模块,可能会毁坏或损伤TPM/TCM固定铆钉。一旦发现铆钉毁坏或损伤,管理员应认为系统已受损,请采取适当的措施确保系统数据的完整性。

·     H3C对于因TPM/TCM模块使用不当而导致无法访问数据的问题不承担任何责任。更多操作说明请参见操作系统提供的加密技术文档。

·     禁止用户自行拆卸TPM/TCM模块,否则可能会毁坏或损伤TPM/TCM模块的固定铆钉,从而导致系统受损。

·     当您怀疑TPM/TCM模块故障时,请拆卸带有故障TPM/TCM模块的主板,并联系H3C技术人员更换主板和TPM/TCM模块。

 


7 布线

介绍各部件的线缆连接方法。

说明

连接服务器各部件的线缆时,请妥善走线,确保线缆不会被挤压。

 

7.1  连接硬盘线缆

7.1.1  12LFF硬盘配置

1. 连接8LFF SAS/SATA硬盘数据线缆

·     配置一:8LFF SAS/SATA硬盘连接到Mezz存储控制卡,数据线缆连接方法如图7-1所示。

图7-1 12LFF硬盘背板连接到Mezz存储控制卡

 

·     配置二:8LFF SATA硬盘连接到主板上的SlimSAS接口,线缆连接方法如图7-2所示。

图7-2 12LFF硬盘背板连接到RSTe板载软RAID

 

·     配置三:8LFF SAS/SATA硬盘连接到标准存储控制卡,数据线缆连接方法如图7-3图7-1所示。

图7-3 12LFF硬盘背板连接到标准存储控制卡

 

2. 连接4LFF NVMe硬盘数据线缆

4LFF NVMe硬盘数据线缆连接方法如图7-4所示。

图7-4 连接4LFF NVMe硬盘数据线缆

 

需要注意的是,连接NVMe数据线缆时,线缆上的标签需要与硬盘背板、主板上的SlimSAS接口一一对应,具体对应关系请参见表7-1

表7-1 连接NVMe数据线缆的对应关系

硬盘背板上的接口

NVMe数据线缆上的标签

主板上的SlimSAS接口

硬盘背板端

主板端

(1):NVMe1

NVMe1

NVMe B1/B2

(5):SlimSAS接口B1/B2

(2):NVMe2

NVMe2

NVMe B1/B2

(3):NVMe3

NVMe3

NVMe B3/B4

(6):SlimSAS接口B3/B4

(4):NVMe4

NVMe4

NVMe B3/B4

 

3. 连接电源线缆

电源线的连接方法如图7-5所示。

图7-5 连接12LFF硬盘电源线缆

 

需要注意的是,连接电源线缆时,线缆上的标签需要与硬盘背板、主板上的接口一一对应,具体对应关系请参见表7-2

表7-2 连接电源线缆的对应关系

线缆编号

硬盘背板上的接口

电源线缆上的标签

主板上的电源接口

硬盘背板端

主板端

1

PWR1

BP PWR

MB PWR1

PWR1

2

PWR2

BP PWR

MB PWR2

PWR2

3

PWR3

BP PWR

MB PWR3

PWR3

 

4. 连接AUX信号线缆

AUX信号线的连接方法如图7-6所示。

图7-6 连接12LFF硬盘AUX信号线缆

 

7.1.2  24LFF硬盘配置

1. 连接24LFF SAS/SATA硬盘数据线缆

·     配置一:24LFF SAS/SATA硬盘数据线缆连接到Mezz存储控制卡上,线缆连接方法如图7-7所示。

图7-7 连接24LFF SAS/SATA硬盘数据线缆到Mezz存储控制卡

 

·     配置二:24LFF SAS/SATA硬盘数据线缆连接到标准存储控制卡上,线缆连接方法如图7-8所示。

图7-8 连接24LFF SAS/SATA硬盘数据线缆到标准存储控制卡

 

2. 连接8LFF NVMe硬盘数据线缆

8LFF NVMe硬盘数据线缆连接方法如图7-9所示。

图7-9 连接8LFF NVMe硬盘数据线缆

 

连接NVMe数据线缆时,线缆上的标签需要与硬盘背板、主板上的SlimSAS接口、LP SlimSAS接口一一对应,具体对应关系请参见表7-3

表7-3 NVMe数据线缆的连接位置对应关系

硬盘背板上的接口

NVMe数据线缆上的标签

主板上的SlimSAS接口或LP SlimSAS接口

硬盘背板端

主板端

(1):NVMe-A3/A4

NVMe-A3/A4

NVMe-A1/A2/A3/A4

(7):LP SlimSAS接口M1

(2):NVMe-A1/A2

NVMe-A1/A2

NVMeA AUX

(8):NVMe AUX接口

(3):NVMe-B1/B2

NVMe-B1/B2

NVMe-B1/B2

(5):SlimSAS接口B1/B2

(4):NVMe-B3/B4

NVMe-B3/B4

NVMe-B3/B4

(6): SlimSAS接口B3/B4

 

3. 连接电源线缆

电源线的连接方法如图7-10所示。

图7-10 连接硬盘电源线缆

 

需要注意的是,连接电源线缆时,线缆上的标签需要与硬盘背板、主板上的接口一一对应,具体对应关系请参见表7-4

表7-4 连接电源线缆的对应关系

线缆编号

硬盘背板上的接口

电源线缆上的标签

主板上的电源接口

硬盘背板端

主板端

1

PWR1

BP PWR

MB PWR1

PWR1

2

PWR2

BP PWR

MB PWR2

PWR2

3

PWR3

BP PWR

MB PWR3

PWR3

 

4. 连接AUX信号线缆

AUX信号线的连接方法如图7-11所示。

图7-11 连接AUX信号线缆

 

7.2  连接GPU计算模块线缆

7.2.1  连接8GPU-AI线缆

AI场景下8GPU计算模块的数据和AUX信号线缆的连接方法如图7-12所示。

图7-12 连接8GPU-AI数据和AUX信号线缆

 

连接8GPU计算模块线缆时,线缆上的标签需要与GPU计算模块、主板上的LP SlimSAS接口一一对应,具体对应关系请参见表7-5

表7-5 8GPU计算模块线缆连接对应关系

主板上的接口

线缆上的标签

8GPU节点板上的接口

线缆连接要求(必选/可选)

线缆连接作用

主板端

8GPU节点板端

(1):GPU计算模块AUX接口

MB AUX

GPU AUX

(5):GPU AUX

必选

传输GPU AUX信号

(2):LP SlimSAS接口M6

M1/M6

N1/N6

(4):LP SlimSAS接口N6

可选

使PCIe slot3可用

(3):LP SlimSAS接口M5

M1/M5

N2/N5

(8):LP SlimSAS接口N2

可选

使PCIe slot2可用

(11):LP SlimSAS接口M1

M1/M6

N1/N6

(9):LP SlimSAS接口N1

可选

使PCIe slot1可用

(12):LP SlimSAS接口M3

M3/M5

N3/N5

(10):LP SlimSAS接口N3

必选

使GPU卡可用

-

-

N4N5,即无需连接到主板,仅需要连接节点板上的2个接口

(6):LP SlimSAS接口N4

连接到

(7):LP SlimSAS接口N5

必选

使GPU卡可用

表中线缆并非全部需要连接,用户可根据实际需求连接线缆。

 

7.2.2  连接8GPU-HPC线缆

HPC场景下,8GPU计算模块的数据线缆和AUX信号线缆的连接方法如图7-13所示。

图7-13 连接8GPU-HPC数据线缆和AUX信号线缆

 

连接8GPU计算模块线缆时,线缆上的标签需要与GPU节点板、主板上的LP SlimSAS接口一一对应,具体对应关系请参见表7-6

表7-6 8GPU计算模块线缆连接对应关系

主板上的接口

线缆上的标签

8GPU节点板上的接口

线缆连接要求(必选/可选)

作用

主板端

GPU节点板端

(1):GPU计算模块AUX接口

MB AUX

GPU AUX

(4):GPU AUX

必选

传输GPU信号

(2):LP SlimSAS接口M6

M1/M6

N1/N6

(5):LP SlimSAS接口N6

可选

使PCIe slot 3可用

(3):LP SlimSAS接口M5

M1/M5

N2/N5

(7):LP SlimSAS接口N5

必选

使GPU卡可用

(11):LP SlimSAS接口M1

M1/M6

N1/N6

(9):LP SlimSAS接口N1

可选

使PCIe slot 1可用

(12):LP SlimSAS接口M3

M3/M5

N3/N5

(10):LP SlimSAS接口N3

必选

使GPU卡可用

-

-

N2N4,即无需连接到主板,仅需要连接节点板上的2个接口

(8):LP SlimSAS接口N2

连接到

(6):LP SlimSAS接口N4

可选

使PCIe slot 2可用

表中线缆并非全部需要连接,用户可根据实际需求连接线缆。

 

7.2.3  连接16GPU线缆

16GPU计算模块的数据和AUX信号线缆的连接方法如图7-14所示。

图7-14 连接16GPU数据和AUX信号线缆

 

连接16GPU计算模块线缆时,线缆上的标签需要与GPU计算模块、主板上的LP SlimSAS接口丝印一一对应,具体对应关系请参见表7-5

表7-7 16GPU计算模块线缆的连接位置对应关系

主板上的接口

线缆上的标签

16GPU节点板上的接口

线缆连接要求(必选/可选)

作用

主板端

节点板端

(1):GPU AUX

MB AUX

GPU AUX

(4):GPU AUX

必选

传输GPU信号

(2):PCIe M6

M6

N6

(5):PCIe N6

必选

使GPU卡可用

(3):PCIe M5

M5

N5

(6):PCIe N5

必选

使GPU卡可用

(9):PCIe M1

M1

N1

(7):PCIe N1

必选

使GPU卡可用

(10):PCIe M3

M3

N3

(8):PCIe N3

必选

使GPU卡可用

 

7.3  连接GPU卡电源线缆

GPU卡电源线缆需要连接到对应的GPU节点板上对应的电源接口,本文以GPU卡安装到slot 8为例。

图7-15 连接GPU卡电源线缆

 

7.4  连接超级电容线缆

7.4.1  连接Mezz存储控制卡的超级电容线缆

超级电容需安装在导风罩上的超级电容盒内,线缆连接方法如图7-16所示。

图7-16 连接Mezz存储控制卡的超级电容线缆

 

7.4.2  连接标准存储控制卡的超级电容线缆

图7-17 连接标准存储控制卡的超级电容线缆

 

7.5  连接智能挂耳线缆

智能挂耳线缆包含:前面板I/O组件线缆、VGA和USB 2.0接口线缆,线缆连接方法如图7-18所示。

图7-18 连接智能挂耳线缆

(1):前面板I/O组件线缆

(2):VGA和USB 2.0接口线缆

 


8 日常维护指导

本章介绍服务器的日常维护方法。

8.1  基本维护原则

·     服务器所在机房应保持整洁,温度和湿度符合服务器运行要求,机房内不放置无关设备和物品。

·     定期通过HDM检查服务器的健康状态,如果不健康,则需要立即检查并排除故障。

·     了解操作系统和应用软件最近的更新情况,并根据需求更新软件。

·     制定可靠的备份计划。

¡     根据服务器的运行情况,定时备份数据。

¡     如果数据频繁改变则需随时备份。

¡     定时检查备份以确保数据保存正确。

·     现场保留一定数量的备件,以便部件出现故障时可及时更换。备件使用后,请及时补充。

·     为方便解决组网方面的问题,请保存最新的网络拓扑图。

8.2  维护工具

维护服务器需要以下工具:

·     通过温湿度计监控服务器运行环境。

·     通过HDM、FIST和iFIST的健康管家监控服务器运行状态。

8.3  维护操作

介绍服务器的日常维护任务和操作方法。

8.3.1  任务列表

日常维护任务如表8-1所示。

表8-1 日常维护任务

任务

所需工具

查看服务器监控指示灯

/

监测机房温度和湿度

温湿度计

检查线缆

/

 

8.3.2  查看服务器监控指示灯

检查服务器前后面板上的所有指示灯状态是否正常。关于指示灯的详细说明,请参见2.5.2  指示灯和按钮2.6.2  后面板指示灯

8.3.3  监测机房温度和湿度

请使用温湿度计测量机房温度和湿度,确保温湿度控制在服务器的工作范围内,关于服务器工作和贮存环境温湿度要求,请参见2.2.2  技术参数

8.3.4  检查线缆

检查通信线缆、电源线缆连接是否正常。

1. 注意事项

插拔线缆时,请勿用力过猛。

请勿扭曲或拉扯线缆。

合理布线。请确保需要安装或更换的部件不会接触线缆。

2. 检查标准

线缆类型正确。

连接正确、牢固,长度合适。

线缆无老化,连接点无扭曲、无腐蚀。

不同款型规格的资料略有差异, 详细信息请向具体销售和400咨询。H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!

新华三官网
联系我们