手册下载
H3C XG310 GPU用户指南-6W101-整本手册.pdf (916.24 KB)
|
|
|
|
|
H3C XG310 GPU卡 |
|
用户指南 |
|
|
|
|
|
新华三技术有限公司 http://www.h3c.com
资料版本:6W101-20210521 |
Copyright © 2021 新华三技术有限公司及其许可者 版权所有,保留一切权利。
未经本公司书面许可,任何单位和个人不得擅自摘抄、复制本书内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
由于产品版本升级或其他原因,本手册内容有可能变更。H3C保留在没有任何通知或者提示的情况下对本手册的内容进行修改的权利。本手册仅作为使用指导,H3C尽全力在本手册中提供准确的信息,但是H3C并不确保手册内容完全没有错误,本手册中的所有陈述、信息和建议也不构成任何明示或暗示的担保。
目 录
本手册中,所有部件的型号做了简化。比如GPU卡型号GPU-XG310-32GB-FHFL,代表用户可能看到UN-GPU-XG310-32GB-FHFL、UN-GPU-XG310-32GB-FHFL-F。
GPU-XG310-32GB-FHFL(以下简称XG310)是H3C自研的服务器GPU卡。XG310采用Intel SG1 GPU模块,基于第12代(Gen12)图形核心架构,能够显著提升性能并降低功耗。该卡拥有4个相互独立的GPU模块,服务器可以根据业务情况调用不同数量的GPU模块参与图像处理和数据运算,每个GPU模块最大可支持96个执行单元。XG310可广泛应用于云游戏、虚拟桌面、图像和视频处理等场景。
图1-1 GPU卡外观图
图1-2 GPU卡接口
表1-1 接口说明
|
编号 |
说明 |
|
1 |
供电接口 |
|
2 |
PCIe3.0 x16 |
GPU卡的硬件参数如表1-2所示。
|
参数 |
说明 |
|
GPU模块封装类型 |
FCBGA |
|
GPU模块数量 |
4 |
|
EUs |
每个GPU模块包含96 EUs |
|
显存类型 |
LPDDR4x |
|
显存容量 |
· 单个GPU模块显存容量:8GB · GPU卡总显存容量:32GB |
|
GPU模块显存位宽 |
128 bit |
|
GPU模块显存带宽 |
68.25GB/s |
|
显存工作速率 |
4267MT/s |
|
GPU工作频率 |
· Boost:1.1 GHz · Base:0.9 GHz |
|
功耗 |
· 单个GPU模块功耗:23W · GPU卡总功耗:150W |
|
总线类型 |
PCIe3.0 x16 |
|
供电接口类型 |
PCIe 8-pin |
|
散热方式 |
被动散热 |
|
GPU最高正常工作温度 |
95°C(超过95℃后降频工作) |
|
GPU强制下电温度 |
130°C |
GPU卡支持的软件特性如表1-3所示。
表1-3 软件特性
|
特性 |
说明 |
|
Fixed Function Decode |
支持(AVC/HEVC/VP9/MPEG-2/JPEG) |
|
Fixed Function Encode |
支持(AVC/HEVC/VP9/JPEG) |
|
Programmable Encode |
支持(AVC/HEVC/MPEG-2) |
|
AV1 Decode |
仅支持Decode |
|
GFX/APIs |
支持(OpenGL/OpenGL ES) |
|
Virtualization Mode |
仅支持Pass-through Mode |
|
不支持 |
|
|
兼容的操作系统 |
· Linux:支持CentOS、Debian · VMware:暂不支持 · Windows:暂不支持 |
|
Hypervisor |
支持KVM |
|
Host OS |
支持CentOS |
|
Guest OS |
支持CentOS |
GPU卡的尺寸如图1-3所示。
图1-3 GPU卡尺寸
GPU卡运行的运行环境要求如表1-4所示。
|
项目 |
要求 |
|
温度 |
· 工作环境温度:0°C~55°C · 贮存环境温度:-40°C~70°C |
|
湿度 |
· 工作环境湿度:8%~90%RH(无冷凝) · 贮存环境湿度:5%~95%RH(无冷凝) |
GPU卡的风道方向如图1-4所示,GPU卡的入口温度与风量需求如表1-5所示。
图1-4 GPU卡风道方向
表1-5 GPU卡入口温度与风量需求
|
GPU卡入口温度(℃) |
风量需求 |
|
55℃ |
12 CFM |
|
50℃ |
10 CFM |
|
45℃ |
8 CFM |
|
40℃ |
6 CFM |
为了确保GPU卡可以稳固地安装到服务器,建议根据服务器的实际情况,为GPU卡配置固定支架。固定支架螺孔的位置如图3-1所示,孔距和孔径的尺寸如表3-1所示。
|
编号 |
说明 |
尺寸 |
|
1 |
孔距 |
28.5mm |
|
2 |
孔径 |
M3 |
将GPU卡安装到服务器的详细步骤,请参见服务器用户指南。
您可以访问H3C网站(http://www.h3c.com/cn/Service/Software_Download/),获取GPU卡的固件和驱动程序,以及对应的安装说明。
正确安装驱动程序后,GPU卡才可以被识别和使用。本文以CentOS 7.4为例介绍驱动程序的安装方法。
(1) 将4.1 固件和驱动的下载中获取的驱动程序拷贝到服务器,并解压。
(2) 安装kernel和驱动程序。
a. 如图4-1所示,执行“./install-sg1.sh”命令。
b. 如图4-2所示,输入“y”,安装驱动对应的kernel。
c. 如图4-3所示,输入“y”,安装Media驱动。
图4-3 安装Media驱动
d. 如图4-4所示,输入“y”,安装Mesa驱动。
(3) 修改系统配置文件。
a. 修改GRUB设置。如图4-5所示,打开“/boot/efi/EFI/centos/grubenv”文件,将原有的“saved_entry”所在行修改成“saved_entry=CentOS Linux (4.14.105) 7 (Core)”。
b. 添加内核选项。打开“/boot/efi/EFI/centos/grub.cfg”文件,在如图4-6所示位置(“en_US.UTF-8”后面)添加:空格+“modprobe.blacklist=ast”字段。
(4) 执行“systemctl disable gdm”命令,关闭GDM服务。
(5) 执行“reboot”命令,重启服务器。
(6) 在服务器上执行如下命令配置环境变量:
export LD_LIBRARY_PATH=/usr/local/lib:/usr/local/lib64:/usr/local/lib64/dri/:/usr/l
ib64/:/usr/lib64/dri:${LD_LIBRARY_PATH}
export DISPLAY=:0.0
export MESA_LOADER_DRIVER_OVERRIDE=iris
export LD_LIBRARY_PATH=.:/opt/intel/mediasdk/lib64/:${LD_LIBRARY_PATH}
export LIBVA_DRIVER_NAME=iHD
export LIBVA_DRIVERS_PATH=/opt/intel/mediasdk/lib64
(7) 执行“/usr/bin/X –sharevts &”命令,将XG310的GPU模块连接到X服务。
(1) 如图4-7所示,在驱动程序的根路径下执行“./gpu_sanity_test_sh”命令,对4个GPU模块进行Sanity测试,结果为PASS表示测试通过。
(2) 如图4-8所示,执行“glxinfo |grep Mesa”命令来查看3D driver的版本信息。
图4-8 查看Mesa驱动版本
(3) 如图4-9所示,执行“vainfo”命令来查看Media 的驱动版本信息。
图4-9 查看Media驱动版本
本节介绍在操作系统下查看XG310相关信息的操作步骤。
(1) 执行“lspci | grep VGA”命令,查看XG310的GPU模块信息。每张XG310通常情况下可识别到4个PCI设备(Device 4907),分别代表一个GPU模块,如图4-10所示。
图4-10中第一个PCI设备(bus号是05:00.0)为主板自带的VGA设备。
图4-10 查看GPU模块
(2) 执行“lspci | grep 4910”命令,查看XG310的PCI bridge信息。每张XG310通常情况下可识别到4个PCI bridge(Device 4910),分别代表一个GPU模块,如图4-11所示。
(3) 执行“lspci –vvvnn –s bus”命令(此处的bus对应(1)中查询到的bus号),来查看GPU模块的详细PCI信息,如图4-12所示。
图4-12 查看详细PCI信息
(4) 执行“lspci –s bus –vv | grep “LnkSta”命令(此处的bus对应(2)中查询到的bus号),来查看PCI bridge的link status,如图4-13所示。
图4-13 查看PCI bridge的link status
为了更好地使用GPU卡,建议将固件升级到最新版本,详细操作步骤请参考4.1 固件和驱动的下载中获取的固件安装说明。
UL 60950-1
UL 62368-1
IEC 60950-1
IEC 62368-1
EN 60950-1
EN 62368-1
GB 4943.1
EN 55024
EN 55032
EN 55035
CISPR 24
CISPR 32
CISPR 35
AS/NZS CISPR 32
FCC Part 15 Subpart B
ICES-003 Issue 7
ANSI C63.4
VCCI-CISPR 32
表6-1 缩略语
|
缩略语 |
英文解释 |
中文解释 |
|
A |
||
|
AVC |
Advanced Video Coding |
高级视频编码 |
|
AV1 |
AOMedia Video 1 |
一种新兴的开源、版权免费的视频压缩格式 |
|
C |
||
|
CFM |
Cubic Feet per Minute |
立方英尺/分钟 |
|
E |
||
|
ECC |
Error Correcting Code |
错误检查和纠正 |
|
EU |
Execution Unit in the Graphics Processor |
GPU执行单元 |
|
G |
||
|
GPU |
Graphics Processing Unit |
图形处理器 |
|
H |
||
|
HEVC |
High Efficiency Video Coding |
高效率视频编码 |
|
M |
||
|
MPEG2 |
Moving Picture Experts Group |
基于数字存储媒体运动图像和语音的压缩标准 |
|
S |
||
|
SoC |
System-on-chip |
系统级芯片 |
|
SDK |
Software Development Kit |
软件工具开发包 |
|
T |
||
|
TDP |
Thermal Design Power |
热设计功耗 |
|
V |
||
|
VP9 |
— |
由Google开发的开放格式、无使用授权费的视频压缩标准 |
