国家 / 地区

H3C UIS 6.5超融合产品vGPU配置指导-5W100

手册下载

 

H3C UIS 6.5超融合产品

vGPU配置指导

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

资料版本:5W100-20191125

Copyright © 2019 新华三技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。

本文档中的信息可能变动,恕不另行通知。

 

1 简介··· 1

1.1 vGPU介绍·· 1

1.2 特性优点·· 1

1.3 实现原理·· 1

1.4 使用场景·· 3

1.5 使用限制·· 3

2 配置指导··· 3

2.1 配置前提·· 3

2.2 配置准备·· 4

2.3 配置需求·· 4

2.4 注意事项·· 4

2.5 配置流程·· 4

3 附录··· 12

3.1 NVIDIA vGPU介绍·· 12

3.2 vGPU License介绍·· 13

3.3 部署NVIDIA License Server 14

3.4 配置虚拟机License· 16

3.5 修改虚拟机vGPU类型·· 17

3.6 创建业务模板·· 19

3.7 切换浏览器语言首选项·· 22

 


简介

1.1  vGPU介绍

vGPUVirtual Graphics Processing Unit,虚拟图像处理单元)是一种可以将一块物理显卡虚拟成多个GPUvGPU)的技术。

当数据中心存在多个虚拟机有使用GPU资源的需求,且主机装有NVIDIA GRID GPU图形设备时,可以使用NVIDIA GRID vGPU技术,将一块物理显卡虚拟成多个vGPU,使单块物理显卡能够为多个虚拟机提供vGPU资源,满足虚拟机用户使用复杂2D图形处理、3D图形渲染等高性能图形服务的需求。

H3C UIS超融合管理平台集成了NVIDIA GRID vGPU技术,实现了GPU硬件虚拟化的解决方案。结合智能资源调度功能,UIS支持将虚拟化后的vGPU资源加入一个业务资源组,需要使用vGPU的虚拟机加入一个业务虚拟机组中,当业务虚拟机组中的虚拟机启动、重启时,系统会自动根据业务资源组中vGPU资源的空闲情况,以及虚拟机使用vGPU资源的优先级来动态的为虚拟机分配vGPU资源。虚拟机关机时,自动释放vGPU资源。

1.2  特性优点

·     资源共享,提升GPU资源利用率。

·     vGPU资源的智能调度。

1.3  实现原理

1. GPU虚拟化

GPU虚拟化的原理如下:

(1)     物理GPU通过DMA的方式直接获取图形应用下发给NVIDIA Driver的指令并进行处理

(2)     物理GPU将渲染后的结果存放在vGPU对应的显存内。

(3)     NVIDIA Driver直接从物理显存中抓取渲染数据。

图1 GPU虚拟化原理图

 

UIS集成的NVIDIA vGPU Manager软件是实现vGPU功能的核心组件。它将物理GPU虚拟切分为多个独立的vGPU。每个vGPU独享固定的显存(FrameBuffer),并通过分时复用机制在其碎片时间占用整个GPU Engines,包括Graphics(3D)Video EncodeVideo Decode Engines等。

2. vGPU智能调度

vGPU的智能调度是将同一集群下不同主机上的vGPU资源添加到一个业务资源组中。将多个实现同一类业务的虚拟机添加到一个业务虚拟机组中。每一个虚拟机都会应用一个业务模板。业务模板定义了在资源紧缺时,虚拟机使用资源的优先级以及应用低优先级业务模板的所有虚拟机占用资源的最高比例。

当业务虚拟机组中的虚拟机启动或重启时,H3C UIS超融合管理平台能够自动根据业务资源组中的资源空闲情况、虚拟机使用业务模板的优先级以及业务模板的分配比例来动态分配资源:

·     业务虚拟机组中的虚拟机应用相同优先级的业务模板时,先启动的虚拟机先获取vGPU资源。

·     业务资源组中的空闲vGPU数量少于业务虚拟机组中即将启动的虚拟机数量时,高优先级虚拟机将优先获得vGPU资源。

例如,业务资源组(资源池)中有10vGPU资源,业务虚拟机组中有12个虚拟机,其中VM1~VM4应用业务模板A(低优先级、分配比例20%),VM5~VM12应用业务模板B(高优先级、分配比例80%)。当VM1~VM12同时启动时,高优先级的虚拟机VM5~VM12会优先获取vGPU资源,低优先级的虚拟机VM1~VM4中只有2个虚拟机能获得vGPU资源,先启动虚拟机的先获取vGPU资源。

图2 先启动虚拟机先获取资源

 

·     当业务资源组中空闲的vGPU数量少于业务虚拟机组中即将启动的高优先级的虚拟机数量,并且应用相同低优先级业务模板的虚拟机使用的资源比例总和超过该业务模板的分配比例时,系统将释放部份低优先级虚拟机已使用的资源,以保障高优先级虚拟机的资源使用需求。

例如,业务资源组(资源池)中有10vGPU资源,业务虚拟机组中有12个虚拟机。其中VM1~VM4应用业务模板A(低优先级、分配比例20%),VM5~VM12应用业务模板B(高优先级、分配比例80%)。VM1~VM10处于运行状态,低优先级虚拟机VM1~VM4一共使用了4vGPU资源,占比40%(大于业务模板A的分配比例20%),当高优先级的虚拟机VM11VM12启动时,会抢占低优先级虚拟机使用的vGPU资源。

图3 高优先级虚拟机优先获得资源

 

1.4  使用场景

随着云桌面的普及,3D图形和多媒体等应用需求的增多,若使用GPU直通技术(通过VT-d技术,将物理GPU透传给某一个虚拟机,使虚拟机能够完全拥有物理GPU的资源和性能)来解决虚拟机对GPU资源的需求,成本太高,普通用户无法接受。面对此场景,GPU虚拟化是一个完美的解决方案。

1.5  使用限制

物理显卡必须支持NVIDIA GRID vGPU解决方案。

配置指导

本章节主要介绍的是在UIS超融合管理平台中虚拟机如何挂载使用vGPU设备的配置指导。

2.1  配置前提

服务器安装了支持NVIDIA GRID vGPU技术的显卡,具体安装步骤请参考服务器的相关手册。

2.2  配置准备

NVIDIA官网获取Virtual GPU License Manager安装包、gpumodeswitch工具、GPU驱动程序等软件。

2.3  配置需求

GPU资源共享:使同一业务虚拟机组的多个虚拟机可以共享使用同一物理GPU

vGPU资源智能调度:平台能够自动根据业务资源组中的资源空闲情况、虚拟机使用业务模板的优先级以及业务模板的分配比例来动态分配资源。

2.4  注意事项

·     NVIDIA vGPU是许可产品,vGPU没有获得License授权时,其功能会受到限制。用户可以部署NVIDIA License Server来对vGPU进行授权。部署和授权方式请参见附录部署NVIDIA License Server配置虚拟机License

·     每个虚拟机只能绑定一个vGPU设备。

·     每个物理GPU只能创建同一种类型的vGPU设备,但一块显卡上的不同物理GPU可以创建不同类型的vGPU设备。

·     已经创建vGPU设备的物理GPU不能再用于直通,正在以直通方式使用的物理GPU不能再用来创建vGPU设备。

·     显卡需要工作在图形模式。如果用户的显卡工作在计算模式,则必须使用gpumodeswitch工具将GPU的模式更改为图形模式。请参见NVIDIAgpumodeswitch User Guide手册。

2.5  配置流程

说明

本章节以安装了win7-64bit操作系统的虚拟机为例,介绍相关操作。

 

1. 创建vGPU设备

(1)     登录UIS超融合管理平台,选择顶部“主机”页签,进入主机管理页面。

(2)     单击主机列表中的目标主机名,进入主机概要信息页面。

(3)     选择“硬件配置”页签,单击<GPU设备>菜单项,进入主机GPU设备列表界面。

图4 主机GPU设备列表

 

(4)     选择目标GPU设备,单击,弹出增加vGPU对话框。

图5 增加vGPU对话框

 

(5)     vGPU类型下拉框中选择要虚拟的vGPU类型,单击<确定>按钮。

2. 虚拟机配置vGPU

(1)     选择顶部“云业务”页签,单击左侧导航树[智能资源调度]菜单项,进入智能资源调度业务列表页面。

图6 智能资源调度业务列表

 

(2)     单击<增加智能资源调度>按钮,弹出增加智能资源调度对话框。输入业务名称、描述,选择资源类型为vGPU

图7 增加智能资源调度对话框

 

(3)     单击<下一步>按钮,进入智能资源调度资源信息设置页面,在vGPU名称对应的下拉框中选择本次添加的vGPU资源池的类型,然后勾选加入资源池的vGPU

注意

一个资源池只能选择一种类型的vGPU

 

图8 智能资源调度资源信息页面

 

(4)     单击<下一步>按钮,进入设置业务虚拟机组页面。单击<增加>按钮,弹出增加智能资源调度业务虚拟机对话框。

图9 增加业务虚拟机

 

(5)     单击虚拟机右侧的,勾选使用本资源池的业务虚拟机,单击<确定>按钮。

注意

此处勾选的业务虚拟机必须是关机状态,所选虚拟机会应用同一种业务模板,即有相同的优先级。若有业务虚拟机需应用其他业务模板,可在本次业务虚拟机添加好之后再次增加即可。

 

图10 选择加入vGPU资源池的业务虚拟机

 

(6)     单击业务模板右侧的,选择业务模板类型,单击<确定>按钮。

说明

·     业务模板定义了在GPU资源紧缺时,虚拟机使用GPU资源的优先级,以及应用低优先级业务模板的所有虚拟机占用GPU资源的最高比例。具体请参见vGPU智能调度

·     所有的业务模板资源分配比例之和不能超过100%

·     系统会默认创建两个业务模板:非编业务和转码合成业务。这两个模板的资源分配比例之和为100%。所以如果需要新增业务模板,首先需要调整系统默认生成的两个模板的资源分配比例。使得所有业务模板的资源分配比例之和不超过100%

·     新增业务模板创建步骤请参见附录创建业务模板

 

图11 选择业务模板类型

 

(7)     在如9所示页面单击<完成>按钮。

图12 智能资源调度列表

 

(8)     单击左侧导航树[智能资源调度]中新增的vGPU资源池,进入资源池的虚拟机列表页面。勾选要启动的虚拟机,单击右键,在弹出的对话框中单击<启动>按钮,在确认框中单击<确定>按钮,启动虚拟机。

图13 启动新增资源池中的虚拟机

 

(9)     在虚拟机上单击右键,在弹出的对话框中单击<控制台>按钮,弹出该虚拟机的控制台窗口,等待虚拟机启动完成。

(10)     虚拟机启动之后,进入设备管理器页面,展开[显示适配器]选项,即可看到新添加的vGPU设备。该设备需要安装NVIDIA显卡驱动之后才能使用。

图14 虚拟机设备管理器

 

3. 虚拟机内安装NVIDIA显卡驱动

(1)     将从NVIDIA官网获取的驱动程序通过共享的方式上传至虚拟机。

(2)     双击安装程序,进入安装界面,根据安装向导,完成驱动程序的安装。

图15 驱动程序安装界面

 

(3)     驱动安装完成后,重启虚拟机。

注意

虚拟机安装NVIDIA显卡驱动后,VNC控制台不可用,请使用远程桌面协议连接虚拟机,例如RGSMstsc

 

(4)     使用远程桌面连接虚拟机,打开设备管理器,[显示适配器]选项已正确显示vGPU的型号NVIDIA GRID M60-2A,表示虚拟机已正确配置vGPU

图16 虚拟机内查看显卡状态

 

附录

3.1  NVIDIA vGPU介绍

NVIDIA vGPU根据目标用户工作负载的不同,分为三个系列:

·     Q系列:该类型的vGPU针对设计师和高级用户。

·     B系列:该类型的vGPU针对高级用户。

·     A系列:该类型的vGPU针对虚拟应用程序用户。

不同类型的vGPU具有固定的显存、显示器接口数和最大分辨率。

物理GPU可以切分的vGPU是有数量限制的,切分原则是:

·     按照显存进行切分,切分后每个vGPU的显存大小是固定的。

·     每一个物理GPU同时仅能按照一种显存大小的规格进行切分。

·     同一显卡上的不同物理GPU可以同时切分为不同类型的vGPU

Tesla M60为例,单块显卡集成了2个物理GPU,显存16GB(每个物理GPU的显存为8GB),支持按照显存规格为0.5GB1GB2GB4GB8GB进行vGPU切分。

Tesla M60支持的vGPU类型如下表所示:

vGPU类型

每个vGPU的显存(Mbytes

最大显示器接口数

每台显示器的最高分辨率

每个物理GPU支持的vGPU数量

每块显卡支持的vGPU数量

M60-8Q

8192

4

4096x2160

1

2

M60-4Q

4096

4

4096x2160

2

4

M60-2Q

2048

4

4096x2160

4

8

M60-1Q

1024

2

4096x2160

8

16

M60-0Q

512

2

2560x1600

16

32

M60-2B

2048

2

4096x2160

4

8

M60-1B

1024

4

2560x1600

8

16

M60-0B

512

2

2560x1600

16

32

M60-8A

8192

1

1280x1024

1

2

M60-4A

4096

1

1280x1024

2

4

M60-2A

2048

1

1280x1024

4

8

M60-1A

1024

1

1280x1024

8

16

 

注意

目前H3C UIS超融合管理平台不支持将物理GPU切分为显存为512MvGPU,例如M60-0QM60-0B

 

关于更多的适用于虚拟化的NVIDIA GPU以及其支持的vGPU的介绍,请参考NVIDIAVirtual GPU Software User Guide手册。

3.2  vGPU License介绍

NVIDIA GRID vGPU软件是一个许可产品。虚拟机启动时,需经由网络从NVIDIA vGPU License服务器获取license,激活vGPU的相应功能;虚拟机关闭时,将license返回给License服务器。

图17 NVIDIA GRID vGPU软件授权架构

 

NVIDIA Tesla GPU提供以下的NVIDIA GRID授权产品:

·     虚拟工作站(Virtual Workstation

·     虚拟PCVirtual PC

·     虚拟应用程序(Virtual Application

GRID License类型如下表所示:

GRID License类型

GRID功能

支持的vGPU类型

GRID Virtual Application

PC级应用程序

A系列vGPU

GRID Virtual PC

面向WindowsWeb浏览器和高清视频应用的业务虚拟桌面

B系列vGPU

GRID Virtual Workstation

·     针对需要访问远程专业图形应用程序的中端和高端工作站用户

·     采用GPU直通的工作站图形计算

Q系列、B系列的vGPU

 

3.3  部署NVIDIA License Server

1. 硬件配置要求

·     支持在物理机或虚拟机中安装部署NVIDIA License Server

·     建议的最低配置是CPU核数≥2,内存≥4G

·     CPU核数≥4,内存16 GB的高端配置,适合处理多达15万个许可客户端。

2. 支持的操作系统

注意

推荐使用英文操作系统;中文操作系统需要将浏览器语言首选项改为英文,具体操作步骤请参见运行环境要求

·     JREJRE1.8版本及以上,32位;应在运行License Server安装程序包之前完成JRE的安装。

·     NET Framework:使用Windows操作系统时,需要.NET Framework 4.5或更高版本。

·     Apache Tomcat7x8x版本;WindowsLicense Server安装程序包中已包含Apache Tomcat程序包;对于Linux,应在运行License Server安装程序包之前完成Tomcat的安装。

·     Web浏览器:Firefox 17版本以上、Chrome 27版本以上、IE 9以上。

3. Server的配置要求

·     有固定的IP地址。

·     至少有一个不变的以太网MAC地址,以便在注册服务器和在NVIDIA许可门户中生成许可证时用作唯一标识符。

·     日期和时间必须准确设置。

4. 网络端口设置和访问管理界面

·     网络端口设置:License Server是通过7070端口向客户端提供授权服务的,所以需要在系统的防火墙中打开TCP 7070端口

·     License Server部署完成后,访问管理界面有两种方式

¡     License Server主机上的Web浏览器中输入http://localhost:8080/licserver访问管理界面。

¡     在其他PC(与License Server网络互通)的Web浏览器中输入http://<serverip>:8080/licserver访问管理界面;其中serveripLicense Server主机的IP地址。

说明

部署NVIDIA License Server的硬件、软件配置要求等更多详细信息请参见NVIDIALicense Server User Guide手册。

 

5. License Server的安装与配置

(1)     H3C UIS超融合管理平台中,创建一个虚拟机,用于部署NVIDIA License服务器。

(2)     虚拟机安装符合要求的操作系统。

(3)     安装NVIDIA License Manager软件。详细安装步骤请参考NVIDIALicense Server User Guide手册的“Installing the NVIDIA vGPU Software License Server”章节的介绍。

说明

Installing the NVIDIA vGPU Software License Server”章节中包含WindowsLinux系统的安装准备以及安装流程。

 

(4)     License Server的配置操作请参考“Manager Licenses on the NVIDIA vGPU Software License Server”章节的介绍。

3.4  配置虚拟机License

(1)     在虚拟机操作系统内,桌面右键,弹出的对话框中选择[NVIDA控制面板]选项。

图18 桌面右键

 

(2)     NVIDIA控制面板中,选择[许可/管理许可证],输入在部署NVIDIA License Server章节中部署的License ServerIP和默认端口号7070,单击<应用>按钮,完成配置。

图19 NVIDIA控制面板

 

3.5  修改虚拟机vGPU类型

切换虚拟机的vGPU型号之前,需增加另一种类型的vGPU智能资源调度资源池。

图20 vGPU资源池列表

 

操作步骤如下:

(1)     选择顶部“虚拟机”页签,单击虚拟机列表中需要修改vGPU的虚拟机名称,进入虚拟机概要信息页面。

图21 虚拟机概要信息页面

 

(2)     关闭该虚拟机,单击<修改>按钮,弹出修改虚拟机对话框,选择[更多/GPU设备]选项,进入虚拟机GPU设备界面。

图22 虚拟机GPU设备

 

(3)     单击GPU资源池选项框的,打开选择GPU资源池对话框,选择目标GPU资源池,单击<确定>按钮。

图23 选择GPU资源池对话框

 

(4)     在如22所示的页面中单击<应用>按钮,完成操作。

3.6  创建业务模板

注意

在增加新的业务模板前,需要先修改系统默认创建的两个业务模板的分配比例。否则创建新的业务模板时会因为所有业务模板的分配比例超过100%而报错。

 

(1)     选择顶部“云业务”页签,单击左侧导航树[智能资源调度]菜单项,进入智能资源调度业务列表。

图24 智能资源调度业务列表

 

(2)     单击<业务模板>按钮,进入到业务模板列表页面。

图25 业务模板列表

 

(3)     单击<增加>按钮,弹出增加业务模板对话框。

图26 增加业务模板对话框

 

(4)     输入业务模板名称和描述(可选),选择优先级,单击<下一步>按钮。进入到业务模板资源抢占策略配置页面。相关参数请参见参数说明

图27 业务模板资源抢占策略配置

 

(5)     设置好各项参数后,单击<完成>按钮即可。相关参数解释请参见参数说明

表1 参数说明

参数

说明

优先级

当主机参与智能调度的资源紧张时,将按照业务模板优先级为虚拟机分配资源。应用相同低优先级业务模板的虚拟机,其使用的资源比例总和超过该业务模板的分配比例,系统将释放部分虚拟机已使用的资源,以保障应用高优先级业务模板的虚拟机的资源使用需求;如果不超过,则不释放。

分配比例

分配被智能调度的资源的比例,例如:集群内有10GPU参与智能调度,业务模板分配比例为20%,则对应2GPU。所有业务模板的分配比例之和不能超过100%

停止业务命令

虚拟机操作系统可执行的命令,如shutdown,用于释放虚拟机已经占有的主机上参与智能调度的资源,释放后其他虚拟机才可以使用。

命令返回结果

用于系统判断停止业务命令是否执行成功,即判断虚拟机执行停止业务命令返回结果与本参数内容是否一致。若一致,则表示停止业务命令执行成功,虚拟机会释放相关资源;若不一致,则表示停止业务命令执行失败,系统将根据停止失败处理方式查找下一个虚拟机继续执行停止业务命令或关闭当前虚拟机。

停止失败处理方式

选择停止业务失败即释放资源失败时的处理方式,包括查找下一个、关闭虚拟机。查找下一个:当停止业务命令执行失败时,系统将尝试停止其它虚拟机的业务以释放资源。关闭虚拟机电源:当停止业务命令执行失败时,系统将关闭当前虚拟机的电源以释放资源。

 

3.7  切换浏览器语言首选项

(1)     启动IE浏览器,选择[Internet选项],弹出Internet选项框。

图28 选择Internet选项

 

(2)     Internet选项框中单击<语言>按钮,弹出语言首选项对话框。

图29 Internet选项框

 

(3)     在语言首选项对话框中,单击<添加>按钮,选择[英语]选项,将英语添加到语言列表中。

图30 语言首选项对话框

 

(4)     将英语的顺序调整为第一,单击<确定>按钮,应用设置并重启浏览器生效。

图31 语言首先项对话框

 

 

联系我们 联系我们
联系我们
回到顶部 回到顶部