手册下载
vGPU与GPU配置指导
资料版本:5W120-20231209
Copyright © 2023 新华三技术有限公司 版权所有,保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
除新华三技术有限公司的商标外,本手册中出现的其它公司的商标、产品标识及商品名称,由各自权利人拥有。
本文档中的信息可能变动,恕不另行通知。
GPU(Graphics Processing Unit,图像处理单元)是广泛应用于图像输出、视频编解码加速、3D图形渲染、加速计算性负载(金融模型计算、科学研究、石油和天然气开发等领域)的一种图形硬件加速设备。
若主机具有NVIDIA GRID GPU图形设备,且该主机上的多个虚拟机有使用GPU资源的需求,则可以使用NVIDIA GRID vGPU技术,将一块物理GPU虚拟成多个vGPU,使单块物理GPU能够为多个虚拟机提供显卡能力,满足多个虚拟机用户使用复杂2D图形处理、3D图形渲染等高性能图形服务的需求。
为了满足市场需求,H3C Workspace云桌面产品集成了NVIDIA GRID vGPU技术,提供了GPU硬件虚拟化的解决方案。通过智能资源调度功能,可将vGPU资源与虚拟机进行关联。当挂载vGPU的虚拟机启动、重启时,系统会自动根据vGPU资源的空闲情况为虚拟机分配vGPU;当虚拟机关机时,分配给该虚拟机的vGPU资源将被自动释放。
vGPU特性具有以下优点:
· 资源共享:利用NVIDIA GRID vGPU技术实现GPU的一对多虚拟切分,将虚拟化后的一个vGPU分配给一个虚拟机,使得一台服务器上的物理GPU可供多个虚拟机共享使用,提高了GPU显卡的利用率。
· 最大化资源使用率:结合智能资源调度功能,实现了虚拟机随用随取vGPU资源,最大化vGPU的使用率。
2023年7月31日,旧版的NVIDIA vGPU License服务器将停止使用。届时,用户可使用新的NLS(NVIDIA License System,NVIDIA许可系统),为NVIDIA vGPU软件提供License。更多关于NLS的信息及常见问题可参见:https://docs.nvidia.com/license-system/latest/index.html。
早于13.0的NVIDIA vGPU软件版本不支持NLS。有关支持NLS的详细信息,请参见https://docs.nvidia.com/license-system/latest/nvidia-license-system-release-notes/index.html。
若用户暂时不能切换至新的NLS,建议进行以下操作:
· 下载旧版License Server软件备用。
· 将现有旧版License Server创建快照或者克隆一个新的虚拟机备用,并记下License Server的MAC地址。
· 目前至2023年7月31日下载的License bin文件均无“下载后24小时可用”这个限制,用户需提前下载之后需要用到的License bin文件,且需按照下载时间先后顺序使用。
· 尽快切换至新的NLS。
GPU虚拟化技术采用图形命令重定向架构。在虚拟机的虚拟GPU驱动中截获图形命令,并转发到主机端,在主机端的物理GPU上处理图形命令,主机对多个虚拟机的图形命令管理及渲染处理,最后把渲染好的图像传回给虚拟机,达到一个GPU供多个虚拟机使用的目的,实现资源共享。
vGPU的智能资源调度是将主机上的vGPU资源添加到一个资源池中,并将资源池与该主机上的虚拟机或桌面池关联。关联的虚拟机或桌面池中的虚拟机都可以使用该资源池的vGPU。当关联虚拟机组中的虚拟机启动或重启时,管理平台会根据资源池中资源的空闲情况来动态分配资源。先启动的虚拟机优先获取vGPU资源。当资源都被其它虚拟机占用,即使关联了vGPU资源池也无法使用vGPU。
· 32位操作系统的虚拟机不支持使用vGPU。
· E1012及以后版本中,Windows7操作系统的虚拟机不支持使用vGPU。
· 每个虚拟机只能绑定一个vGPU。
· 在每个物理GPU上只能使用同一种切分类型,但在一块显卡中的多个物理GPU上可以分别使用不同切分类型。例如Tesla M60显卡上有两个GPU,可以在第一个GPU上使用M60-2Q的切分方式,在第二个GPU上使用M60-4Q的切分方式。关于切分的详细说明请参见回收vGPU。
· 已经创建vGPU的物理GPU不能再用于直通,正在以直通方式使用的物理GPU不能再用来创建vGPU。
· 若需配置vGPU双屏,则需要终端连接两个显示屏,且虚拟机配置两个Qxl显卡。
· 显卡温度超过显卡对应上限可能会导致降频而影响性能,需要保证显卡温度正常。
· 在使用vGPU云桌面时,播放视频使用软解会占用CPU资源,建议使用vGPU 时,尽量使用支持硬件解码的软件播放播放,否则并发路数会受限制,例如完美解码(PureCodec)、PotPlayer等。
· vGPU对视频硬件解码的并发数有上限要求,超过限制可能会出现卡顿,如60fps的4K视频在rtx 6000显卡上大概能支持3路并发。
· vGPU云桌面在客户端启用硬件解码的情况下可能会出现轻微颜色饱和度下降、轻微模糊现象。
· vGPU云桌面在客户端开启软件解码的情况下会增加终端CPU的占用。
· 批量部署云桌面后,第一次连接后可能出现分辨率异常,规避措施,断开重连。
· 单屏转双屏的时候,需要增加Qxl显卡驱动,再启动云桌面时候,英伟达显卡需要加载英伟达显卡驱动程序,有可能会出现英伟达显卡驱动加载失败的问题,此时建议重新安装英伟达显卡驱动。
· Windows7 64位云桌面安装Nvidia驱动时,可能会弹红框。处理办法:先打补丁(KB3033929补丁,下载网址https://www.microsoft.com/en-us/download/details.aspx?id=46148)。
· 新部署的云桌面需与桌面镜像使用的显卡与显卡切分类型一致,因此各业务主机上的GPU显卡型号和切分类型应保持一致。如果不一致,在批量部署云桌面后,操作系统在第一次启动加载英伟达显卡驱动时,英伟达显卡驱动有可能加载失败,进而出现分辨率不正确、鼠标漂移、黑屏等异常现象。恢复办法:通过RDP连接云桌面,重装云桌面的英伟达驱动程序可解决。驱动程序可通过载agenttools.iso光驱里nvidia驱动获取。
GPU硬件虚拟化解决方案要求服务器型号及GPU显卡型号如下表所示。
表5-1 服务器配置要求
服务器型号 |
GPU显卡型号 |
· H3C UIS-Cell 3000 G3系列超融合一体机 · H3C UniServer R4900 G3服务器 |
· A10 · A100 80GB · A2 · A30 · A40 · A800 80GB · RTX 6000 Passive · T4 · V100 32GB · V100S |
H3C UniServer R4900 G5服务器 |
· A10 · A100 40GB · A100 80GB · A16 · A2 · A30 · A40 · A800 80GB · RTX A6000 · T4 |
根据使用的不同软件,分为重载、中载和轻载三种场景,各场景下推荐主频及显卡等如下表。各型号显卡具体支持的vGPU情况,请参见NVIDIA vGPU介绍。
表5-2 场景分类及显卡推荐
使用场景 |
软件 |
推荐主频(GHz) |
推荐GPU显卡型号 |
总显存大小 |
推荐切分方式 |
重载场景 |
SolidWorks、CREO、Maltab、CATIA、Arcgis、3ds MAX、ENVI、Inventor、Abaqus、Altium Designer |
≥3.3 |
NVIDIA Tesla V100 |
32GB |
4Q/6Q/8Q/12Q/16Q |
NVIDIA Quadro RTX8000 |
48GB |
4Q/6Q/8Q/12Q/16Q/24Q/48Q |
|||
NVIDIA Ampere A40 |
48G |
4Q/6Q/8Q/12Q/16Q/24Q/48Q |
|||
中载场景 |
AutoCAD及其它同类型CAD软件、平面设计软件 |
≥3.0 |
NVIDIA Quadro RTX6000 |
24GB |
2B/1Q/2Q/4Q |
NVIDIA Tesla T4 |
16GB |
2B/1Q/2Q/4Q |
|||
NVIDIA Ampere A10 |
24GB |
2B/2Q/3Q/4Q/6Q/8Q/12Q/24Q |
|||
轻载场景 |
普通办公软件(例如office等)、普通视频播放软件 |
≥2.4 |
NVIDIA Ampere A16 |
4*16GB |
1B/2B/1Q/2Q/4Q |
推荐终端及说明如下:
表5-3 推荐终端
终端型号 |
说明 |
C100L-2C |
单屏/1080P/60fps或双屏/1080P/30fps |
C100L-4C Pro |
双屏/2k/30fps或单屏/2k/60fps |
C3300/ C107V系列 |
双屏/2k/30fps或单屏/4k/30fps |
本文以E1015P02版本为例,介绍vGPU的配置方法,其他版本操作请以实际情况为准。
(1) 安装和配置DLS虚拟机
(2) 在DLS虚拟机上注册账户
(3) 配置DLS HA集群
(4) 下载DLS服务实例令牌
(5) 创建License Server
(7) 下载客户端配置令牌
(1) 创建CLS服务实例
(2) 创建License Server
(5) 下载客户端配置令牌
(1) 为服务器安装NVIDIA GPU显卡:安装后可通过Workspace云桌面管理平台查看到主机的GPU,并进行后续GPU虚拟化操作。
(2) 增加vGPU:将GPU虚拟化成多个vGPU,并配置智能资源调度,即将vGPU配置为vGPU资源池。
(3) 制作桌面镜像:
a. 新建镜像虚拟机:该镜像虚拟机用于克隆或转换为桌面镜像。
b. 挂载vGPU:通过修改虚拟机的方法为镜像虚拟机挂载vGPU设备。
c. 安装agent_tools:agent_tools安装包已集成CAStools和VdiAgent。CAStools和VdiAgent用于监控虚拟机状态以及与管理平台通信等。对于Windows10操作系统虚拟机,此时也将自动安装英伟达显卡驱动。
d. 优化镜像虚拟机:镜像虚拟机操作系统优化以及License Server的关联配置。
e. 安装显卡驱动:对于Windows10操作系统镜像虚拟机,若需重新安装显卡驱动,需在优化完成后手动安装显卡驱动。E1012之前版本中的Windows7操作系统镜像虚拟机,需要手动安装显卡驱动。
f. 发布前检查:检查镜像虚拟机的Qxl显卡、License等。
g. 完成桌面镜像制作:将镜像虚拟机克隆或转换为桌面镜像,即完成桌面镜像的制作。
(4) 新建与部署桌面池:通过桌面镜像新建桌面池,并对桌面池进行批量部署以生成虚拟桌面。
NLS主要分为离线认证和在线认证两种方式,需分别配置DLS服务实例和CLS服务实例。其中,DLS服务实例适用于无网络连接、专有网络或网络环境较复杂等环境,CLS服务实例适用于有网络连接等环境。
· 使用CLS服务实例可能会出现云桌面获取不到License的情况,因此推荐使用DLS服务实例。
· 本文中NVIDIA官网上的相关操作截图仅作为示例,请以NVIDIA官网实际页面为准。
本章将分别介绍配置DLS服务实例和CLS服务实例的步骤,用户根据具体情况选择配置方式,然后再进行安装与配置vGPU的步骤。
· DLS虚拟机建议最低配置为CPU核数≥4,内存大小≥8GB,磁盘大小≥10GB,其中磁盘主要用于保留诊断日志文件。
· 为保证DLS虚拟机与vGPU桌面正常通信,必须在防火墙或代理服务器中打开80和443端口。
(1) 登录NVIDIA许可门户(https://ui.licensing.nvidia.com/login),单击左侧导航栏[SOFTWARE DOWNLOADS]菜单项,单击“Non-Driver downloads”页签,进入软件列表页面。
(2) 单击Linux KVM后的<Download>按钮。推荐使用3.1版本,本文以此版本为例。
图7-1 下载镜像
(3) 在弹出的对话框中单击<AGREE AND DOWNLOAD>按钮,将镜像下载到本地并解压以获取安装DLS虚拟机的qcow2格式文件。
图7-2 下载确认
(4) 登录Workspace管理平台,单击左侧导航栏[数据中心/虚拟化/<集群名称>/<主机名称>]菜单项,进入指定主机概要信息页面。
(5) 单击“存储”页签,进入主机存储页面。
(6) 在存储池列表中选择存储池,存储卷列表中将显示对应存储池下的存储卷。
图7-3 存储页面
(7) 单击<上传文件>按钮,弹出上传文件对话框。
(8) 将下载的镜像文件拖拽到虚线框中,或单击<点击上传>,在弹出的对话框中选择已获取的Qcow2文件,单击<打开>按钮开始上传。
图7-4 上传镜像文件
(9) 上传完成后,单击<确定>按钮完成操作,可在存储卷中查看到所上传的文件。
图7-5 上传完成
(10) 单击左侧导航栏[数据中心/虚拟化/<集群名称>/<主机名称>]菜单项,进入指定主机的概要信息页面。
(11) 单击“虚拟机”页签,进入虚拟机列表页面。
(12) 单击<增加虚拟机>按钮,进入增加虚拟机页面
图7-6 增加虚拟机
(13) 配置虚拟机基本信息和硬件信息。其中,操作系统及版本选择“Linux”和“Ubuntu Linux(64位)”,CPU核数≥4,内存大小≥8GB,磁盘大小≥10GB,配置网络参数,在磁盘参数中,类型选择已有文件,文件路径选择上一步上传的镜像文件。
图7-7 配置虚拟机-1
图7-8 配置虚拟机-2
图7-9 配置虚拟机-3
(14) 单击<确定>按钮完成操作,可在虚拟机列表中查看到所增加的虚拟机。
(15) 单击虚拟机对应操作列的<控制台>按钮,弹出虚拟机控制台,并启动虚拟机。
图7-10 虚拟机列表
(16) 根据系统提示,输入默认用户名和密码即可登录,其中用户名和密码默认为“dls_admin”和“welcome”。
图7-11 用户登录
(17) 执行/etc/adminscripts/set-static-ip-cli.sh脚本。
(18) 根据所需配置的IP类型及提示,输入4或6,本文以IPv4为例。
(19) 配置IP地址、网关、主DNS、备用DNS和子网掩码,且DNS参数建议输入IP地址,若直接按<Enter>键可选择设置为系统所提示的默认参数。
(20) 完成DLS虚拟机配置。
图7-12 配置网络
每个DLS虚拟机都配置有一个专门用于管理的帐户。此帐户具有通过Web界面访问NVIDIA许可应用程序的权限。在管理DLS虚拟机之前,您必须注册此账户才能访问管理界面。若需部署DLS HA集群,只需在主节点上进行注册账户,配置HA集群后,此账户自动同步至备节点。
(1) 在浏览器地址栏中输入“https://<DLS虚拟机IP地址>”进入该DLS虚拟机的NVIDIA许可应用程序管理页面。
图7-13 管理页面
(2) 单击页面上的<New Installation>按钮,进入用户注册页面。DLS管理员用户名默认为dls_admin,设置密码并确认密码后,单击<REGISTER>按钮。
图7-14 用户注册
· 仅首次打开此页面需注册账户,注册账户后将直接进入登录页面。
· 密码必须至少包含八个字符,并且区分大小写。
(3) 用户注册完成后,单击页面上的<CONTINUE TO LOGIN>按钮,进入登录页面。
图7-15 用户注册完成
(4) 输入DLS管理员密码后,单击<LOG IN>按钮后登录成功。
图7-16 登录页面
图7-17 登录成功
若需在DLS服务实例出现故障时继续为获得License的vGPU桌面提供权限,可以配置DLS服务实例的HA集群。HA集群由主节点和备节点组成。正常工作时,主节点将不断与备节点同步License信息。当主节点出现故障时,备件点充当主节点的作用,继续提供License。
· 参照7.1.1 安装和配置DLS虚拟机中的步骤安装和配置DLS虚拟机作为备节点,且备节点虚拟机与主节点虚拟机的系统及版本需相同。
· 为保证主节点和备节点正常通信,必须在防火墙或代理服务器中打开以下端口:443、4369、5671、8080、8081、8082、8083、8084和8085。
· 为确保License在主DLS服务实例发生故障后仍正常使用,请尽快恢复发生故障的DLS服务实例。
· 若HA集群中的两个DLS虚拟机同时关闭,请先重新启动一台虚拟机并等到该虚拟机启动完成后,再启动第二台虚拟机。
(1) 使用管理员用户登录NVIDIA许可应用程序,单击左侧导航栏[SERVICE INSTANCE]菜单项,进入服务实例详情页。
(2) 单击页面上的<CONFIGURE HIGH AVAILABILITY>按钮,弹出“Configure High Availability”对话框。
图7-18 服务实例详情页
(3) 输入备节点的IP地址后单击<PING>按钮进行连通性测试并获取节点信息。
图7-19 HA配置
(4) 备节点信息获取成功之后,单击<CREATE CLUSTER>按钮,配置HA集群。
图7-20 信息获取成功
图7-21 配置HA集群
(5) HA集群配置完成后,可在服务实例详情页面查看到集群各节点的健康状况。
图7-22 HA集群配置完成
DLS服务实例令牌由DLS服务实例创建。通过将令牌上传至NVIDIA授权门户,可将DLS服务实例标识到NVIDIA授权门户,并使其能够定位NVIDIA许可门户。
(1) 用管理员用户登录NVIDIA许可应用程序后,单击页面的<Download DLS Instance Token>按钮,将名为dls_instance_token_mm-dd-yyyy-hh-mm-ss.tok的DLS服务实例令牌文件保存在本地。
图7-23 下载DLS实例令牌
为了向DLS服务实例分配License,需要NVIDIA许可门户上创建License Server,并配置需要分配的License。
(1) 登录NVIDIA许可门户,单击左侧导航栏[LICENSE SERVERS/CREATE SERVER]菜单项,进入Create License Server向导页面,一共包含四步。
(2) 在步骤一中,配置License Server基础信息,包括名称和描述,单击<NEXT STEP>按钮。
图7-24 步骤一
(3) 在步骤二中,选择所需的License,并根据实际情况在ADDED列配置想要授权的资源数量后,单击<NEXT STEP>按钮。
图7-25 步骤二
授权的资源数量配置完成后,若后续需修改,只支持增加资源数量,不支持减少。请谨慎配置该参数。
(4) 在步骤三中,单击“On-Premises(DLS)”页签,单击<SELECT INSTANCE TOKEN>按钮,上传7.1.4 下载DLS服务实例令牌中下载的DLS实例令牌文件。
图7-26 步骤三-选择 DLS实例令牌文件
(5) 单击<UPLOAD TOKEN>按钮,完成上传,单击<NEXT STEP>按钮。
图7-27 步骤三-上传文件
图7-28 步骤三-上传完成
(6) 在步骤四中,检查配置项,单击<CREATE SERVER >按钮后,完成创建License Server。
图7-29 License Server详情页面
(7) 创建完成后,页面自动跳转至License Server详情页面。
(8) 单击<Actions>按钮,选择[Download]菜单项,在弹出的对话框中单击<DOWNLOAD>按钮,将名为license_mm-dd-yyyy-hh-mm-ss.bin的License Server文件保存在本地。
图7-30 License Server详情页面
图7-31 下载License Server文件
将License Server绑定到DLS服务实例后,需要在DLS服务实例上安装License Server,License Server上的License才可供相应vGPU桌面使用。如果更改绑定到DLS服务实例的License Server上的License,则必须使用更改后的License Server更新该服务实例。
(1) 使用管理员用户登录NVIDIA许可应用程序,在Dashboard页面单击<SELETE LICENSE SERVER FILE>按钮,上传上一步下载的License Server文件。
图7-32 上传License Server文件
(2) 上传完成后,单击页面<Install server>按钮,完成License Server的安装。
图7-33 安装License Server
(3) 安装完成后,页面自动跳转至License Server详情页面。
图7-34 License Server详情页面
(4) 单击左侧导航栏[SETTINGS]菜单项,进入Service Instance Settings页面。在NTP Server Configuration中配置NTP服务器IP地址,且建议使用与Workspace管理节点相同的NTP服务器,保证Workspace管理节点、虚拟机、DLS服务实例三者的NTP服务器一致。
图7-35 配置NTP服务器
在DLS服务实例配置完成之后,建议对DLS虚拟机创建快照。
客户端配置令牌用于标识DLS服务实例、License Server等,以及响应vGPU桌面的请求以提供License。生成客户端配置令牌后,需要将其复制到每个vGPU桌面。当vGPU桌面请求License时,会将令牌的数据提供给相应License Server。
(1) 使用管理员用户登录NVIDIA许可应用程序,在License Server详情页面,单击页面右上角<ACTIONS>按钮,选择[Generate client config token]菜单项,弹出“Generate Client Configuration Token”对话框。
图7-36 License Server详情页面
(2) 勾选相应的License Server后,单击<DOWNLOAD CLIENT CONFIGURATION TOKEN>按钮,将名称为“client_configuration_token_mm-dd-yyyy-hh-mm-ss.tok”的客户端配置令牌文件保存在本地。
图7-37 下载令牌文件
为保证CLS服务实例与vGPU桌面正常通信,必须在防火墙或代理服务器中打开80和443端口。
必须创建一个CLS服务实例以在NVIDIA许可门户上进行托管。当创建CLS服务实例时,该服务实例会自动注册到NVIDIA许可门户。若使用默认CLS服务实例,则无需完成此步骤。
(1) 登录NVIDIA许可门户,单击左侧导航树[SERVICE INSTANCES]菜单项,进入服务实例页面。
(2) 单击页面右上角<ACTIONS>按钮,选择[Create CLS instance]菜单项,弹出“Create CLS Service Instance”对话框。
图7-38 服务实例页面
(3) 在对话框中配置CLS服务实例的名称及描述信息,单击<CREATE SERVIE INSTANCE>按钮,完成CLS服务实例创建。
图7-39 创建CLS服务实例
(4) 在服务实例列表中可查看刚创建的CLS服务实例。
图7-40 创建完成
为了向CLS服务实例分配License,需要NVIDIA许可门户上创建License Server,并配置需要分配的License。
(1) 登录NVIDIA许可门户,单击左侧导航栏[LICENSE SERVERS/CREATE SERVER]菜单项,进入创建License Server页面。
(2) 配置License Server基础信息,包括名称和描述,单击<Next:Select features>按钮。
图7-41 Basic details页面
可根据实际情况选择打开“Express CLS Installation”开关,打开后系统自动将此License Server绑定到默认CLS服务实例并将其安装在默认CLS服务实例上。
(3) 选择所需的License,并根据实际情况在ADDED列配置想要授权的资源数量后,单击<Next: Preview server creation>按钮。
图7-42 Select features页面
授权的资源数量配置完成后,若后续需修改,只支持增加资源数量,不支持减少。请谨慎配置该参数。
(4) 确认License Server相关配置信息后,单击<CREATE SERVER>按钮后,完成创建License Server。
图7-43 Preview server creation页面
(5) 创建完成后,页面自动跳转至License Server详情页面。
图7-44 License Server详情页面
将License Server绑定到CLS服务实例后,License Server上的License只能从该CLS服务实例获得,并且可以将多个License Server绑定到同一个CLS服务实例。若使用默认CLS服务实例,则无需完成此步骤。
(1) 登录NVIDIA许可门户,单击左侧导航栏[LICENSE SERVERS/LIST SERVERS]菜单项,进入License Server页面。
(2) 单击上一步创建的License Server后的<Actions>按钮,选择[Bind]菜单项,弹出“Bind Service Instance”对话框。
图7-45 License Server页面
(3) 选择所创建的CLS服务实例,单击<BIND>按钮,将License Server绑定到服务实例。
图7-46 绑定服务实例
(4) 完成绑定后,可在License Server列表中查看已绑定的服务实例。
图7-47 绑定完成
将License Server绑定到CLS服务实例后,需要在CLS服务实例上安装License Server,License Server上的License才可供相应vGPU桌面使用。如果更改绑定到CLS服务实例的License Server上的License,则必须使用更改后的License Server更新该服务实例。若使用默认CLS服务实例,则无需完成此步骤。
(1) 登录NVIDIA许可门户,单击左侧导航栏[LICENSE SERVERS/LIST SERVERS]菜单项,进入License Server页面。
(2) 单击License Server后的<Actions>按钮,选择[Install]菜单项,弹出“Install License Server”对话框。
图7-48 安装License Server
(3) 单击对话框中的<INSTALL AERVER>按钮,开始安装License Server。
图7-49 Install License Server对话框
(4) 安装完成后,在License Server列表中将显示“Installed”标签。
图7-50 安装完成
客户端配置令牌用于标识CLS服务实例、License Server等,以及响应vGPU桌面的请求以提供License。生成客户端配置令牌后,需要将其复制到每个vGPU桌面。当vGPU桌面请求License时,会将令牌的数据提供给相应License Server。
(1) 登录NVIDIA许可门户,单击左侧导航树[SERVICE INSTANCES]菜单项,进入服务实例页面。
(2) 单击CLS服务实例后的<Actions>按钮,选择[Generate client config token]菜单项,弹出“Generate Client Configuration Token”对话框。
图7-51 服务实例页面
(3) 勾选相应的License Server后,单击<DOWNLOAD CLIENT CONFIGURATION TOKEN>按钮,将名称为“client_configuration_token_mm-dd-yyyy-hh-mm-ss.tok”的客户端配置令牌文件保存在本地。
图7-52 “Generate Client Configuration Token”对话框
在服务器上安装NVIDIA GPU显卡,具体操作请参考服务器的相关手册。
· 对于云下环境:GPU显卡安装完成后,可在H3C Workspace云桌面管理平台,主机下的“GPU设备”页签进行确认。如下图所示,即表示服务器已成功安装NVIDIA GPU显卡。
图7-53 GPU设备(云下环境)
· 对于云上环境:GPU安装完成后,可在H3C云操作系统的虚拟化页面,选择对应主机的“GPU设备”页签进行确认。如下图所示,即表示服务器已成功安装NVIDIA GPU显卡。
图7-54 GPU设备(云上环境)
请进入服务器BIOS界面开启SR-IOV功能,以便分配虚拟化IO资源,具体操作请根据服务器实际情况为准。
切分GPU设备前,请先启用主机IOMMU。IOMMU(Input/Output Memory Management Unit,内存输入/输出管理单元)允许系统设备在虚拟内存中进行寻址,也就是将虚拟内存地址映射为物理内存地址,让实体设备可以在虚拟的内存环境中工作,这样可以帮助虚拟机提升内存访问的性能。
(1) 单击左侧导航栏[数据中心/虚拟化/主机池/集群/<主机>]菜单项,进入已安装GPU的主机概要页面。
(2) 单击“高级设置”页签,在页面中启用IOMMU配置,并重启主机使配置生效。
图7-55 启用IOMMU配置
用于将指定主机以及同集群下的其他主机上的GPU设备虚拟成相同类型的vGPU,供虚拟机使用。
若需使用GPU直通功能,即一个云桌面绑定一个物理GPU,则无需执行此操作。
(1) 在主机的GPU设备页签中,单击待虚拟化的GPU对应操作列的<增加vGPU>按钮,弹出增加GPU对话框。
(2) 选择对应的vGPU类型后,单击<确定>按钮。
图7-56 增加vGPU
· 选择vGPU名称后,vGPU类型、显示器接口数、缓存、分辨率和vGPU数量均为默认值,且不可修改。
· vGPU回收方法请参见回收vGPU。
智能资源调度用于将切分后的vGPU配置为vGPU资源池。
(1) 进入智能资源调度页面:
¡ 云下环境:在H3C Space Console管理平台,单击[数据中心/虚拟化/主机池/智能资源调度]菜单项,进入智能资源调度页面。
¡ 云上环境:在H3C云操作系统,单击[资源/虚拟化/<云下资源对应主机池名称>/<集群名称>]菜单项,并选择“智能资源调度”页签,进入智能资源调度页面。
图7-57 环境智能资源调度页面(云下)
图7-58 智能资源调度页面(云上)
(2) 单击<增加智能资源调度>按钮,弹出增加智能资源调度对话框。
图7-59 增加智能资源调度
若需使用GPU直通功能,则上图中资源类型请选择“GPU”。
(3) 配置基本信息,单击<下一步>按钮。选择加入vGPU资源池的vGPU,单击<下一步>按钮。
图7-60 选择vGPU
(4) 连续单击<下一步>按钮,直至完成。
默认情况下,新建的镜像虚拟机只有一个显卡。若需vGPU双屏环境,则需为镜像虚拟机配置两个显卡。
云上环境与云下环境制作桌面镜像的方法类似,本文档以云下环境为例。
(1) 单击管理平台左侧导航树[镜像]菜单项,并选择“镜像虚拟机”页签,进入镜像虚拟机列表页面。
图7-61 镜像虚拟机列表
(2) 单击<新建>按钮,弹出新建镜像虚拟机页面。
(3) 在弹出的对话框中,选择新建类型,此处以“新建镜像虚拟机”为例,然后单击<下一步>按钮,进入基本信息的配置。
图7-62 新建镜像虚拟机-选择新建类型
(4) 在配置基本信息中,填写镜像名称,选择镜像类型VDI、主机和刚上传的系统镜像,本文以Windows10为例,E1012及以后版本仅支持Windows10 64bit。然后单击<下一步>按钮,进入虚拟机的配置。
图7-63 新建镜像虚拟机-基本信息配置
(5) 进入虚拟机配置,在“基础配置”页签下选择存储路径、规格配置和网络,在“高级配置”页签下还可以配置CPU工作模式、文件名等,然后单击<下一步>按钮。
图7-64 新建镜像虚拟机-虚拟机配置
(6) 最后确认配置信息,然后单击<完成>按钮。
图7-65 新建镜像虚拟机-确认信息
(7) 完成后进入镜像虚拟机控制台,启动桌面镜像,按照安装向导完成操作系统的安装。
图7-66 打开镜像虚拟机控制台
(1) 请参见新建镜像虚拟机(单屏)的方法,新建镜像虚拟机。
(2) 单击[数据中心/虚拟化/集群/<主机>/<虚拟机>]菜单项,找到上一步创建的虚拟机,单击<编辑>按钮,弹出修改虚拟机对话框。单击右上角<增加硬件>按钮,弹出增加硬件对话框。
图7-67 修改镜像虚拟机
(3) 选择硬件类型为“显卡”,显存保持默认即可,单击<确定>按钮。在返回的修改虚拟机页面,单击<应用>按钮成功为虚拟机添加显卡设备。
图7-68 增加Qxl显卡
(4) 进入镜像虚拟机控制台,重启镜像虚拟机,按照安装向导完成操作系统的安装。
(1) 操作系统安装完成后,启用Administrator用户并设置其密码。
图7-69 启用Administrator用户
图7-70 设置Administrator密码
镜像虚拟机发布前,若需使用Adminsitrator账户通过远程桌面连接镜像虚拟机以进行相关操作,此处请务必设置Administrator的密码。
(2) 切换到Administrator用户登录后,在单击[控制面板/用户账户/删除用户账户],进入管理账户页面,选择安装操作系统时创建的本地账户,进入下图所示更改账户页面,删除账户。
图7-71 删除账户
(3) 关闭镜像虚拟机。
(4) 单击镜像虚拟机对应操作列的<更多>按钮,选择[编辑]菜单项,进入修改虚拟机页面。
图7-72 修改镜像虚拟机
(5) 单击页面右上角<增加硬件>按钮,为虚拟机增加vGPU设备,即挂载vGPU。挂载完成后,可在“更多”页签看到对应的vGPU信息。
图7-73 挂载vGPU
· 硬件类型:选择“GPU设备”。
· GPU资源池:选择智能资源调度中的vGPU资源池,此处以vgpu为例。
· 业务模板:选择“非编业务”。若vGPU资源池中vGPU数量不够,可进入虚拟化页面的“智能资源调度”页签下,单击<业务模板>按钮修改非编业务模板的资源紧张启动模式为“不带资源启动”,即虚拟机不带vGPU资源也可启动,具体设置如图7-74所示。
图7-75 vGPU已挂载成功
agent_tools工具已集成CAStools和VdiAgent。安装过程中,将首先安装CAStools,再安装VdiAgent。
· 对于Windows10操作系统镜像虚拟机,从E1007版本开始,无需手动安装显卡驱动。agent_tools安装过程中,将自动安装对应版本的显卡驱动。
· E1012及以后版本中,Windows7操作系统的虚拟机不支持使用vGPU。E1012之前版本中的Windows7操作系统镜像虚拟机,其显卡驱动需在优化完成之后手动安装,具体操作请参见安装显卡驱动。
(1) 在镜像虚拟机控制台中,启动镜像虚拟机,并单击右上角[安装模板工具/挂载驱动光驱]菜单项,并在弹出的对话框中单击<打开文件以查看文件>。
图7-76 挂载驱动光驱
(2) 进入如下图所示目录,右键单击agent_tools_setup.exe,选择[以管理员身份运行]菜单项,开始解压安装包。
图7-77 安装CAStools
(3) 解压完成后,在弹出的对话框中,单击<下一步>按钮,进入通信环境配置对话框。
图7-78 安装VdiAgent
(4) 配置管理平台IP地址或域名,端口号保持默认即可,单击<下一步>按钮,进入选择目标文件夹对话框。
图7-79 配置通信环境
(5) 选择目标文件夹即安装路径,单击<安装>按钮,开始安装。
图7-80 设置目标文件夹
安装CAStools过程中,将提示重启系统,此时单击<确定>按钮,继续完成CAStools安装。
(6) CAStools安装完成,单击<关闭>按钮,继续安装VdiAgent。
图7-81 CAStools安装完成
(7) VdiAgent安装完成后,单击<完成>按钮。
图7-82 VdiAgent安装完成
挂载优化工具,并对镜像虚拟机进行优化。
· 对于E1009及以上版本,挂载优化工具前需先获取与管理平台版本匹配的优化工具压缩包H3C_Workspace-version-OptTools.zip,并将其上传到镜像工具页面才能在优化镜像虚拟机时挂载优化工具。上传后将自动解析出VDIOptTools.iso、VOIOptTools.iso、IDVOptTools.iso,只需使用VDIOptTools.iso。
· 对于E1009之前版本,无需上传优化工具压缩包,可直接在镜像虚拟机中挂载。
(1) 在镜像虚拟机控制台,单击右上角[安装模板工具/挂载优化工具]菜单项。
图7-83 挂载优化工具
(2) 进入光驱(CD驱动器)并运行H3COptTools应用程序。
图7-84 运行优化工具
(3) 根据实际情况选择语言环境后进入系统优化界面。
图7-85 选择语言环境
(4) 根据需求选择优化模板,默认为标准场景,单击<开始扫描>按钮,进行优化项扫描。
图7-86 选择优化模板
(5) 扫描结束后,在弹出的对话框中单击<确定>按钮,选择待优化项或勾选“专家模式”后,单击<一键优化>按钮,开始优化。
图7-87 检查结果
图7-88 定制用户profile磁盘
若需在后续业务中使用桌面系统盘重建功能,请务必将用户profile的磁盘定制为系统盘以外的数据盘,如E盘。
图7-89 安装云盘
(6) 优化完成后,单击<确定>按钮,对虚拟机进行重启。若有以下情况,则此处单击<取消>按钮,手动安装显卡驱动后,再手动重启桌面。
¡ 对于Windows10操作系统镜像虚拟机,从E1007版本开始agent_tools安装过程中,将自动安装对应版本的显卡驱动。若出现显卡驱动安装失败、GPU切分异常和更换显卡等情况,需重新手动安装显卡驱动。
¡ E1012之前版本中的Windows7操作系统镜像虚拟机,其显卡驱动需在优化完成之后手动安装。
图7-90 重启虚拟机
· 对于Windows10操作系统镜像虚拟机,若出现显卡驱动安装失败、GPU切分异常和更换显卡等情况,需在优化完成之后手动安装显卡驱动。
· E1012及以后版本中,Windows7操作系统的虚拟机不支持使用vGPU。E1012之前版本中的Windows7操作系统镜像虚拟机,其显卡驱动需在优化完成之后手动安装。
本文以手动安装Windows10显卡驱动为例,Window7显卡驱动手动安装方法相同,具体操作如下:
(1) 在镜像虚拟机控制台中,启动镜像虚拟机,并单击右上角[安装模板工具/挂载驱动光驱]菜单项,并在弹出的对话框中单击<打开文件以查看文件>。
图7-91 挂载驱动光驱
(2) 进入如下图所示目录,右键单击nvidiaDriverWIN10,选择[以管理员身份运行]菜单项,开始安装显卡驱动。
图7-92 进入nvidia驱动目录
(3) 根据安装向导,进入NVIDIA安装程序对话框。
图7-93 NVIDIA安装程序对话框
(4) 单击<同意并继续>按钮,进入安装选项界面,选择“精简”,单击<下一步>按钮,进行显卡驱动的安装,直至安装完成。
图7-94 安装选项对话框
(5) NVIDIA驱动安装完成之后,单击<关闭>按钮。
图7-95 NVIDIA安装程序已完成对话框
(1) 在“日期与时间”中,将时间服务器设置为7.1.6 (4)中所配置的服务器IP地址,保证Workspace管理节点、虚拟机、DLS服务实例三者的NTP服务器一致。
图7-96 时间服务器配置
(2) 打开注册表,在[HKEY_LOCAL_MACHINE\SOFTWARE\NVIDIA Corporation\Global\GridLicensing]路径下添加“REG_DWORD”的注册表项,并命名为“FeatureType”。
图7-97 添加注册项
GPU直通及裸金属部署场景需将FeatureType的值手动设置为2,其他vGPU场景不需要手动设置,系统将根据vGPU的类型自动设置。
(3) 将7.1.7 下载客户端配置令牌或7.2.6 下载客户端配置令牌中所下载的客户端配置令牌拷贝到C:\Program Files\NVIDIA Corporation\vGPU Licensing\ClientConfigToken文件夹中。
图7-98 客户端配置令牌
(4) 配置完成后,重启虚拟机。
用户可通过控制台连接镜像虚拟机,进行发布前检查,检查内容包括虚拟机是否已禁用Qxl显卡、是否已获取License、是否启用NvFBC功能等。
(1) 通过控制台连接镜像虚拟机:在镜像虚拟机列表页面,单击vGPU镜像虚拟机操作列的<控制台>按钮,进入虚拟机控制台。
图7-99 镜像虚拟机控制台
(2) 确认已获取License。
a. 打开C:\用户\公用\公用文档\NvidiaLogging路径下的Log.NVDisplay.Container.exe,查看Lincense获取情况。
图7-100 打开Log.NVDisplay.Container.exe
图7-101 查看Lincense获取情况
b. 若未获取License,请在任务管理器的“服务”页签下,重启NVDisplay.ContainerLocalSystem服务。
图7-102 NVDisplay.ContainerLocalSystem
(3) 检查并启用NvFBC功能。
a. 打开CMD命令行窗口,进入C:\Program Files (x86)\H3C\VdiAgent\Vgpu目录,执行NvFBCEnable.exe –checkstatus命令,检查NvFBC状态。
b. 若打印信息显示“NvFBC is disabled”,请执行NvFBCEnable.exe –dynamic命令启用NvFBC。
c. 再次检查NvFBC,确保打印信息显示“NvFBC is enabled”。
(4) 启用桌面组合(适用于Window7):该步骤仅支持通过镜像虚拟机列表中的<控制台>按钮连接对应镜像虚拟机后执行。
a. 单击操作系统开始菜单,选择[计算机/计算机管理/服务和应用程序/服务]菜单项,找到“Desktop Windows Manager Session Manager”服务。
b. 右键单击服务,选择[属性]菜单项,在弹出的对话框中将启动类型改为“自动”。
图7-103 Desktop Windows Manager Session Manager服务
图7-104 修改启动类型
c. 单击操作系统开始菜单,选择[计算机/属性/高级系统设置]菜单项,弹出系统属性对话框,默认进入“高级”页签。
图7-105 “高级”页签
d. 单击“性能”区域的<设置>按钮,弹出性能选项对话框,默认进入“视觉效果”页签,勾选“启用桌面组合”,并单击<确定>按钮。
图7-106 启用桌面组合
e. 重启Desktop Windows Manager Session Manager服务。
图7-107 重启Desktop Windows Manager Session Manager服务
(5) 上述发布前检查项确认无误后,将镜像虚拟机关机。
系统支持将镜像虚拟机克隆为桌面镜像,也支持将镜像虚拟机转换为桌面镜像。
· 克隆为桌面镜像:镜像虚拟机克隆为桌面镜像后,该镜像虚拟机仍会被保留,且支持继续编辑该镜像虚拟机。
将镜像虚拟机克隆为桌面镜像前,请先将镜像虚拟机上的vGPU卸载,待批量部署桌面时,再为桌面配置vGPU。
· 转换为桌面镜像:镜像虚拟机转化为桌面镜像后,该镜像虚拟机会被删除。
将镜像虚拟机转换为桌面镜像前请先关机。转换成功的桌面镜像将不再挂载vGPU,请在批量部署桌面时,为桌面配置vGPU。
此处以将镜像虚拟机克隆为桌面镜像为例。
(1) 在镜像虚拟机列表中,单击用于制作桌面镜像的镜像虚拟机对应操作列的<克隆为桌面镜像>按钮,弹出克隆为桌面镜像对话框。
图7-108 镜像虚拟机列表
(2) 设置桌面镜像名称和存储路径,并根据实际情况开启“克隆完成时创建快照”,单击<确定>按钮。
图7-109 克隆为桌面镜像
(3) 可从系统右上角任务台查看克隆进度。待完成克隆,在桌面镜像列表,可查看到制作完成的桌面镜像,该镜像即可用于创建桌面池。
图7-110 桌面镜像
(1) 单击管理平台左侧导航树[桌面池]菜单项,进入桌面池列表页面。
图7-111 桌面池页面
(2) 单击<新建桌面池>按钮,弹出增加桌面池对话框,选择新建类型,单击<下一步>按钮。
图7-112 新建桌面池-选择新建类型
(3) 配置桌面池基本信息,单击<下一步>按钮。
图7-113 新建桌面池-基本信息
(4) 配置登录信息,单击<下一步>按钮。
图7-114 新建桌面池-登录信息
(5) 在配置信息步骤中,选择桌面镜像并配置相关参数,单击<下一步>按钮。
图7-115 新建桌面池-配置信息
(6) 信息确认无误后,单击<完成>按钮。
图7-116 新建桌面池-确认信息
(1) 进入上一步创建的桌面池详情页面,单击上方<批量部署>按钮,进入批量部署页面。
图7-117 桌面池详情
(2) 配置批量部署基本信息,包括选择GPU资源池,单击<下一步>按钮,进入配置网络页面。
图7-118 批量部署桌面
图7-119 批量部署桌面-GPU资源池
· 桌面池关联的桌面镜像首次部署桌面时,部署个数为1,且无法修改。若需部署多个桌面,可继续进行批量部署操作,并设置部署个数。
· 业务模板请选择“非编业务”。
· 其余参数请根据实际情况设置。关于参数的详细说明,请参见《H3C Workspace云桌面 管理平台用户手册》的“新建VDI桌面池”章节。
(3) 选择虚拟交换机、网络策略模板/端口组,并选择IP分配方式后,单击<下一步>按钮。
图7-120 配置网络
(4) 确认信息无误后,单击<完成>按钮。
图7-121 批量部署完成
(5) 批量部署完成后,可在桌面列表中查看到已部署成功的桌面。
图7-122 桌面池的桌面列表
(1) 单击管理平台左侧导航树[桌面/<桌面池名称>]菜单项,进入指定桌面池详细信息页面下的“桌面”页签。
(2) 将桌面授权给用户。管理员可根据实际场景配置策略组中vGPU相关参数,并将策略应用到该桌面池。
图8-1 桌面授权成功
图8-2 vGPU策略配置
图8-3 策略组中vGPU参数修改
图8-4 策略组应用于桌面池
(3) 启动客户端,使用上一步授权的用户登录客户端,并连接启动云桌面。
(4) 打开桌面的设备管理器,可查看到对应的vGPU信息。
图8-5 设备管理器
在管理平台中的[策略/策略组]页面,新建或编辑授权策略时,可编辑vGPU相关配置。
图9-1 vGPU场景选择
图9-2 vGPU场景配置
表9-1 vGPU配置参数建议
参数名称 |
参数说明 |
显示场景 |
支持超轻载办公场景、轻载办公场景、中载办公场景、标准办公场景和重载办公场景,默认为标准办公场景。不同场景下抓图参数和编码参数的默认值略有不同。 · 超轻载办公场景:适用于512kbps以下的网络带宽,仅用于浏览文本文档等超轻载办公场景,显示质量较低。 · 轻载办公场景:适用于1Mbps以下的网络带宽,仅用于浏览文本文档及静态图片等轻载办公场景,显示质量略优于超轻载办公场景。 · 中载办公场景:适用于4Mbps以下的网络带宽,可用于浏览文档、图片、动态网页等中载办公场景。 · 标准办公场景:适用于20Mbps以下的网络带宽,可用于流畅播放标清/高清视频,显示质量与占用带宽达到最佳平衡。 · 重载办公场景:适用20Mbps以上的网络带宽,视频播放效果最优。 |
抓图帧率 |
每秒抓取的帧数。该值越大,则视频播放越流畅,但所需的网络带宽以及云桌面的GPU使用率也会随之升高。如果客户端使用软解,则CPU利用率也会随之升高。 |
抓图方式 |
支持超时抓图、固定帧率抓图和动态帧率抓图,默认为超时抓图。 · 超时抓图:需配置超时间隔时间(默认为150ms),即画面没有刷新或鼠标没有移动的情况下,每隔一个超时间隔时间抓一次图。 · 固定帧率抓图:不管画面是否有刷新或者鼠标是否有移动,等待(1000/抓图帧率)ms时间后开始抓图。 · 动态帧率抓图:画面有刷新或者鼠标有移动才抓图。 |
优先模式 |
支持质量优先和带宽优先,默认为质量优先。 · 质量优先:该模式优先以固定质量压缩视频画面,生效参数为“平均质量”、“最低质量”、“最高质量”以及“峰值码率”。桌面画面质量稳定,显示效果优,但可能造成带宽占用高,对终端硬件性能要求高。 · 带宽优先:该模式优先以固定码率压缩视频画面,生效参数为“平均码率”、“峰值码率”。带宽占用稳定,但画面质量可能产生波动,适用于终端性能要求不高,且桌面显示质量要求不高的场景。 |
平均质量 |
视频画面的平均质量系数。在质量优先模式下,该值越大,视频质量越差。 |
平均码率 |
视频画面的平均码率系数,单位为kbps。在带宽优先模式下,该值越大,视频质量越好。 |
最低质量 |
视频画面的质量下限。在质量优先模式下,该值越大,视频质量越差。 |
峰值码率 |
视频画面的峰值码率,单位kbps。该值越大,视频质量越好。 |
最高质量 |
视频画面的质量上限。在质量优先模式下,该值越大,视频质量越差。 |
编码预置 |
视频压缩算法参数。该值越小,编码速度越快,流畅度越好,但图像质量越差,带宽越大。 |
GOP |
Group of Pictures,即画面组,是一个视频压缩算法参数。一个GOP即一组连续的画面。该值越小,视频质量越好,但带宽占用越大,推荐设为视频帧率的1~2倍。 |
编码方式 |
视频编码方式,支持H.264和H.265两种编码方式。H.265即H.264的升级版,压缩率、传输码率都高于H.264,即同样视频画质和码率情况下,H.265比H.264占用的存储空间少、所需带宽较低,但服务器CPU占用较高,因此并发数会受一定影响。同时,该方式下终端配置要求也高于使用H.264编码方式。配置为H.265时,客户端将自动判断终端配置是否达要求,若达不到,将使用H.264编码方式。 |
色彩空间 |
视频流压缩转码方式,支持yuv420和yuv444。 |
该场景下终端性能充足,带宽充足,需要提高帧率以提升用户体验,推荐使用如下配置:
图9-3 vGPU配置推荐-性能PK场景
当终端性能不足,可适当降低帧率和码率,推荐使用如下配置:
图9-4 vGPU配置推荐-终端性能不足场景
当现场网络受限时,如网络带宽大小只有10Mbps时,可以使用带宽优先模式,并调整码率,推荐使用如下配置:
图9-5 vGPU配置推荐-广域网、专网场景
当客户对画面质量要求特别高时,可使用H.265并适当调整质量参数(平均质量、最低质量和最高质量),推荐使用如下配置:
图9-6 vGPU配置推荐-高画面质量场景
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启嵌套虚拟化,并使用主机匹配模式
· 磁盘建议使用QCOW2,然后使用writeback模式
嵌套虚拟化且主机匹配模式开启方法为:进入服务器后台,在/etc/modprobe.d/kvm-intel.conf中,添加options kvm-intel nested=1到最后一行,并重启服务器。然后在管理平台的修改虚拟机页面,CPU页签下, 将CPU工作模式设置为“主机匹配模式”。
· Creo 2.0内置的浏览器预览模型时,软件出现未响应:软件配置错误,升级IE版本到IE 11,并修改浏览器配置,安装Creo views插件,问题解决。
· Creo软件出现过卡顿、崩溃现象:问题在虚拟机CPU核数较少时,逐步提高CPU配置,并测试最优方案,最终确定Creo软件使用2*12配置,6Q GPU。
· 提升CPU主频测试,型号6250 CPU(主频3.9),虚拟机核数较少时,同样存在操作卡顿问题:在Creo的大文件应用场景中,CPU核数比主频更影响性能,需要优先保障核心数。在后续计划中需要考虑采购的设备需要多物理核心。显卡性能足够时,未发现性能瓶颈。
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
· MATLAB软件推荐使用2*4配置
· MATLAB2019有可能遇到启动慢问题,处理方法如下:
a. 找到注册License的路径并复制,右键桌面matlab.exe属性。
b. 在目标框中原先的语句后面加上 -c 'License路径',然后确定并重启软件(例:License路径为d:\matlab2019b\licenses\license_standalone.lic,测添加后的目标框为 d:\matlab2019b\bin\matlab.exe -c d:\matlab2019b\licenses\license_standalone.lic)。
CATIA的模型设计目前看不是非常消耗CPU,可以酌情处理。
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
· 虚拟机需配置环境变量,在Windows系统环境变量设置中,添加系统变量CAT_VBO_ALLOWED=1
实际使用场景优化项:
· 开启硬件加速
a. 右键单击“计算机”,选择[属性]。
图9-7 计算机属性
b. 单击左侧导航栏[高级系统设置]菜单项,在弹出的系统属性对话框的“高级”页签中,单击<环境变量>按钮。在弹出的对话框中的系统变量下,单击<新建>按钮,在弹出的新建系统变量对话框中填写相应的信息,其中变量名为CAT_VBO_ALLOWED,变量值为1。依次单击<确定>按钮,完成操作。
图9-8 新建系统变量
· 软件调优设置
a. 双击CATIA图标启动软件。
b. 单击<工具>按钮,在下拉菜单中选择[选项]。
图9-9 打开选项
c. 在弹出的对话框中,单击左侧导航栏[基础结构/产品结构],选择“告诉缓存管理”页签,勾选“使用高速缓存系统”,单击<确定>按钮,完成操作。
图9-10 使用高速缓存系统
· 显卡调优设置
a. 在桌面单击右键,打开NVIDIA控制面板。
图9-11 打开NVIDIA控制面板
b. 单击左侧导航栏[管理3D设置],选择“全局设置”页签,选择“3D App - Modeling AFR”,单击<应用>按钮,完成操作。
图9-12 全局设置
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
· 推荐使用AutoCAD 2012,该软件对于鼠标平面移动有优化效果
· AutoCAD 2016、2017版本需要打补丁,否则可能某些显卡无法在AutoCAD中使用(没有硬件加速)请下载SP1补丁
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
使用Soliworks镜像功能时,会有一定卡顿。
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
放大缩小时,对单核CPU要求较高,建议主频要高。
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
进行性能PK测试时,建议优化项如下:
· 关闭服务器超线程
· 开启大页
· CPU开启直通
· 磁盘建议使用QCOW2,缓存方式使用writeback模式
软件优化方案如下:
(1) 在桌面单击右键,打开NVIDIA控制面板。
图9-13 打开NVIDIA控制面板
(2) 单击左侧导航栏[管理3D设置],选择“程序设置”页签,单击<添加>按钮。
图9-14 程序设置
(3) 在弹出的窗口中选择浩辰CAD图标“GstarCAD Application”,单击<添加选定的程序>按钮。
图9-15 添加浩辰CAD
(4) 设置浩辰CAD的设置参数值,其中,开启“三重缓冲设置”和“低延时模式”。
图9-16 设置参数值
软件优化方案如下:
(1) 在桌面单击右键,打开显示设置,单击<图形设置>。
(2) 单击<浏览>按钮,添加需要加速的应用程序,其他AutoDesk的程序也可尝试通过此方法加速。
图9-17 图形设置
(3) 选中列表中的程序,单击<选项>按钮,在弹出的对话框中选择“高性能”,单击<保存>按钮,完成操作。
图9-18 图形规格设置
Abaqus使用NVIDIA显卡加速,需安装CUDA和cuDNN库。
(1) 在桌面单击右键,打开NVIDIA控制面板。
(2) 在控制面板左下角单击<系统信息>按钮。
图9-19 系统信息
(3) 在弹出的对话框中选择“组件”页签,查看驱动对应的CUDA版本,如图所示的版本为11.2.162。
图9-20 查看CUDA版本
(1) 打开网站https://developer.nvidia.com/cuda-downloads,单击Archive of Previous CUDA Releases。
图9-21 单击Archive of Previous CUDA Releases
(2) 选择对应版本。
图9-22 选择对应版本
(3) 根据目标机器情况选择安装包,其中,可以选择下载离线安装包或在线安装包,选择完成后单击<Download>下载安装包。
图9-23 选择安装包
(1) 下载完成后解压文件,选择临时解压目录。
图9-24 选择解压目录
安装完成后会自动删除临时解压目录,临时解压目录和默认安装目录不要设置为同一个目录。
(2) 启动安装程序,单击<同意并继续>按钮。
图9-25 同意并继续
(3) 选择“自定义”,单击<下一步>按钮。
图9-26 选择“自定义”
(4) 全选所有组件,若无开发环境则取消勾选“Visual Studio Integrantion”,单击<下一步>按钮。
图9-27 组件选择-1
图9-28 组件选择-2
(5) 选择安装位置,建议保持默认并记录安装位置,单击<下一步>按钮。
图9-29 选择安装位置
(6) 单击<下一步>按钮,完成安装。
图9-30 安装
(7) 检查环境变量。
图9-31 检查环境变量
(8) 如果不存在请手动添加以下变量,其中,环境变量和版本号有关。
图9-32 环境变量
(1) 打开cuDNN地址:https://developer.nvidia.com/rdp/cudnn-download,登录后进入到下载页面。
(2) 选择和CUDA版本是配置的cuDNN版本。
图9-33 选择cuDNN版本
(3) 选择对应平台后下载。
图9-34 选择对应平台
(4) 将下载完成的压缩包解压后得到如下文件目录。
图9-35 解压压缩包
(5) 将解压后的文件拷贝到CUDA安装目录。默认安装目录为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0,且注意区分版本。
(6) 再次确认CUDA的目录是否添加到PATH环境变量。
图9-36 确认环境变量
(7) 检查如下变量是否添加,通常“Bin”和“lib”会自动添加,若不做开发的话include文件夹可以不添加。
¡ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin
¡ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\include
¡ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\lib
¡ C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\libnvvp
(8) 验证是否成功,使用管理员运行CMD,切换到CUDA安装目录下,进入到…\extras\demo_suite文件夹,分别执行bandwidthTest.exe和deviceQuery.exe。
图9-37 执行bandwidthTest.exe
图9-38 执行deviceQuery.exe
Abaqus通过环境变量开启CUDA加速,以下两种方法任选一种即可
· 设置全局变量:在系统全局变量里加入“ABA_ACCELERATOR_TYPE”变量,值为“PLATFORM_CUDA”。
· 设置Abaqus环境变量:找到abaqus_v6.env文件,并在文件末尾加上如下设置。
图9-39 添加内容
Abaqus并不是所有计算都可以使用CUDA加速,只有部分算法支持CUDA加速。可以通过任务管理器中性能选项卡,GPU标签页中查看CUDA占用。
监控视频软件要能支持硬解。
· 局点:**部门
· 配置:
¡ 服务器CPU型号:Intel(R) Xeon(R) Gold 5217 CPU @ 3.00GHz 32核
¡ 服务器显卡型号:NVIDIA M10
¡ 显卡模式:vGPU模式,切分方式为2Q。
¡ 虚拟机配置:4个兼容模式的CPU核心,8GB内存。
¡ 终端配置:C31M,WES7系统,1080P单屏
· 实际效果:8个vGPU虚拟机,同时6个虚拟机并发4路视频监控,另外2个vGPU虚机可以做日常办公使用。由于使用硬件解码,CPU整体占用很低,可以根据需要再部署一批不带vGPU的虚拟机作为普通办公使用。
· 对CPU资源消耗很高,虚机密度并不高。
· 未能充分利用显卡资源,造成GPU资源浪费。
· 在vGPU模式下,由于英伟达自身问题,视频监控软件使用软解可能无法充分利用CPU资源,导致在剩余大量CPU资源的情况下,视频却卡顿。
· 由于每个GPU核心只能直通给一个虚机使用,造成GPU资源浪费。
· 对CPU资源消耗很高,虚机密度并不高。
· 方案优点:无须配置显卡。
· 方案缺点:占用大量CPU资源。
· 软件配置:监控视频软件支持软解即可。
· 局点:**部门
· 配置:
¡ 硬件配置:R4900G3服务器 * 1 CPU:intel 6226R [email protected] 2*16*2核
¡ 软件配置:Workspace版本:E1012P06
¡ 监控系统软件:海康威视 智慧监所综合管控平台 版本:v1.2.0_20200428
¡ 终端系统:UOS
¡ 分辨率:1600x900
· 测试场景一:无视频加速卡
¡ 开启4路桌面,运行流畅。开启8路桌面,服务器CPU负载最高达到90%,因CPU负载过高导致监控画面卡顿。
· 测试场景二:配置视频加速卡(未正式发布)
¡ 每个虚机内监控软件承载4*4个视频窗口。同时开启8路云桌面,CPU利用率由90%降低到45%~70%,画面流畅。
(1) 对比PC上相同软件视频效果,排除客户环境因素(网络波动、丢包、视频服务器负载波动等)。
(2) 对比PC 和虚机windows系统版本,补丁列表,视频软件版本等信息,确保一致。
(3) 确认服务器/虚机CPU、GPU、IO、内存等资源是否达到瓶颈。
(4) 使用不同视频播放软件对比,排除监控软件自身问题。
(5) 排除加密类/安全类软件影响。
本节例图以4900G5服务器,BIOS版本5.45,Workspace版本E1013P09为参考,其他版本请查看对应版本说明。
在服务器的BIOS中找到Intel VT-d,设置为“Enabled”并保存。
图9-40 开启Intel VT-d
(1) 在Workspace管理平台页面上,找到主机,并进入高级设置页面IOMMU开启后,保存并重启服务器生效。
图9-41 开启IOMMU
(2) 开启后按下图检查确认IOMMU是否已开启。如果出现错误信息,请检查BIOS设置,关注intel VT-d是否开启。
图9-42 确认IOMMU开启
(1) 在服务器的BIOS中找到VMX,设置为“Enabled”并保存。
图9-43 开启VMX
E1015及之后版本默认开启大页,若未开启,可参见以下步骤手动开启。
(1) 在Workspace管理平台页面上开启大页配置,页大小选择2M,页数根据实际所需设置。如果该服务器只有一个虚拟机用于测试,可把大页设置默认最大,开启后,保存重启服务器生效。
图9-44 开启大页
(2) 服务器重启后,虚拟机处于关机状态,进入修改虚拟机界面,内存分配大小根据实际所需分配,修改后单击<应用>保存。
图9-45 开启大页
在服务器的BIOS中找到Hyper-Threading [ALL],设置为“Enabled”表示开启,设置为“Disabled”表示关闭。
图9-46 超线程配置
vGPU虚拟机处于关机状态,找到该虚拟机使用对应的vgpu-id(可通过智能资源池查看),在服务器侧执行以下命进行修改,然后启动虚拟机即可:
echo "frame_rate_limiter=0" > /sys/bus/mdev/devices/vgpu-id/nvidia/vgpu_params
在Workspace管理平台页面上,找到主机,并在GPU设备页签找到对应GPU,进行关闭或开启ECC操作,然后重启服务器生效。
图9-47 ECC开启/关闭
(1) 通过如下命令开启高性能:
cpupower -c all frequency-set -g performance
(2) 通过如下命令检查是否正确开启高性能:
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
(3) 如果出现下图所示内容代表高性能模式已经开启
图9-48 高性能开启
E1015及之后版本新创建的虚拟机CPU工作模式默认为直通模式,若未开启直通模式,可参见以下步骤手动开启。
虚拟机处于关机状态,在Workspace管理平台页面上,进入修改虚拟机界面修改。
图9-49 开启CPU直通
虚拟机处于关机状态,在Workspace管理平台页面上,进入修改虚拟机界面,修改如下。
图9-50 修改磁盘缓存方式-1
图9-51 修改磁盘缓存方式
(1) 在管理平台的虚拟机控制台查看是否有画面。
(2) 如果控制台也是黑屏,则收集虚拟机日志后,联系技术支持工程师。
(3) 如果控制台有画面则先一键收集虚拟机日志和终端日志,然后进行以下尝试。
(4) 尝试在Toolbar的[高级设置/体验/解码模式]中切换软硬解看是否能否恢复,如果恢复,若需定位原因,则再次一键收集虚拟机和终端日志,保存出问题前的日志和恢复后的日志,联系技术支持工程师,并说明时间点。
(5) 尝试重连看是否能恢复,则再次一键收集虚拟机和终端日志,保存出问题前的日志和恢复后的日志,联系技术支持工程师,并说明时间点。
(6) 尝试使用不同的终端登录云桌面,则再次一键收集虚拟机和终端日志,保存出问题前的日志和恢复后的日志,联系技术支持工程师,并说明时间点。
(7) 如以上尝试均不能恢复,则修改虚拟机内C:\Program Files (x86)\H3C\VdiAgent\Vgpu\config\VGPUCapture文件,将SaveStream字段置为1。
图10-1 将 SaveStream 字段置为1
(8) 修改完成后需在任务管理器中手动结束VGPUCapture进程,以使修改生效,结束进程后,进程将自动重新启动。
图10-2 任务管理器杀死VGPUCapture进程
(9) 运行10秒-1分钟之后再次一键收集虚拟机和终端日志,联系技术支持工程师。由于将SaveStream字段改为1之后VGPUCapture会一直保存图像流到本地文件,所以收集完日志后应立即将SaveStream字段改为0,并重启VGPUCaptre进程避免云桌面磁盘被写满。
(1) 排查Nvidia license是否获取,驱动是否正常,显示适配器只能有H3CDEnhance GPU 与 NVIDIA驱动。
图10-3 驱动查看
(1) 查看License是否有并且已被激活。
(2) 在云桌面中里查看CPU使用率,打开任务管理器,查看CPU是否满载。对于Windows10云桌面请选择逻辑处理器视图,如下图所示。CPU状态请关注整体和单核负载。
(3) 在Windows10操作系统中,打开任务管理器,选择“性能”页签,单击GPU查看负载情况,如下图所示。Window 7操作系统中,请使用nvidia-smi 命令查看GPU负载情况。在Window 7或Windows 10操作系统中,也可以在C:\Program Files\NVIDIA Corporation\NVSMI路径中运行nvdia-smi.exe以查看GPU负载情况。
图10-5 Windows 10查看GPU负载
图10-6 运行nvdia-smi.exe查看GPU负载
(4) 使用RDP远程桌面(mstsc命令)连接云桌面进行对比,若存在卡顿问题,需排查虚拟机问题,若不存在卡顿问题,需排查硬件性能问题,或联系技术支持工程师。
(5) 确认终端的编码能力和使用场景。
¡ 终端解码能力是否可以支持多屏
¡ 终端解码能力是否满足当前屏幕分辨率
¡ 终端解码能力是否能够满足当前帧率
¡ 可以登录终端查看其CPU和GPU状态
与直通GPU相比,在物理GPU上配置的单个vGPU使用3dmark等软件跑分时产生的基准得分更低。
除了可能归因于vGPU较小的帧缓冲区大小的性能差异之外,vGPU还集成了称为帧速率限制器(Frame Rate Limiter,FRL)的性能平衡功能。在使用尽力调度程序的vGPU上,启用了FRL。在使用固定份额或相等份额调度程序的vGPU上,FRL被禁用。
同一物理GPU上可以运行多个vGPU,FRL 用于平衡这些vGPU的性能。该功能旨在提供良好的交互式远程图形体验。与直通GPU相比,使用了FRL的vGPU在帧渲染速率上的基准分数可能会更低。
解决方法:
(1) 在智能资源调度的“资源明细”页签中查询虚拟机和对应正在使用的vGPU及其UUID。
图10-7 智能资源调度页签
图10-8 查看虚拟机使用vGPU的UUID
(2) 在CVK上执行cd /sys/bus/mdev/devices,进入vGPU设备配置文件路径,找到管理平台所查看的UUID。
图10-9 找到对应UUID
(3) 先将虚拟机关机,然后执行如下命令修改配置文件,关闭FRL策略
echo "frame_rate_limiter=0" > 「vGPU-UUID」/nvidia/vgpu_params//执行命令将frame_rate_limiter值设为0,vGPU-UUID为查询到的UUID。
若需要开启FRL策略,执行如下命令将frame_rate_limiter值设为1:echo "frame_rate_limiter=1" > 「vGPU-UUID」/nvidia/vgpu_params,
FRL影响vGPU底层调度,仅推荐在性能跑分测试时禁用,实际生产场景建议开启。
(1) 虚拟机上是否安装grid驱动 是否配置了License Server地址。
(2) 是否和License Server IP 能ping通 端口是否能通。
(3) License Server上是否还有剩余可分配的授权点数 授权时间是否过期。
(4) License Sever 是否与vm的时间同步。
(5) License类型是否和VM上显卡切分的类型对应。
(6) License服务的虚拟机:FlexNet License Server - nvidia服务运行是否正常,在License客户端虚拟机:NVIDIA Display Container LS服务运行是否正常。若运行异常可尝试重启服务。
(1) 在云桌面中同时按下“Windows”与“R”键打开运行窗口,在运行窗口中输入“regedit”打开注册表编辑器,在编辑器中找到指定注册表项“HKEY_LOCAL_MACHINE\SOFTWARE\NVIDIA Corporation\Global\GridLicensing”。
(2) 添加名称为“LicenseInterval”、类型为Dword(REG_DWORD)的注册表项,数值为License租约期限,此数值决定License的回收时间,如果License回收速度慢,建议将此数值设置小。
图10-10 编辑注册表项
License租约期限的取值范围为:10-10080,单位为分钟(minutes),默认1440分钟即1天。
nvidia-smi是nvidia 的系统管理界面 ,其中smi是System management interface的缩写,它可以收集各种级别的信息,查看显存使用情况。可以使用该工具进行简单的问题排查。
图10-11 nvidia-smi系统管理界面
常用命令如下:
nvidia-smi vgpu//查看当前vGPU的状态信息:
图10-12 查看vGPU状态信息
nvidia-smi vgpu –p//循环显示虚拟桌面中应用程序对GPU资源的占用情况
图10-13 GPU资源的占用情况
nvidia-smi dmon//设备监控命令,以滚动条形式显示GPU设备统计信息。
图10-14 GPU设备统计信息
(1) 执行nvidia-smi –q,查看display Mode和persistence mode是否为enable,如果为disable,确认显卡来源,以及是否被切换到计算模式。如果被人更改过vBios,让更改人还原到原来的配置,并检查显卡的配置结果是否如下图所示。
图10-15 查看信息
(2) 确认服务器bios中的Intel VT-d处于开启状态。确认开启方法参见9.4.1 Intel VT-d开启方法。
(3) 确认IOMMU开启。确认开启方法参见9.4.2 IOMMU开启方法。
(4) 确认服务器BIOS中的VMX处于开启状态。确认开启方法请参见9.4.3 VMX开启方法。
目前,E1015P02及之前版本所适配的Grid 13.7及之前版本在Tesla T4显卡上运行时可能会出现虚拟机花屏问题,这是NVIDIA本身存在的bug。为解决该问题,需要在虚拟机内以管理员身份运行3973158_war.exe程序,并重启虚拟机。请联系技术支持工程师获取该程序。
(1) 登录NVIDIA许可门户,单击左侧导航栏[LICENSE SERVERS/LIST SERVERS]菜单项,进入License Server页面。
(2) 单击欲回收License的License Server后的<Actions>按钮,选择[Manage Features]菜单项,弹出“Manage Server Features”对话框。
图11-1 License Server页面
图11-2 “Manage Server Features”对话框
(4) 删除后,单击<UODATE SERVER FEATURES>按钮,完成License的回收。
图11-3 完成删除
(1) 关闭使用显卡上vGPU资源的所有云桌面。
(2) 单击左侧导航树[数据中心/虚拟化]菜单项,进入虚拟化概览信息页面。
(3) 单击“智能资源调度”页签,单击智能资源调度对应操作列的<删除>按钮,在弹出的操作确认对话框单击<确认>按钮,删除智能资源调度。
图11-4 删除智能资源调度
(4) 单击左侧导航树[数据中心/虚拟化/<集群名称>/<主机名称>]菜单项,进入指定主机概要信息页面。
(5) 单击“GPU设备”页签, 在列表中选择一个或多个GPU设备,单击上方<批量回收vGPU>按钮,或单击GPU设备对应操作列的<回收vGPU>按钮。
(6) 在弹出的操作确认对话框中单击<确定>按钮,回收vGPU。
图11-5 回收vGPU
每个物理GPU都可以支持几种不同类型的虚拟GPU(vGPU)。显卡和vGPU类型决定了显存大小、支持的显示器数量和最大分辨率。根据优化工作负载的不同类别,它们被分为不同的系列,每个系列由vGPU类型名称的最后一个字母标识:
· Q系列:该类型的vGPU针对设计师和高级用户,使用vWS类型授权。
· C系列:虚拟计算密集型服务器工作负载,如人工智能、高性能计算等,使用vCS/vWS类型授权。
· B系列:该类型的vGPU针对高级用户,使用vPC/vWS类型授权。
· A系列:该类型的vGPU针对虚拟应用程序用户,使用vAPP类型授权。
C系列NVIDIA vGPU不支持Windows操作系统的虚拟机。
不同类型的vGPU具有固定的显存、显示器接口数和最大分辨率。
物理GPU可以切分的vGPU是有数量限制的,切分原则是:
· 按照显存进行切分,切分后每个vGPU的显存大小是固定的。
· 每一个物理GPU同时仅能按照一种显存大小的规格进行切分。
· 同一显卡上的不同物理GPU可以同时切分为不同类型的vGPU。
以Teska M60显卡为例,对切分原则进行了演示:
· GPU0以M60-2Q进行切分, 同时GPU1以M60-4Q进行切分 ,切分有效。
· GPU0 以M60-1B进行切分, 同时GPU1 以M60-2Q进行切分 ,切分有效。
· GPU0以M60-2Q和M60-4Q进行混合切分,切分无效,无法切分。GPU1 以M60-1B 进行切分 ,切分有效
图11-6 Tesla M60切分举例
· 对于各种切分,Nvidia对vGPU帧率做了限制,具体限制为:B型切分帧率最高为45fps,Q、C和A型切分帧率最高为60fps。
· vGPU帧率限制的解除方法,请见vGPU测试分数低于直通GPU。
· 更多关于适用于虚拟化的NVIDIA GPU以及其支持的vGPU的介绍,请参考NVIDIA的《Virtual GPU Software User Guide》手册。
表11-1 显卡编码类型支持情况
显卡 |
H.264 (AVCHD) YUV 4:2:0 |
H.264 (AVCHD) YUV 4:4:4 |
H.264 (AVCHD) Lossless |
H.265 (HEVC) 4K YUV 4:2:0 |
H.265 (HEVC) 4K YUV 4:4:4 |
H.265 (HEVC) 4K Lossless |
H.265 (HEVC) 8k |
HEVC 10-bit support |
HEVC B Frame support |
Tesla M10 |
√ |
√ |
√ |
× |
× |
× |
× |
× |
× |
Tesla M60 |
√ |
√ |
√ |
√ |
× |
× |
× |
× |
× |
Tesla P4 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
× |
Tesla T4 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
Tesla P40 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
× |
Tesla P100 |
√ |
√ |
√ |
√ |
√ |
√ |
× |
√ |
× |
Tesla V100 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
× |
NVIDIA A16 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
NVIDIA A40 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
Quadro RTX 6000 / RTX 8000 |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
√ |
× |
每块Tesla T4显卡含1个物理GPU。
表11-2 Tesla T4支持的vGPU类型-Q系列
vGPU类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
T4-16Q |
虚拟工作站 |
16384 |
1 |
1 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
T4-8Q |
虚拟工作站 |
8192 |
2 |
2 |
7680×4320 |
2 |
Quadro vDWS |
5120×288或更低 |
4 |
||||||
T4-4Q |
虚拟工作站 |
4096 |
4 |
4 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
T4-2Q |
虚拟工作站 |
2048 |
8 |
8 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
T4-1Q |
虚拟桌面 虚拟工作站 |
1024 |
16 |
16 |
5120×2880 |
1 |
Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-3 Tesla T4支持的vGPU类型-B系列
vGPU类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
T4-2B |
虚拟桌面 |
2048 |
8 |
8 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
T4-2B4 |
虚拟桌面 |
2048 |
8 |
8 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
T4-1B |
虚拟桌面 |
1024 |
16 |
16 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
||||||
T4-1B4 |
虚拟桌面 |
1024 |
16 |
16 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-4 Tesla T4支持的vGPU类型-A系列
vGPU类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
T4-16A |
虚拟应用 |
16384 |
1 |
1 |
1280×1024 |
1 |
GRID Virtual Application |
T4-8A |
虚拟应用 |
8192 |
2 |
2 |
1280×1024 |
1 |
|
T4-4A |
虚拟应用 |
4096 |
4 |
4 |
1280×1024 |
1 |
|
T4-2A |
虚拟应用 |
2048 |
8 |
8 |
1280×1024 |
1 |
|
T4-1A |
虚拟应用 |
1024 |
16 |
16 |
1280×1024 |
1 |
· 每块Tesla V100显卡含1个物理GPU。
· 此处以Tesla V100 PCIe 32GB为例。
表11-5 Tesla V100支持的vGPU类型-Q系列
vGPU类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
V100D-32Q |
虚拟工作站 |
32768 |
1 |
1 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
V100D-16Q |
虚拟工作站 |
16384 |
2 |
2 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
V100D-8Q |
虚拟工作站 |
8192 |
4 |
4 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
V100D-4Q |
虚拟工作站 |
4096 |
8 |
8 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
V100D-2Q |
虚拟工作站 |
2048 |
16 |
16 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
V100D-1Q |
虚拟桌面 虚拟工作站 |
1024 |
32 |
32 |
5120×2880 |
1 |
Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-6 Tesla V100支持的vGPU类型-B系列
vGPU类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
V100D-2B |
虚拟桌面 |
2048 |
16 |
16 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
V100D-2B4 |
虚拟桌面 |
2048 |
16 |
16 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
V100D-1B |
虚拟桌面 |
1024 |
32 |
32 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
||||||
V100D-1B4 |
虚拟桌面 |
1024 |
32 |
32 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-7 Tesla V100支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
V100D-32A |
虚拟应用 |
32768 |
1 |
1 |
1280×102 |
1 |
GRID Virtual Application |
V100D-16A |
虚拟应用 |
16384 |
2 |
2 |
1280×1024 |
1 |
|
V100D-8A |
虚拟应用 |
8192 |
4 |
4 |
1280×1024 |
1 |
|
V100D-4A |
虚拟应用 |
4096 |
8 |
8 |
1280×1024 |
1 |
|
V100D-2A |
虚拟应用 |
2048 |
16 |
16 |
1280×1024 |
1 |
|
V100D-1A |
虚拟应用 |
1024 |
32 |
32 |
1280×1024 |
1 |
每块Quadro RTX 6000显卡含1个物理GPU。
表11-8 Quadro RTX 6000支持的vGPU类型-Q系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
RTX6000-24Q |
虚拟工作站 |
24576 |
1 |
1 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX6000-12Q |
虚拟工作站 |
12288 |
2 |
2 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX6000-8Q |
虚拟工作站 |
8192 |
3 |
3 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX6000-6Q |
虚拟工作站 |
6144 |
4 |
4 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX6000-4Q |
虚拟工作站 |
4096 |
6 |
6 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX6000-3Q |
虚拟工作站 |
3072 |
8 |
8 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
RTX6000-2Q |
虚拟工作站 |
2048 |
12 |
12 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
RTX6000-1Q |
虚拟工作站 |
1024 |
24 |
24 |
5120×2880 |
1 |
Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-9 Quadro RTX 6000支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
RTX6000-2B |
虚拟桌面 |
2048 |
12 |
12 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
RTX6000-1B |
虚拟桌面 |
1024 |
24 |
24 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-10 Quadro RTX 6000支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
RTX6000-24A |
虚拟应用 |
24576 |
1 |
1 |
1280×1024 |
1 |
GRID Virtual Application |
RTX6000-12A |
虚拟应用 |
12288 |
2 |
2 |
1280×1024 |
1 |
|
RTX6000-8A |
虚拟应用 |
8192 |
3 |
3 |
1280×1024 |
1 |
|
RTX6000-6A |
虚拟应用 |
6144 |
4 |
4 |
1280×1024 |
1 |
|
RTX6000-4A |
虚拟应用 |
4096 |
6 |
6 |
1280×1024 |
1 |
|
RTX6000-3A |
虚拟应用 |
3072 |
8 |
8 |
1280×1024 |
1 |
|
RTX6000-2A |
虚拟应用 |
2048 |
12 |
12 |
1280×1024 |
1 |
|
RTX6000-1A |
虚拟应用 |
1024 |
24 |
24 |
1280×1024 |
1 |
每块Quadro RTX 8000显卡含1个物理GPU。
表11-11 Quadro RTX 8000支持的vGPU类型-Q系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
RTX8000-48Q |
虚拟工作站 |
49152 |
1 |
1 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-24Q |
虚拟工作站 |
24576 |
2 |
2 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-16Q |
虚拟工作站 |
16384 |
3 |
3 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-12Q |
虚拟工作站 |
12288 |
4 |
4 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-8Q |
虚拟工作站 |
8192 |
6 |
6 |
7680×4320 |
2 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-6Q |
虚拟工作站 |
6144 |
8 |
8 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-4Q |
虚拟工作站 |
4096 |
12 |
12 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880或更低 |
4 |
||||||
RTX8000-3Q |
虚拟工作站 |
3072 |
16 |
16 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
RTX8000-2Q |
虚拟工作站 |
2048 |
24 |
24 |
7680×4320 |
1 |
Quadro vDWS |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
RTX8000-1Q |
虚拟工作站 |
1024 |
32 |
32 |
5120×2880 |
1 |
Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-12 Quadro RTX 8000支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License类型 |
RTX8000-2B |
虚拟桌面 |
2048 |
24 |
24 |
5120×2880 |
1 |
GRID Virtual PC或Quadro vDWS |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
RTX8000-1B |
虚拟桌面 |
1024 |
32 |
32 |
5120×2880 |
1 |
|
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-13 Quadro RTX 8000支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
License 类型 |
RTX8000-48A |
虚拟应用 |
49152 |
1 |
1 |
1280×1024 |
1 |
GRID Virtual Application |
RTX8000-24A |
虚拟应用 |
24576 |
2 |
2 |
1280×1024 |
1 |
|
RTX8000-16A |
虚拟应用 |
16384 |
3 |
3 |
1280×1024 |
1 |
|
RTX8000-12A |
虚拟应用 |
12288 |
4 |
4 |
1280×1024 |
1 |
|
RTX8000-8A |
虚拟应用 |
8192 |
6 |
6 |
1280×1024 |
1 |
|
RTX8000-6A |
虚拟应用 |
6144 |
8 |
8 |
1280×1024 |
1 |
|
RTX8000-4A |
虚拟应用 |
4096 |
12 |
12 |
1280×1024 |
1 |
|
RTX8000-3A |
虚拟应用 |
3072 |
16 |
16 |
1280×1024 |
1 |
|
RTX8000-2A |
虚拟应用 |
2048 |
24 |
24 |
1280×1024 |
1 |
|
RTX8000-1A |
虚拟应用 |
1024 |
32 |
32 |
1280×1024 |
1 |
每块A10显卡含1个物理GPU。
表11-14 NVIDIA A10支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A10-24Q |
虚拟工作站 |
24576 |
1 |
1 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A10-12Q |
虚拟工作站 |
12288 |
2 |
2 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A10-8Q |
虚拟工作站 |
8192 |
3 |
3 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A10-6Q |
虚拟工作站 |
6144 |
4 |
4 |
58982400 |
7680×4320 |
1 |
5120×2880或更低 |
4 |
||||||
A10-4Q |
虚拟工作站 |
4096 |
6 |
6 |
58982400 |
7680×4320 |
1 |
5120×2880或更低 |
4 |
||||||
A10-3Q |
虚拟工作站 |
3072 |
8 |
8 |
35389440 |
7680×4320 |
1 |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
A10-2Q |
虚拟工作站 |
2048 |
12 |
12 |
35389440 |
7680×4320 |
1 |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
A10-1Q |
虚拟工作站 |
1024 |
24 |
24 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-15 NVIDIA A10支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A10-2B |
虚拟桌面 |
2048 |
12 |
12 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
A10-1B |
虚拟桌面 |
1024 |
24 |
24 |
16384000 |
5120×2880 |
1 |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-16 NVIDIA A10支持的vGPU类型-C系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A10-24C |
Training Workloads |
24576 |
1 |
1 |
4096×2160 |
1 |
A10-12C |
Training Workloads |
12288 |
2 |
2 |
4096×2160 |
1 |
A10-8C |
Training Workloads |
8192 |
3 |
3 |
4096×2160 |
1 |
A10-6C |
Training Workloads |
6144 |
4 |
4 |
4096×2160 |
1 |
A10-4C |
Inference Workloads |
4096 |
6 |
6 |
4096×2160 |
1 |
表11-17 NVIDIA A10支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A10-24A |
虚拟应用 |
24576 |
1 |
1 |
1280×1024 |
1 |
A10-12A |
虚拟应用 |
12288 |
2 |
2 |
1280×1024 |
1 |
A10-8A |
虚拟应用 |
8192 |
3 |
3 |
1280×1024 |
1 |
A10-6A |
虚拟应用 |
6144 |
4 |
4 |
1280×1024 |
1 |
A10-4A |
虚拟应用 |
4096 |
6 |
6 |
1280×1024 |
1 |
A10-3A |
虚拟应用 |
3072 |
8 |
8 |
1280×1024 |
1 |
A10-2A |
虚拟应用 |
2048 |
12 |
12 |
1280×1024 |
1 |
A10-1A |
虚拟应用 |
1024 |
24 |
24 |
1280×1024 |
1 |
每块A16显卡含4个物理GPU。
表11-18 NVIDIA A16支持的vGPU类型-Q系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A16-16Q |
虚拟工作站 |
16384 |
1 |
4 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A16-8Q |
虚拟工作站 |
8192 |
2 |
8 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A16-4Q |
虚拟工作站 |
4096 |
4 |
16 |
58982400 |
7680×4320 |
1 |
5120×2880或更低 |
4 |
||||||
A16-2Q |
虚拟工作站 |
2048 |
8 |
32 |
35389440 |
7680×4320 |
1 |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
A16-1Q |
虚拟桌面、虚拟工作站 |
1024 |
16 |
64 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
表11-19 NVIDIA A16支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A16-2B |
虚拟桌面 |
2048 |
8 |
32 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
A16-1B |
虚拟桌面 |
1024 |
16 |
64 |
16384000 |
5120×2880 |
1 |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-20 NVIDIA A16支持的vGPU类型-C系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A16-16C |
Training Workloads |
16384 |
1 |
4 |
4096×2160 |
1 |
A16-8C |
Training Workloads |
8192 |
2 |
8 |
4096×2160 |
1 |
A16-4C |
Inference Workloads |
4096 |
4 |
16 |
4096×2160 |
1 |
表11-21 NVIDIA A16支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A16-16A |
虚拟应用 |
16384 |
1 |
4 |
1280×1024 |
1 |
A16-8A |
虚拟应用 |
8192 |
2 |
8 |
1280×1024 |
1 |
A16-4A |
虚拟应用 |
4096 |
4 |
16 |
1280×1024 |
1 |
A16-2A |
虚拟应用 |
2048 |
8 |
32 |
1280×1024 |
1 |
A16-1A |
虚拟应用 |
1024 |
16 |
64 |
1280×1024 |
1 |
表11-22 NVIDIA A40支持的vGPU类型-Q系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A40-48Q |
虚拟工作站 |
49152 |
1 |
1 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A40-24Q |
虚拟工作站 |
24576 |
2 |
2 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A40-16Q |
虚拟工作站 |
16384 |
3 |
3 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A40-12Q |
虚拟工作站 |
12288 |
4 |
4 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A40-8Q |
虚拟工作站 |
8192 |
6 |
6 |
66355200 |
7680×4320 |
2 |
5120×2880或更低 |
4 |
||||||
A40-6Q |
虚拟工作站 |
6144 |
8 |
8 |
58982400 |
7680×4320 |
1 |
5120×2880或更低 |
4 |
||||||
A40-4Q |
虚拟工作站 |
4096 |
12 |
12 |
58982400 |
7680×4320 |
1 |
5120×2880或更低 |
4 |
||||||
A40-3Q |
虚拟工作站 |
3072 |
16 |
16 |
35389440 |
7680×4320 |
1 |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
A40-2Q |
虚拟工作站 |
2048 |
24 |
24 |
35389440 |
7680×4320 |
1 |
5120×2880 |
2 |
||||||
4096×2160或更低 |
4 |
||||||
A40-1Q |
虚拟工作站 |
1024 |
32 |
32 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
表11-23 NVIDIA A40支持的vGPU类型-B系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
像素 |
分辨率 |
显示器接口数 |
A40-2B |
虚拟桌面 |
2048 |
24 |
24 |
17694720 |
5120×2880 |
1 |
4096×2160 |
2 |
||||||
3840×2160 |
2 |
||||||
2560×1600或更低 |
4 |
||||||
A40-1B |
虚拟桌面 |
1024 |
32 |
32 |
16384000 |
5120×2880 |
1 |
4096×2160 |
1 |
||||||
3840×2160 |
1 |
||||||
2560×1600或更低 |
4 |
表11-24 NVIDIA A40支持的vGPU类型-C系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A40-48C |
Training Workloads |
49152 |
1 |
1 |
4096×2160 |
1 |
A40-24C |
Training Workloads |
24576 |
2 |
2 |
4096×2160 |
1 |
A40-16C |
Training Workloads |
16384 |
3 |
3 |
4096×2160 |
1 |
A40-12C |
Training Workloads |
12288 |
4 |
4 |
4096×2160 |
1 |
A40-8C |
Training Workloads |
8192 |
6 |
6 |
4096×2160 |
1 |
A40-6C |
Training Workloads |
6144 |
8 |
8 |
4096×2160 |
1 |
A40-4C |
Inference Workloads |
4096 |
8 |
12 |
4096×2160 |
1 |
表11-25 NVIDIA A40支持的vGPU类型-A系列
vGPU 类型 |
场景 |
显存(MB) |
每个物理GPU支持vGPU数 |
每个显卡支持vGPUs数 |
分辨率 |
显示器接口数 |
A40-48A |
虚拟应用 |
49152 |
1 |
1 |
1280×1024 |
1 |
A40-24A |
虚拟应用 |
24576 |
2 |
2 |
1280×1024 |
1 |
A40-16A |
虚拟应用 |
16384 |
3 |
3 |
1280×1024 |
1 |
A40-12A |
虚拟应用 |
12288 |
4 |
4 |
1280×1024 |
1 |
A40-8A |
虚拟应用 |
8192 |
6 |
6 |
1280×1024 |
1 |
A40-6A |
虚拟应用 |
6144 |
8 |
8 |
1280×1024 |
1 |
A40-4A |
虚拟应用 |
4096 |
12 |
12 |
1280×1024 |
1 |
A40-3A |
虚拟应用 |
3072 |
16 |
16 |
1280×1024 |
1 |
A40-2A |
虚拟应用 |
2048 |
24 |
24 |
1280×1024 |
1 |
A40-1A |
虚拟应用 |
1024 |
32 |
32 |
1280×1024 |
1 |
NVIDIA vGPU是一种许可产品。在受支持的GPU上启动时,vGPU的性能将会受到限制,获得许可证后,这些限制将被删除。未经许可的vGPU的性能将受到以下限制:
· 帧速率上限为每秒3帧。
· GPU资源分配有限,这将阻止某些应用程序正常运行。
· 在支持CUDA的VGPU上,CUDA被禁用。
· Q系列vGPU类型需要Quadro vDWS许可证。
· C系列vGPU类型需要NVIDIA虚拟计算服务器(vCS)许可证,但也可以与Quadro vDWS许可证一起使用。
· B系列vGPU类型需要GRID Virtual PC许可证,但也可以与Quadro vDWS许可证一起使用。
· A系列vGPU类型需要GRID Virtual Applications许可证。
NLS(NVIDIA License System,NVIDIA许可系统)为NVIDIA开发的一个新系统,将取代即将停用的旧版NVIDIA vGPU License服务器,为NVIDIA企业软件产品(包括NVIDIA vGPU 软件)提供License。与之前的的NVIDIA vGPU软件License服务器一样,它提供从NVIDIA许可门户获得的License。
其中需要一个服务实例来为客户端提供License,NLS支持DLS和CLS两种服务实例。
· DLS(Delegated License Service)服务实例:DLS服务实例托管在本地,位于可以从专用网络访问的位置。使用时,DLS服务实例与NVIDIA许可门户完全断开连接,虚拟机可以从本地获取License。
图11-7 DLS认证
· CLS(Cloud License Service)服务实例:CLS服务实例托管在NVIDIA许可门户上。虚拟机通过从NVIDIA License System服务实例获取License。服务实例通过网络从NVIDIA许可门户获得License。当虚拟机关闭时,License将返回给服务实例。
图11-8 CLS认证
NVIDIA Tesla GPU提供以下的NVIDIA GRID授权产品:
· 虚拟工作站(Virtual Workstation)
· 虚拟PC(Virtual PC)
· 虚拟应用程序(Virtual Application)
GRID License类型如下表所示:
表11-26 GRID License类型
GRID License类型 |
GRID功能 |
支持的vGPU类型 |
GRID Virtual Application |
PC级应用程序 |
A系列vGPU |
GRID Virtual PC |
面向Windows、Web浏览器和高清视频应用的业务虚拟桌面 |
B系列vGPU |
GRID Virtual Workstation |
针对需要访问远程专业图形应用程序的中端和高端工作站用户 采用GPU直通的工作站图形计算 |
Q系列、B系列的vGPU |
CUDA支持和vGPU版本有关,支持情况如下:
表11-27 GRID License类型
CUDA Toolkit Version |
vGPU Software Releases |
CUDA 11.4 Update 2 (11.4.2) |
|
CUDA 11.4 Update 1 (11.4.1) |
|
CUDA 11.4 |
|
CUDA 11.3 Update 1 (11.3.1) |
Not supported |
CUDA 11.3 |
Not supported |
CUDA 11.2 Update 1 (11.2.1) |
Not supported |
CUDA 11.2 |
|
CUDA 11.1 Update 1 (11.1.1) |
Not supported |
CUDA 11.1 |
Not supported |
CUDA 11.0 |
|
CUDA 10.2 |
|
CUDA 10.1 Update 2 (10.1.243) |
Not supported |
CUDA 10.1 Update 1 |
|
CUDA 10.1 general release (10.1.105) |
|
CUDA 10.0.130 |
|
CUDA 9.2 (9.2.148 Update 1) |
Not supported |
CUDA 9.2 (9.2.88) |
Not supported |
CUDA 9.1 (9.1.85) |
|
CUDA 9.0 (9.0.176) |
表11-28 vGPU软件适配表
适配软件 |
win7 32 |
win7 64 |
win10 32 |
win10 64 |
是否支持 硬件解码 |
操作系统最低配置 |
推荐配置 |
3D MAX 2010(32) |
支持 |
|
支持 |
|
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
3D MAX 2013(32) |
支持 |
|
支持 |
|
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
3D MAX 2014(64) |
|
支持 |
|
支持(由于操作系统自身的原因需要联网才能安装) |
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
3D MAX 2017(64) |
|
支持 |
|
支持 |
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
AutoCAD 2010(32) |
支持 |
|
支持 |
|
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
AutoCAD 2010(64) |
|
支持 |
|
支持 |
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
AutoCAD 2014(32) |
支持 |
|
支持 |
|
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
AutoCAD 2014(64) |
|
支持 |
|
支持 |
— |
2核3GB(使用最低配置时不建议与其他软件并行使用) |
4核4GB |
暴风影音5.6 |
支持 |
支持 |
支持 |
支持 |
是 |
1核2GB(使用最低配置时不建议跟其他软件并行使用) |
配置无要求,越高越好 |
QQ视频3.9 |
支持 |
支持 |
支持 |
支持 |
是 |
1核3GB(使用最低配置时不建议跟其他软件并行使用) |
配置无要求,越高越好 |