智能资源调度是指系统动态地分配集群内的GPU资源。智能资源调度通过业务虚拟机组、业务资源和业务模板实现。当业务虚拟机组中的虚拟机启动或重启时,系统自动根据业务资源中资源的空闲情况、虚拟机应用的业务模板来动态分配GPU资源。
业务虚拟机组:由多个实现同一业务的虚拟机组成。同一业务虚拟机组的虚拟机,可以应用不同的业务模板。
业务模板:定义在资源紧缺时,不同业务组的虚拟机,使用GPU资源的优先级与比例。
业务资源:由集群内的某些GPU资源组成,将被分配给一个业务虚拟机组使用。
智能资源调度适用于需要对系统紧缺资源(目前仅支持GPU和vGPU)按需分配,智能调度的场景。根据业务的重要程度,分配不同的资源保障策略,优先保障重要业务的虚拟机资源供给,满足重要业务SLA(Service Level Agreement,服务级别协议)需求。
新建业务模板:当系统默认业务模板不满足需求时,需新建业务模板。
增加智能资源调度业务:用于将vGPU或GPU资源与虚拟机组相关联。
管理业务模板与调度业务:用于编辑、删除业务模板或智能资源调度业务。
当资源类型为GPU时,请确保主机上已安装并配置好物理GPU设备;当资源类型为vGPU时,还需完成增加vGPU操作,使得GPU设备虚拟化为多个vGPU。
ARM架构主机暂不支持智能资源调度。
应用智能资源调度业务的虚拟机,其镜像文件需存储在共享存储上,且参与智能调度的资源所在的主机都挂在了该共享存储。如果虚拟机的镜像文件不在共享存储上,那么该虚拟机只能使用所在主机的资源。
当资源类型为vGPU时,只能选择同一类型的vGPU资源加入业务资源组。