ESXi专为运行虚拟机、最大限度下降配置要求和简化部署而设计。只需几分钟时间,客户即可完成从安装到运行虚拟机的全过程,特别是在下载并安装预配置虚拟设备的时候。 |
主机系统维护模式设置服务器
esxcli system maintenanceMode set --enable true
将GPU设备设置为vGPU模式测试
esxcli graphics host set --default-type SharedPassthru
返回Default Graphics Type: SharedPassthru设计
esxcli graphics host get
安装VIBblog
安装显卡驱动内存
esxcli software vib install -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib
更新显卡驱动资源
esxcli software vib update -v /tmp/NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib
ESXi主机服务器退出维护模式rem
esxcli system maintenanceMode set --enable false
安装在ESXi主机上的VIB,并确保正确完成了NVIDIA VIB部署
esxcli software vib list | grep -i NVIDIA
驱动检查get
gpuvm vGPU
GPU卡和ESXi是否能够正常工做虚拟机
nvidia-smi
检查是否有vgpu资源
nvidia-smi vgpu –s
查看第三块卡的运行参数
nvidia-smi -i 2 –q
使用vGPU须要关闭ECC
nvidia-smi -i 2 -e 0 nvidia-smi -e 0
如今检查是否已禁用ECC模式
nvidia-smi -q
设置GPU的工做模式,默认VSGA
nvidia-smi -i 2 -vm 3
移除 VIB
esxcli software vib remove --vibname=NVIDIA-vGPU-VMware_ESXi_6.0_Host_Driver esxcli software vib remove --vibname=NVIDIA-VMware_ESXi_6.7_Host_Driver
测试集群虚拟机是否能够添加新PCI设备
咱们能够从上面的VM列表中选择一个示例vGPU配置文件:grid_P100-8q。此配置文件容许VM使用最多8GB的物理GPU内存(总计16GB)。所以,具备此配置文件的主机服务器上的两个单独的虚拟机能够共享同一物理GPU。
经过选择将GPU的所有内存分配给VM的vGPU配置文件,咱们能够将该GPU彻底专用于该VM,例如,对于具备16 GB内存的GPU,使用名为“ grid_p100-16q”的配置文件。
问题分析
DELL服务器BIOS设置I/O参数
ECC设置
英伟达显卡驱动版本不对
解决办法
设置BIOS内存映射I/O库设置为512GB(默认状况下为56TB)
关闭ECC
更换显卡驱动版本