VMware ESXi 6.5 安装NVIDIA K2 GPU 显卡硬件驱动和配置图文

安装请参考 https://blogs.vmware.com/apps/2018/09/using-gpus-with-virtual-machines-on-vsphere-part-3-installing-the-nvidia-grid-technology.html

GPU兼容性列表查询:https://www.nvidia.com/en-us/data-center/tesla/tesla-qualified-servers-catalog/

 html

在vSphere上使GPU和虚拟机安装NVIDIA GRID技术

主机开启系统维护

esxcli system maintenanceMode set --enable true服务器

(能够自行在网页操做)app

image.png


将GPU设备设置为vGPU模式

esxcli graphics host set --default-type SharedPassthruide

image.png

返回Default Graphics Type: SharedPassthru

esxcli graphics host get

image.png spa

安装VIB

安装显卡驱动
esxcli software vib install -v /NVIDIA/NVIDIA-VMware_ESXi_6.5_Host_Driver_390.42-1OEM.670.0.0.7535516.vib3d

此处的文档路径是在根目录下。

image.png
更新显卡驱动
esxcli software vib update -v /tmp/NVIDIA-VMware_ESXi_6.5_Host_Driver_367.128-1OEM.650.0.0.4598673.vib

 orm

ESXi主机服务器退出维护模式

esxcli system maintenanceMode set --enable falseserver

安装在ESXi主机上的VIB,并确保正确完成了NVIDIA VIB

esxcli software vib list | grep -i NVIDIA


 htm

驱动检查

gpuvm  vGPU

image.png blog

驱动检查2

lspci -n | grep 10de

image.png


其中10de表明此设备来自NVIDIA公司

0300: Graphics — 表明为图形模式

0302: Compute — 则代表为计算模式,须要经过gpumodeswitch修改成图形模式

GPU卡和ESXi是否能够正常工做

nvidia-smi

image.png 

检查是否有vgpu资源

nvidia-smi vgpu –s

image.png

 

部分报错failed to initialize NVML:Unknown Error

问题分析

  1. DELL服务器BIOS设置I/O参数
  2. ECC设置
  3. 英伟达显卡驱动版本不对

 

解决办法

  1. 设置BIOS内存映射I/O库设置为512GB(默认状况下为56TB)
  2. 关闭ECC
  3. 更换显卡驱动版本
相关文章
相关标签/搜索