ubuntu14.04下的NVIDIA Tesla K80显卡驱动的安装教程

  搞深度学习如何可以不与浑身是“核”的显卡打交道呢?linux

  人工智能的兴起除了数据量的大量提高,算法的不断改进,计算能力的逐步提升,还离不开软件基础设施的逐步完善。当下的主流的深度学习工具软件不管是Caffe仍是Theano或者是Tensorflow所有都离不开GPU显卡加速技术的支持。当下的基于GPU加速的主流的深度学习环境就是linux下的cuda。做为NVIDIA目前辅科学计算加速的性能优良的产品,Tesla K80当仁不让地成为了理想对象。但是因为linux开源的特性,nouveau成为Ubuntu等一系列的linux操做系统中的默认NVIDIA显卡驱动程序。然而做为NVIDIA这样高冷的公司,集市式的产品是不被承认的。因而为了保障本身的显卡的性能,NVIDIA显卡自带了驱动,可就是这个根正苗红的驱动和草根版的驱动之间居然存在着不可和解的冲突。所以想要使用Ubuntu操做系统来带动K80仍是要费一些周折的,但是问题的核心就在于解决两个阶级的驱动之间的对立关系,方法很简单,革掉一个就行了嘛。下面来介绍一下具体的操做步骤。算法

  一、安装ubuntu14.04(具体的操做方式就很少说了,可是要强调一点的是DELL的我的pc在安装Ubuntu的时候可能常常有图形界面不可用的状况,估计也是驱动之间不兼容的问题,若是没有独立显卡的话仍是不要折腾了。所幸的是本次搭建的环境是PowerEdgeC4230这个DELL的服务器,因此装一个gnome仍是没有啥大问题的)ubuntu

  二、因为是驱动的冲突,那么天然是要杀掉和显卡结合不是那么紧密的草根板驱动nouveau了,加入黑名单使咱们要作的第一件事:服务器

    2.1在/etc/modprobe.d/文件夹下建立blacklist-nouveau.conf文件编辑器

    2.2使用vi便捷新建立的文件在文件中写入:ide

      blacklist nouveau工具

      options nouveau modeset=0性能

    保存文件(最好使用vi编辑器,尽可能不要使用nano这种不太主流的编辑器,以前安装失败了也许就是由于使用了nano编辑的缘故)学习

    2.3输入update initramfs -u命令获得更新的blacklist人工智能

    2.4输入reboot命令重启系统,强力保证blacklist生效。

    2.5输入lsmod | grep nouveau查看是否vouveau真的被干掉了,若是没有任何内容出现,那么恭喜你,成功除掉了草民版驱动。

  三、下载NVIDIA官方的K80显卡驱动,咱们这里用的是361版本的。将驱动文件移动至/root/文件夹下。

  四、若是文件是压缩文件,则键入解压缩命令进行解压缩,获得.run文件

  五、接下来是关键的步骤,也是困扰咱们一天一晚上的问题所在,键入以下命令:

    ./XXX-NVIDIA.run --no-opengl-files   (重要的事情说三遍,这里面的-和字母之间没有空格、这里面的-和字母之间没有空格、这里面的‘-’和字母之间没有空格)

  六、出现蓝色的背景界面,若是出现了(X server is running的现象,要注意用户态输入sudo service lightdm stop关闭桌面管理器 ),而后accept协议,接着出现the distribution provided pre-install scripts failed的提示,忽视它,而后继续安装下去,一路OK而后reboot系统,最终获得完整的gnome桌面系统。

  七、检验是否安装成功,在命令行界面下输入 nvidia-smi检验是否安装成功,若是成功会出现以下图所示的状况

显示的K80分配状况

相关文章
相关标签/搜索