查看本身操做系统的版本信息:cat /etc/issue
或者是 cat /etc/lsb-release
等命令 html
查看服务器显卡信息:python
lspci | grep -i nvidia
查看所有显卡信息。
nvidia-smi
若是已经安装了对应的显卡驱动的话能够采用这个命令。
cat /proc/driver/nvidia/version
查看安装的显卡的驱动信息。gcc
和g++
是不少驱动安装过程当中须要使用的编译器,不少时候因为编译器版本的不对应会使得安装出现不少莫民奇妙的错误,根据经验,如今的CUDA 10.1
的话,也可使用的是4.8
,所以最好选择4.8-5.4
之间的版本比较好,兼容一点。对于多版本的gcc
和g++
的安装进行详细的讲解:linux
gcc
和g++
版本:gcc --version
以及 g++ --version
sudo add-apt-repository ppa:ubuntu-toolchain-r/test
首先加入一些更新的仓库,以便于更新。sudo apt-get update
以及sudo apt get update
对须要的软件包等进行必要的更新。sudo apt-get install gcc-4.9
以及sudo apt-get install g++-4.9
用于安装对应版本的gcc
以及g++
。注意本身须要的版本本身修改。sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
gcc
和g++
相似于注册的操做加入到bin中,用于可选择操做。也就是说经过这个操做不断向系统注册新的gcc
和g++
版本。update-alternatives --config gcc
update-alternatives --config g++
用于对版本进行选择。进入以后根据提示完成选择便可。若是权限不够加 sudo
。
若是须要安装显卡的话,须要先将旧版本的显卡驱动卸载:
sudo apt-get remove --purge nvidia*
此外,安装以前,须要先禁用一个东西。nouveau。
sudo vim /etc/modprobe.d/blacklist.conf
在文件的最后面加入如下的内容:
ubuntu
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
复制代码
检查操做是否成功:lsmod | grep nouveau
没显示即成功。
vim
显卡驱动的安装比较简单,直接到官网进行对应的驱动的下载。点我下载 bash
sudo ./NVIDIA-Linux-x86_64-430.34.run
采用该命令进行驱动的安装。安装完成以后,能够采用如下命令进行检查:
nvidia-smi
CUDA是GPU进行计算的运算平台,根据须要安装对应版本的cuda。 服务器
cuda
版本,而后在安装
cuda
的时候的版本保持一致,虽然高版本的驱动能够兼容低版本的
cuda
。
sudo sh cuda_10.0.130_410.48_linux.run
安装方式能够百度一哈。 /usr/local/
下面创建一个软链接cuda
该软链接链接到安装的真正的cuda-10.0
的地址。软链接的创建能够用于多个版本的cuda的管理。
cuda
是一个软链接,红色的是多个安装好的CUDA
修改软链接就能够修改cuda
的版本。
nvcc -V
对安装进行检查。
若是提示没有找到对应的命令的话,须要进行环境变量的配置。这里咱们按照假设创建的cuda的软链接的方式进行配置:
sudo vim ~/.bashrc
加入如下的内容:测试
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
复制代码
以后再使用nvidia-smi
网站
sudo rm -rf cuda # 删除旧版本的软链接
sudo ln -s /usr/local/cuda-9.1 /usr/local/cuda # 创建新版本的软链接,前面的路径是须要的版本的cuda的安装路径。
复制代码
cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8
这种也是也是tgz
。将下载来的文件进行解压便可。cp cudnn-10.0-linux-x64-v7.3.0.29.solitairetheme8 cudnn-10.0-linux-x64-v7.3.0.29.tgz # 换后缀
tar -xvf cudnn-8.0-linux-x64-v5.1.tgz # 解压
复制代码
解压以后获得一个 cuda
文件夹。采用以下的操做进行cudnn
的安装。(这时候的cudnn要直接安装到对应的版本的cuda的真实的安装路径中。这样创建软链接的时候才会读到cudnn文件)ui
sudo cp cuda/include/cudnn.h /usr/local/cuda-xx.x/include # 填写对应的版本的cuda路径
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-xx.x/lib64 # 填写对应的版本的cuda路径
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h /usr/local/cuda-xx.xx/lib64/libcudnn*
复制代码
若是喜欢采用deb的安装方式的,参见
以上流程若是走下来仍是出错的话,建议从新卸载显卡驱动再来一次。
采用Anaconda进行python环境的管理是一个很高效的解决方案。从仓库下载对应版本的软件进行安装。点我下载。
bash Anaconda3-5.0.1-Linux-x86_64.sh
安装。安装过程须要赞成将安装路径加入到环境变量的配置文件中。
source ~.bashrc
使其生效。
conda create-n your_name python=your_version
source activate your_name
到pytorch官网下载对应版本的pytorch 便可。官网
python # 进入python 环境
import torch # 导入安装的pytorch包
torch.cuda.is_available() # 检查cuda是否可使用
复制代码
若是torch.cuda.is_available()
若是输出是false,那就表示前面的驱动或者cuda的安装有问题,最可能的就是驱动。直接卸载从新安装显卡驱动便可解决问题。