原文连接 jinkey.ai/post/tech/z…
本文做者 Jinkey(微信公众号 jinkey-love,官网 jinkey.ai)
文章容许非篡改署名转载,删除或修改本段版权信息转载的,视为侵犯知识产权,咱们保留追求您法律责任的权利,特此声明!python
写文章日期 2017年 11月 11日
当前软件版本
NVIDIA-Linux-x86_64-384.81.run
nvidia-diag-driver-local-repo-rhel7-384.81-1.0-1.x86_64.rpm
cuda-repo-rhel7-9.0.176-1.x86_64.rpm
cudnn-9.0-linux-x64-v7
tensorflow_gpu-1.4.0-cp27-none-linux_x86_64.whllinux
登陆控制台,云服务器 - 云主机 - 地区选择“北京” - 新建,土豪能够选择包月哦
json
ssh root@123.123.123.123复制代码
登陆以后,看看输入vim
cat /proc/version复制代码
查看你的 Linux 版本,企鹅云用的是后端
Linux version 3.10.0-693.5.2.el7.x86_64 (builder@kbuilder.dev.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC) ) #1 SMP Fri Oct 20 20:32:50 UTC 2017centos
因此教程的相关依赖我都会下载 Red Hat 版本的
bash
依赖能够直接经过
wget
下载到主机上,也能够先下载到 PC 本地再经过 xftp(Windows)或 Filezilla(Mac)上传。服务器
下载NVIDIA驱动
www.nvidia.com/Download/Fi…微信
这里给出 Red Hat 版本 的下载地址
cn.download.nvidia.com/tesla/384.8…ssh
下载 CUDA
developer.nvidia.com/cuda-downlo…
这里给出 Red Hat 版本 的下载地址
developer.download.nvidia.com/compute/cud…
下载 cuDNN
developer.nvidia.com/rdp/cudnn-d…(须要注册和填写问卷以后下载)
这里给出 通用 Linux 版本 的下载地址
developer.nvidia.com/compute/mac…
方法一(官方推荐方法)
在下载页面就有安装方法介绍,不一样版本系统安装方法不一样
# 请替换文件名为你下载依赖时对应的文件名, 公众号 jinkey-love
rpm -i nvidia-diag-driver-local-repo-rhel7-384.81-1.0-1.x86_64.rpm
yum clean all
yum install cuda-drivers
reboot复制代码
方法二(极限偷懒版)
# 安装 Development Tools 软件包
sudo yum update
sudo yum group install 'Development Tools'
# 安装 elrepo 源
sudo rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
sudo rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
# 探测要安装的包
sudo yum install nvidia-detect
nvidia-detect
# 安装
sudo yum install kmod-nvidia复制代码
在下载页面就有安装方法介绍,不一样版本系统安装方法不一样,下面是以 RH 为例:
# 请替换文件名为你下载依赖时对应的文件名, 公众号 jinkey-love
sudo rpm -i cuda-repo-rhel7-9.0.176-1.x86_64.rpm
sudo yum clean all
sudo yum install cuda复制代码
添加 CUDA 到环境变量
vim ~/.bash_profile复制代码
加入
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME=/usr/local/cuda
由于写教程的时候 tensorflow 1.4.0 要支持 CUDA 9.0 的话,还须要从源码编译来安装,因此为了不经过 pip 安装会出现 ImportError: libcublas.so.8.0: cannot open shared object file: No such file or directory
的错误,能够先使用 CUDA8.0(安装 CUDA 9.0 的时候也会同时安装上8.0 的,因此你不须要从新安装),此时环境变量能够这么写:
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64"
export CUDA_HOME=/usr/local/cuda-8.0
# 请替换文件名为你下载依赖时对应的文件名, 公众号 jinkey-love
tar -xzvf cudnn-9.0-linux-x64-v7-tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h复制代码
企鹅云自带了 python 2.7
# 安装 pip
sudo yum install python-pip python-devel
sudo pip install --upgrade pip复制代码
方法一 源码编译(要使用 CUDA9.0目前之能支持这种方法)
方法二 pip
pip install tensorflow-gpu --upgrade
sudo yum install freetype-devel
# 公众号 jinkey-love,官网 jinkey.ai
sudo yum install libpng-devel
sudo pip install matplotlib复制代码
Keras 封装了 Theano 和 Tensorflow 的高度模块化的深度学习库,很是适合新手。
sudo pip install keras --upgrade复制代码
Keras 默认后端为 Theano 因此咱们要修改成 Tensorflow
vim .keras/keras.json复制代码
修改成
{
"image_dim_ordering": "tf",
"epsilon": 1e-07,
"floatx": "float32",
"backend": "tensorflow"
}复制代码
实战了一下,一样的项目下,GPU 训练速度比 CPU 训练快了 187 倍。若是你以为教程有用,能够微信打赏我哦