踩坑记:Tensorflow环境搭建

  自从上一篇论文投出去,以后就各类事就来了……处理那些乱七八糟的事就是让人心累,在加上师哥们毕业,能帮个人人愈来愈少了,而要期望你的人呢,愈来愈多。一想到那些用搜索引擎都搜不到资料的人,蓦地想起邓爷爷说的那句“学习计算机要从娃娃抓起……”c++

  上来先吐槽这么几句哈,毕竟憋了快两个星期了,git

  正题,实验室由于实验环境须要上了台搭载1080Ti的机器,简单说几项配置:6核i7CPU,64G内存,256固态+4T机械,1080TI显卡(都说它有8G显存,但实验时发现有10G+的显存)单路,风扇散热,双系统(win10+Ubuntu 16.04)。以前由于论文的事一直拖着没配置环境,上上周五才有时间开始弄这套环境,共在Ubuntu上建了4个新帐户,每次编译TF总是出问题,因此配置了不下20遍吧,中间伴随着下降gcc版本、调整g++版本、下降显卡驱动版本等等闭眼的操做……当和同窗说编译不过期,同窗说一样的教程他那边一次成功,在一次次从新来过的过程找那个整我的的心情是至关低落的,不是不干活,是靠本身经验真的找不到BUG啊,一度开始怀疑本身能力、怀疑人生,还没人讨论一块儿研究这些,内心苦,可是说不出口……github

  当时遇到的困境在于:ubuntu

  一、本地编译TF过程当中,报一大堆警告,就是那种c++代码,可是还一直在编译,直到结束,学习

  二、编译完,安装以后,发现:测试

    ①import tensorflow as tf,直接报错,可能就是缺那个p****的包,记得当时装上也不行,无果……(与编译环境有关)搜索引擎

    ②import成功,终端没反应,以后输入那个helloTF的例子测试,直接报错找不到模块,就这一个问题差很少用了两天时间来修,最终无果……spa

  三、还有那种报找不到lib…….so.5及其5.1的问题,这个问题是由于安装的cuDNN和你编译时候选的版本不同,多是选了6,其实这里网友建议下降到5.1或者5版本,这时候你改成用5.1版本号程序能自动寻路找到已安装的库,.net

  四、有时候本地编译的安装失败后卸载,直接pip安装TensorFlow-gpu,这时候仍是没法import,每次遇到这种状况,心里几乎是崩溃的,blog

  五、最后搭建完,测试代码,虽然能感受到明显的加速,可是运行程序时候通常会显示几条“没编译***的库,可是可以加速你的CPU计算”,而不是那句可爱的“Successfully opened CUDA……”(可能与编译环境有关)

  ……(没错,省略号可能都表示不了我同时打开了近20个终端在操做)

**************************************************************************************************************************************************************************************************************************

  起色出如今删除全部以前的帐户,重建帐户再来一遍时候。此次根本就是死马当活马医了,以为不行就重装个系统试试……

  一、此次从新搭建环境,从新测试了全部环境变量,配置,安装好编译器和Anaconda3(3.5版本)以后按照教程《深度学习主机环境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0》继续搭(zuo),当看到显卡驱动那里,想着本身当时上的是开源最高版本驱动,以为可能有问题,遂下降为专有驱动(一直不降驱动是由于以前同窗说他一直用的官网推的最新驱动)。以后按照教程安装CUDA,测试了两个例子,没问题,这一步一直都能测试成功。

  二、再按照《深度学习主机环境配置: Ubuntu16.04+GeForce GTX 1080+TensorFlow》安装cuDNN并行,这个地方和以前不一样的是,之前一直在用6.0版本,此次下降到5.1,这个安装时候能够看到库的存放位置,不要错,还有权限问题。

  三、剩下的就是平时周围人所说的piip install就能安装的TensorFlow,一直坚持本地编译安装,是由于同窗说本地编译的更好,我信了,而后……就一路坑……索性此次就直接pip安装了,反正再不行就重装系统了,结果……结果就能够了,

  在测试helloTensorFlow时,握着鼠标的手都是在发抖的,成功后接着测试tensor运算,测试mnist的例子,一路无阻,后来还跑了一把生成歌词的例子,几分钟跑完,至此确信基础环境搭建完毕,还想测试强化学习那个小鸟游戏的代码,可是貌似还要OpenCV,就没再折腾,

  若是有人想说要用Python2.7,那么须要你先了解下github上Python 2.7和3.5+版本的程序的占有量,

  若是说还有参考资料的话,那就是一篇《TensorFlow学习一:源码安装》,有详细配置编译细节,

 

  若是最后还要问我有什么想说的:

  看资料是一我的,看论文是一我的,搭环境是一我的,作实验是一我的,Debug是一我的,成功了是一我的,写论文是一我的;再加上实验室+学院的杂事,同窗安慰说“能者多劳”,我头也没抬“多劳得多得啊……”不知道他脸上的表情,

【我能提供的经历就这么多,有问题可继续评论提出,固然有说的不对的地方也欢迎你们提出,立刻改,】

相关文章
相关标签/搜索