买了一本电子书,《机器学习实战》by Peter Harrington。顺便开始从新学Python。以前学过一次是在11年左右,学完R以后看到Python的机器学习工具,以为有意思就上手过一阵,不过接下来立刻就投入到了无休无止的Web应用开发之中,Python就算是彻底丢下了。如今只有从头开始。 好了回归正题。最近看了不少资料,机器学习如今貌似除了R就是Python。而R从理论上来讲不能算做一门完整的编程语言(官网的定义是R is a free software environment for statistical computing and graphics.),因此就仍是学Python吧。 上面所说教材就是基于Python的,还有numpy和matplotlib工具。 先说安装。我今天不想动VMWare因此是在个人Windows环境下装的。其实也能够装到VMWare里面,可是个人笔记本跑不动虚拟机。Python有个好处就是跨平台都能用,这一点要充分利用。 Python安装很简单,就很少写了。不过有一点须要注意,在装numpy的时候出现了注册表找不到Python的状况,后来看了一下这也是一个坑,解决的方法是安装Python的时候不要对全部用户安装,只能对当前用户安装(安装包运行以后第一个选择)。我也不知道为何可是必须这样装以后注册表才没有问题。固然能够手动改注册表,不过……不管如何都麻烦死了,因此就这样吧。 装完若是在Windows环境须要cmd直接运行的话要加一下系统环境变量,在计算机->属性->高级系统设置->环境变量里的PATH里面加入Python安装目录(若是不知道怎么弄请百度“Python系统变量”,不少教程我就不贴图了)。记得也要把Python目录里的Script目录也加进去,这样就能够直接用pip了。这个很方便。 而后后面的安装就有大坑了。我装了一整晚才搞定,填了好几个坑。这件事情是这样的:若是要是64位的系统,那么全部三大件(Python、numpy、matplotlib)都须要装64位的。而Python和matplotlib官方有64位包,直接安装就行带setup程序的。可是numpy官方(就是SourceForge项目里面)只有32位的安装包。因此常常会一不当心(我就是这样)装了32位的numpy,而后到装matplotlib的时候就装不下去了。 解决方案也很简单,下64位的numpy。刚刚说了官方没有,要去这个非官方站点下http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy 。而后听说这个站点之前是有exe安装包的,可是如今没有了,只能下载一种whl格式的文件(64位系统下那个amd64的就OK,注意匹配Python的版本cp2.7/cp3.3/cp3.4),而后解压到某个目录,cd过去而后pip install ****.whl就OK了。注意pip好像会卡命名规范,因此whl文件的文件名不要随便改。 若是正确装好numpy以后装matplotlib会很简单,可是要用的时候,就是import matplotlib的时候通常都会报依赖错误,就是会须要其余第三方包。反正缺啥就装啥,装的方法最简单的是直接pip install,好比我第一个报的是缺pyparsing,这个直接pip install pyparsing就能够。而后可能有一些pip找不到,好比我这里的dateutil,这个就去官方pypi站下一下,而后python setup.py install装上就OK了。不算特别难,也没有什么秘籍攻略须要记。 整整花了一夜才弄好了……总结下来才发现原来用Windows跑Python+numpy+matplotlib是一个大坑,特别是64位系统。简直是充满了对64位windows满满的恶意。必定要注意几点:python