不少朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。html
python有2.x和3.x的版本之分,可是不少好的机器学习python库都不支持3.x,所以,推荐安装2.7版本的python。当前最新的python是2.7.12.连接以下:python
https://www.python.org/downloads/release/python-2712/json
里面能够看到有32位版和64位版的。若是你的机器是64位版的,那么32位和64位版的任选一个安装就能够了。若是机器是32位版的,就只能安装32位版的了。若是你搞不清楚你的机器的位数,那么就安装32位版的吧。也就是“Windows x86 MSI installer”。windows
Windows x86-64 MSI installer | Windows | for AMD64/EM64T/x64, not Itanium processors | 8fa13925db87638aa472a3e794ca4ee3 | 19820544 | SIG |
Windows x86 MSI installer | Windows | fe0ef5b8fd02722f32f7284324934f9d | 18907136 | SIG |
安装完毕后,能够设置下环境变量,把python目录加到PATH,好比个人Python装在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到环境变量。固然不加也能够。这样每次使用Python时加上python的全路径名。浏览器
安装完成后,在windows的命令行输入python,若是能出来python的基本信息说明安装成功。机器学习
咱们须要包管理工具来方便python库的安装,包管理工具备不少,这里推荐我习惯使用的pip。工具
下载pip的安装脚本。连接以下。下载get-pip.py。而后到你的下载目录,在命令行输入"python get-pip.py",跑完便可安装成功。学习
https://pip.pypa.io/en/stable/installing/spa
下载完毕后,记得跑下这个命令“pip install -U pip”,一是看看pip能不能正常工做,二是把pip升级到最新版本。命令行
连接在这: https://www.microsoft.com/en-us/download/details.aspx?id=44266
这个不装后面不少科学计算的都会装不了。
这两哥们是科学计算和矩阵运算必备工具。
因为numpy和scipy直接用pip安装常常会出各类各样的问题,所以通常推荐下载离线版的whl来安装numpy和scipy。
首先安装离线版的numpy,这里我通常是在下面的连接下载numpy,固然scipy也是在这。
http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy
能够看到里面有不少版本的numpy能够下载,咱们的python是2.7,windows 32位的,所以下载“numpy-1.11.2+mkl-cp27-cp27m-win32.whl”
下载完毕后进入下载目录,在命令行运行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,这样numpy就安装成功了。
用一样的方法安装scipy。在下面的连接下载scipy。
http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
咱们的python是2.7,windows 32位的,所以选择scipy-0.18.1-cp27-cp27m-win32.whl下载。
完了运行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"
这样numpy和scipy两个好基友就搞定了。
这没有什么好说的,直接在命令行运行下面的命令便可。注意,先安装matplotlib再安装pandas
pip install -U matplotlib
pip install -U jinja2
pip install -U jsonschema
pip install -U pyzmq
pip install -U pandas
pip install -U scikit-learn
ipython notebook是最经常使用的python交互式学习工具,固然,如今叫作Jupyter Notebook。scikit-learn官方的例子都给出了用ipython notebook运行的版本。
安装方式很简单:
pip install ipython
pip install jupyter
官网在这:http://ipython.org/notebook.html
安装完毕后,在命令行输入“jupyter-notebook”,输出会提示你notebook运行在http://localhost:8888
在scikit-learn官网下载一个机器学习的例子,好比: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb
而后在下载目录运行"jupyter notebook",接着浏览器打开http://localhost:8888
。
能够在浏览器看到你下载目录的内容,咱们打开刚下载的plot_cv_predict.ipynb这个文件连接,能够看到python程序的内容,这时咱们能够点上面的三角形按钮,一步步的运行程序,若是没有报错,最后能够看到一个线性回归的预测图。
能够修改这个程序,从新一步步的跑,达到研究学习的目的。
以上就是scikit-learn和pandas环境的搭建过程。但愿你们均可以搭建成功,来研究机器学习。
(欢迎转载,转载请注明出处。欢迎沟通交流: liujianping-ok@163.com)