最近工做转型到数据开发领域,想在本地搭建一个数据开发环境。本身有三年python开发经验,立刻想到使用numpy、scipy、sklearn、pandas搭建一套数据开发环境。python
ubuntu的环境,百度中文章比较多,搭建起来很是顺利。MAC环境的资料比较少,百度出来的,已经不对了,那我就来补充一篇吧。git
MAC自带python,python的安装我就很少说了。github
我喜欢用pip安装python库,很是方便,pip的安装只能用源码了。
系统自带easy_install,轻松安装pipubuntu
$ sudo easy_install -g pip
另外一种方法,从源代码安装curl
#下载源代码 https://pypi.python.org/pypi/pip 我去下载的时候是 8.0.2版本 #解压 tar xvzf pip8.0.2.tar.gz #安装 cd pip-1.4.1 python setup.py install
numpy是基础,是scipy等其它库等基础,没什么依赖,安装起来相对简单。工具
pip install numpy
numpy安装以后,就是安装scipy了,为何插了一竿子呢?它依赖fortran库,fortran库的安装须要用到MAC的包管理工具homebrewurl
#下载brew curl -LsSf http://github.com/mxcl/homebrew/tarball/master sudo tar xvz -C/usr/local --strip 1
scipy 是sklearn的基础,但它依赖gfortran库,gfortran已经融入到gcc库中,安装gcc就行了,有了brew安装什么包都变得很是简单了。code
#安装gcc库 brew install gcc #安装scipy pip install scipy
后面的安装,就按步就班了homebrew
#安装matplotlib,方便把数据绘图显示出来 pip install matplotlib #安装sklearn,我理解这个安装必须在pandas以前 pip install -U numpy scipy scikit-learn #安装pandas pip install pandas
到这里环境就搭建好了,开搞吧,其实搭起来也很是简单。提醒下,安装时注意权限,若是须要权限就在前面加个sudo。ip