最近在用Python作中文天然语言处理。使用的IDE是PyCharm。PyCharm确实是Python开发之首选,但用于科学计算方面,还略有欠缺。为此我尝试过Enthought Canopy,但Canopy感受把问题搞得复杂化,管理Python扩展也不太方便。直到今天我发现了Anaconda。
Anaconda是一个和Canopy相似的科学计算环境,但用起来更加方便。自带的包管理器conda也很强大。
首先是下载安装。Anaconda提供了Python2.7和Python3.4两个版本,同时若是须要其余版本,还能够经过conda来建立。安装完成后能够看到,Anaconda提供了Spyder,IPython和一个命令行。下面来看一下conda。
输入conda list
来看一下全部安装时自带的Python扩展。粗略看了一下,其中包括了经常使用的 Numpy
,Scipy
,matplotlib
和networkx
等,以及beautiful-soup
,requests
,flask
,tornado
等网络相关的扩展。
奇怪的是,里边居然没有sklearn
,因此首先装一下它。python
conda install scikit-learn
若是须要指定版本,也能够直接用[package-name]=x.x
来指定。
conda的repo中的扩展不算太新,若是想要更新的,可能要用PyPI或者本身下载源码。而conda和pip关联的很好。使用pip安装的东西可使用conda来管理,这点要比Canopy好。下图是我用pip安装的nltk
,jieba
和gensim
。flask
我对这个科学计算环境的另外一个要求就是可以多个Python版本并存,尤为是2.x和3.x的并存。这个经过virtualenv
能够作到。Anaconda也正是经过其实现的。
下面用conda建立一个名叫python2的版本为python2.7的环境。segmentfault
conda create -n python2 python=2.7
这样就会在Anaconda安装目录下的envs目录下建立python2这个目录。
向其中安装扩展能够:网络
conda install
并用-n
指明安装到的环境,这里天然就是python2
。virtualenv
那样,先activate,而后在虚拟环境中安装。这里忽然有一个问题,怎样在IDE中使用建立出来的环境?若是是PyCharm等IDE,直接设置Python安装目录就能够了。那spyder呢?其实spyder就是一个Python的扩展,你须要在虚拟环境中也装一个spyder。
最后就是spyder的主界面。变量查看窗口很好用。python2.7