以前下载过一个PDF,书名是《用python进行天然语言处理》,挺有意思的,加上NLP和机器学习目前大热,想趁着暑假涉猎一下。因而开始了入门NLP之旅。python
安装环境:Ubuntu14.04桌面版,python版本:2.7bash
第一步:安装nltk,首先要安装pip工具:sudo apt-get install python-pip,安装完成后用pip安装nltk:sudo pip install python-nltk。机器学习
第二步:下载nltk全部的包,在终端中进入python的交互模式,工具
>>> import nltk >>> nltk.download() >>> d >>> all
接着就等吧,包很大,我断断续续下了两三天才下完。学习
第三步,安装numpy和matplotlib工具,主要是用来数据分析和图形化显示。下面是引用别人的一部分:spa
$ sudo apt-get install python-numpy $ sudo apt-get install python-scipy
$ sudo apt-get install libpng-dev
$ cd ~/Downloads $ wget http://download.savannah.gnu.org/releases/freetype/freetype-2.4.10.tar.gz $ tar zxvf freetype-2.4.10.tar.gz $ cd freetype-2.4.10/ $ ./congfigure $ make $ sudo make install
$ sudo pip search matplotlib
$ sudo pip install matplotlib