Python3下的NLTK及nltk_data安装问题(Ubuntu环境)

在使用Python强大的第三方库nltk进行一些天然语言处理工做的时候遇到了一些困难,折腾一番总算解决。如今在这里记录一下,看成备忘。git

 

 

 

网上找到挺多安装nltk的教程,但经测试,好像都是适用于Python2的,对于Python3,就勉为其难了。这里的主要问题是,前辈们分享的nltk_data包是不兼容Python3的。github

 

 

 

因此个人解决方案是:工具

 

到https://github.com/nltk/nltk_data下载gh-pages分支,里面的Packages就是咱们要的资源。(注:截至2016年3月24日时本方案仍有效)测试

 

 

 

详细状况记录以下:教程

 

1.安装nltk。截至今天,安装的是nltk3.2,在有pip这些工具的状况下,安装这些库变得很是简单:ip

 

pip install nltk资源

 

另外官方的安装说明还附带了numpy,一个“赛Matlab的Python开源的数值计算扩展库”,说不定之后用得上:it

 

pip install numpypip

相关文章
相关标签/搜索