Python天然语言处理(1):初识NLPhtml
天然语言处理(Natural Language Processing,NLP):计算机科学领域和人工智能领域中的一个重要方向。它研究实现人与计算机之间用天然语言进行有效通讯的各类理论和方法,涉及全部用计算机对天然语言进行的操做。网络
NLP的技术应用日益普遍。例如:收集和手持电脑对输入法联想提示和手写识别的支持;网络搜索引擎可以搜索到非结构化文本中的信息;机器翻译能把中文文本翻译成西班牙文。经过提供更天然的人机界面和获取存储信息的高级手段,语言处理正在这个多语种的信息社会中扮演着更核心的角色。工具
Python的安装学习
以前介绍过安装步骤,这里先略过。详情戳这里:Python学习总结之一--基础篇搜索引擎
NLTK的安装人工智能
NLTK:Natural Language Toolkit(天然语言工具包)。咱们能够从http://www.nltk.org上免费下载符合本身操做系统的版本。下载完成后,跟着步骤直接安装 。spa
Python版本要求
操作系统
而后咱们在Python解释器里输入代码,下载咱们后面学习时须要的数据。翻译
首先,咱们输入import nltk成功时就说明咱们的nltk安装成功。可是很遗憾,这TM是个问题啊,本身下午搞了好久,下载了好几回都没有成功,我也不知道是怎么回事,网上查找到了一些资源,你们能够在这个博客里找到下载数据的地方。而后自行解压corpora文件里的压缩文件便可。htm
当你输入代码能够出现上图所示的text1到text9内容的时候,说明你的nltk_data下载成功。