python数据分析(分析文本数据和社交媒体)

一、安装NLTK pip install nltk 至此,咱们的安装还未完成,还须要下载NLTK语料库,下载量很是大,大约有1.8GB。能够直接运行代码下载、代码以下:html import nltk nltk.download()这样能够直接下载NLTK语料库了。 二、滤除停用词、姓名和数字 进行文本分析时,咱们常常须要对停用词(Stopwords)进行剔除,这里所谓停用词就是那些很是常见,但没
相关文章
相关标签/搜索