数据挖掘之自然语言处理

NLTK是python上著名的自然语言处理库,自带语料库、词性分类库、自带分类、分词等等功能。 安装语料库import nlk   nlk.download() 文本处理流程 最后从文本转换为一组数字,这些数字就隐含了文本的意义。 stopwords:对于注重理解文本意思的应用场景来说歧义太多,所以要去掉。 NLTK在NLP上的经典应用有情感分析、文本相似度、文本分类。
相关文章
相关标签/搜索