8种Python文本处理工具集

文本处理一般包括词性标注,句法分析,关键词提取,文本分类,情感分析等等,这是针对中文的,如果是对于英文来说,只需要基本的tokenize。本文为大家提供了以下这些工具包。 1.Jieba 【结巴中文分词】做最好的 Python 中文分词组件 其功能包括支持三种分词模式(精确模式、全模式、搜索引擎模式),支持繁体分词,支持自定义词典等。 代码主页:https://github.com/fxsjy/j
相关文章
相关标签/搜索