自然语言处理 | (4)英文文本处理与NLTK

本篇博客我们将介绍使用NLTK对英文文本进行一些基本处理,之后我们还会学习一些更高级的模型或方法,不过这些基本处理要熟练掌握,因为他们可以对我们的数据进行一些预处理,作为更高级模型或工具的输入。 目录 1.NLTK简介 2.英文Tokenization(标记化/分词) 3.停用词 4.词性标注 5.chunking/组块分析 6.命名实体识别 7.Stemming和Lemmatizing 8.Wo
相关文章
相关标签/搜索