python文本分析--停用词表的使用

之前听说停用词表,没有上手使用过,真正操作的时候发现有很多东西没有学透彻。这里总结一下,去停用词的思想:在原始文本集中去掉不需要的词汇,字符。虽然有通用的停用词表,但是如果想提高后续的分词效果,还是自己建立停用表比较好。 建立停用词表,实际上就是在txt中,输入想要删除的词汇,每个词汇用空格隔开即可。可以换行。 下面是我自己操作的效果图,及代码。方便自己及大家查看。 # 停用词表 [] 停用词
相关文章
相关标签/搜索