基于Python结巴分词(调用自定义词库已经去除停用词)

# -*- coding: utf-8 -*- import time import jieba import jieba.posseg as pseg#用于词性标注 #分词 #停用词过滤 def stop_word(fid1,fid2,fid3): stopword=[] for j in fid2.readlines(): stopword.append(j.s
相关文章
相关标签/搜索