中文词频统计及词云制作

2.中文分词 下载一中文长篇小说,并转换成UTF-8编码。 使用jieba库,进行中文词频统计,输出TOP20的词及出现次数。 **排除一些无意义词、合并同一词。 **使用wordcloud库绘制一个词云。 import jieba txt = open('汉魏文魁.txt',"r",encoding='utf-8').read() ex = {'自己','可是','不是','他们','还是',
相关文章
相关标签/搜索