基于python的中文词频分析

受http://yixuan.cos.name/cn/2011/03/text-mining-of-song-poems/这篇文章的启发,以为PYTHON来作文字处理分析应该不错,能够来作个词频分析,分析聊天记录能够看出每一个人的说话习惯python 用的是暴力方法 不用语义分析 直接列出全部出现的字词 正则表达式 作下来以为难点就在中文编码这部分 python下中文涉及的编码转化确实要琢磨一番算
相关文章
相关标签/搜索