一个简单的词频分析统计程序

        花了点时间作了一个词频分析统计程序,分析了《失控》英文版(out_of_control)——Kevin_Kelly 的词频。要想流利的阅读英语文章,词汇量应该达到2万左右。java 从词频分析来看,只在文章中出现一次或两次的单词占了一半以上,是长尾理论的具体体现(举例来讲,咱们经常使用的汉字实际上很少,但因出现频次高,因此这些为数很少的汉字占据了右图广大的红区;绝大部分的汉字可贵一
相关文章
相关标签/搜索