【中文分词】使用IKAnalyzer分词统计词频

一.引入jar包: 二.在src目录下配置IKAnalyzer.cfg.xml 有需要可以自己扩展词汇与停止词 三.根据分词统计词频: 1.传入参数进行分词,并统计每个词的频率。代码如下: 2.按词频高低排序,代码如下: 3.整理简单工具类,代码如下: 其中IKSegmenter是分词的主要类,构造函数ture代表只能分词,改成false则为最细粒度分词
相关文章
相关标签/搜索