Solr(3.中文分词器)

lucence有很多优秀的分词器,但是由于lucene是外国人开发的,所以分词器相应的也是对英文更加友好,虽然随着lucence版本的跟进,中文分词有一定的优化,可还是很难做到中国人的习惯。 IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的。 但是IK分词器从2012年就停止更新了,为了支持最新版的solr,对IK的源码进行了稍许
相关文章
相关标签/搜索