1、版本信息测试
solr版本:4.6.0google
须要ik-analyzer版本:IK Analyzer 2012FF_hf1spa
ik-analyzer下载地址:http://code.google.com/p/ik-analyzer/downloads/listcode
2、配置步骤xml
下载压缩解压后获得以下目录结构的文件夹:blog
咱们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。token
咱们把IKAnalyzer.cfg.xml、stopword.dic拷贝到须要使用分词器的core的conf下面,和core的schema.xml文件一个目录。ci
修改core的schema.xml,在<types></types>配置项间加一段以下配置:rem
<!-- IKAnalyzer -->get
<fieldType name="cn_ik" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.solr.SolrIKAnalyzer" useSmart="true"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.solr.SolrIKAnalyzer" useSmart="true"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
咱们就多了一种cn_ik的field类型了,该类型使用的分词器就是ik-analyzer。
咱们在这个core的schema.xml里面配置field类型的时候就能够使用cn_ik了。
<field name="cn_ik" type="cn_ik" indexed="true" stored="true"/>
3、中文分词测试
结果以下:
IKT |
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
LCF |
|
|
|
|
|