solr配置IK分词

IK Analyzer分词器java

这个其实比较好配,奈何资源很差找,并且用solr搜中文通常都用这个我把分词器打了个包放在下面了。里面没有字典,但愿哪位又好用的互通下有无。web

http://pan.baidu.com/s/1pLjE2Tltomcat

假设solr部署在tomcat上,位置webapp\solrapp

一、IKAnalyzer2012FF_u1.jar 放在solr\WEB-INF\libwebapp

二、IKAnalyzer.cfg.xml和stopword.dic 放在solr\WEB-INF\classescode

IKAnalyzer.cfg.xmlxml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
	<comment>IK Analyzer 扩展配置</comment>
	<!--用户能够在这里配置本身的扩展字典 
	<entry key="ext_dict">ext.dic;</entry> 
	-->
	<!--用户能够在这里配置本身的扩展中止词字典-->
	<entry key="ext_stopwords">stopword.dic;</entry> 
	<!--放一些其余好用的字典-->
</properties>

三、找到solr数据文件夹 我这里是/media/data/solr 在文件夹里面找到你的collection的目录 个人叫test,也就是这个地址/media/data/solr/test这个目录下有个文件是managed-schema(老版本solr是schema)在里面加入ik配置资源

<fieldType name="text_ik" class="solr.TextField">
		<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
		<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	</fieldType>

	<field name="ik" type="text_ik" indexed="true" stored="true" multiValued="false" />

须要中文分词的字段配置部署

<field name="title" type="text_ik" indexed="true" stored="true" multiValued="false"/>

配置完了get

相关文章
相关标签/搜索