在solr中加入本身的扩展分词库方法:html
参考文章:java
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html web
一、在solr的web中:\WEB-INF目录下新增一个文件夹:classes测试
二、新增一个文件:IKAnalyzer.cfg.xmlspa
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户能够在这里配置本身的扩展字典--> <entry key="ext_dict">my.dic;</entry> <!--用户能够在这里配置本身的扩展中止词字典--> <entry key="ext_stopwords">stopword.dic;</entry> </properties>
说明:code
my.dic即为扩展分词库,分词库能够为多个,以分号隔开便可。中止词库同样。xml
三、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:htm
西丽
四、保存,重启solr。blog
使用了新的分词,须要从新建索引数据。索引
五、测试: