solr5.4 mmseg4j-solr-2.3.0 mmseg4j-core-1.10.0html
Solr的配置:java
一、去http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0下载 solr-5.4.0.tgz,并解压;web
二、将/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夹复制到/usr/local/tomcat/tomcat-8.0.30/webapps/目录下,更名为solr;apache
三、将/usr/local/solr/solr-5.4.0/server/lib/ext/目录下的全部jar包复制到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目录下;tomcat
四、将/usr/local/solr/solr-5.4.0/server/solr目录复制到/usr/local/tomcat/并重命名为solr_home;(存放检索数据的)app
五、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>节点,该结点处于被注释状态,去掉注释,按以下代码修改:webapp
<env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>/usr/local/tomcat/solr_home</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry>
六、将/usr/local/solr/solr-5.4.0/server/resources/目录下的log4j.properties放到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/classes/目录下,若是classes文件夹不存在就手动新建一个;lua
七、还须要添加solr-dataimporthandler-5.3.0.jar和solr-dataimporthandler-extras-5.3.0.jar这2个jar包到目录/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/下,不然会报错,这2个包默认不在webapp里,在下载包的dist目录下;spa
八、从新启动Tomcat服务;.net
九、访问:localhsot:8080/solr/index.html 能够看到Solr的控制台;
十、添加mysolr
在/usr/local/tomcat/solr_home/目录下建立mysolr(可自定义),在mysolr目录下建立data目录,
并将 /usr/local/tomcat/solr_home/configsets/basic_configs/目录下的conf目录复制到mysolr下;
在mysolr目录中新建core.properties内容为name=mysolr (solr中的mysolr应用)
经过控制台添加mysolr,并从新启动Tomcat,就会看到新建的mysolr.
2、配置中文分词器(mmseg4j)
mmseg4j-solr-2.3.0
1.将两个jar包考入tomcat中solr项目里的lib文件内
2.配置solr_home中mysolr\conf\schema.xml
添加:
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldtype> <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> <analyzer> tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> </analyzer> </fieldtype> <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" /> </analyzer> </fieldtype>
修改solr_home中mysolr域的schema.xml,新增要用到mmseg4j分词索引的字段 content_test 分词器选择定义好的textMaxWord
<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/>
重启tomcat。
已配好的tomcat连接:http://pan.baidu.com/s/1gf9HHoJ 密码:sn6p