Solr5.4.0+Tomcat+mmseg4j

solr5.4    mmseg4j-solr-2.3.0    mmseg4j-core-1.10.0html

Solr的配置:java

一、去http://www.apache.org/dyn/closer.lua/lucene/solr/5.4.0下载 solr-5.4.0.tgz,并解压;web

二、将/solr/solr-5.4.0/server/solr-webapp/下的webapp文件夹复制到/usr/local/tomcat/tomcat-8.0.30/webapps/目录下,更名为solr;apache

三、将/usr/local/solr/solr-5.4.0/server/lib/ext/目录下的全部jar包复制到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/目录下;tomcat

四、将/usr/local/solr/solr-5.4.0/server/solr目录复制到/usr/local/tomcat/并重命名为solr_home;(存放检索数据的)app

五、修改/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/web.xml,找到<env-entry>节点,该结点处于被注释状态,去掉注释,按以下代码修改:webapp

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>/usr/local/tomcat/solr_home</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

六、将/usr/local/solr/solr-5.4.0/server/resources/目录下的log4j.properties放到/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/classes/目录下,若是classes文件夹不存在就手动新建一个;lua

七、还须要添加solr-dataimporthandler-5.3.0.jar和solr-dataimporthandler-extras-5.3.0.jar这2个jar包到目录/usr/local/tomcat/tomcat-8.0.30/webapps/solr/WEB-INF/lib/下,不然会报错,这2个包默认不在webapp里,在下载包的dist目录下;spa

八、从新启动Tomcat服务;.net

九、访问:localhsot:8080/solr/index.html 能够看到Solr的控制台;

十、添加mysolr

在/usr/local/tomcat/solr_home/目录下建立mysolr(可自定义),在mysolr目录下建立data目录,
并将 /usr/local/tomcat/solr_home/configsets/basic_configs/目录下的conf目录复制到mysolr下;

在mysolr目录中新建core.properties内容为name=mysolr   (solr中的mysolr应用)

经过控制台添加mysolr,并从新启动Tomcat,就会看到新建的mysolr.

2、配置中文分词器(mmseg4j)

mmseg4j-solr-2.3.0

1.将两个jar包考入tomcat中solr项目里的lib文件内

 
2.配置solr_home中mysolr\conf\schema.xml     
    添加:       

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> 
      <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
      </analyzer> 
 </fieldtype> 
 
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> 
     </analyzer> 
</fieldtype> 
 
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> 
     <analyzer> 
         <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple"                                 dicPath="n:/custom/path/to/my_dic" /> 
     </analyzer> 
</fieldtype>

修改solr_home中mysolr域的schema.xml,新增要用到mmseg4j分词索引的字段 content_test  分词器选择定义好的textMaxWord

<field name="content_test" type="textMaxWord" indexed="true" stored="true" multiValued="true"/> 

重启tomcat。 

已配好的tomcat连接:http://pan.baidu.com/s/1gf9HHoJ 密码:sn6p

相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息