SolrCloud (jetty) 添加mmseg4j 分词

时间 2019-11-17

标签 solrcloud jetty 添加 mmseg4j mmseg 分词栏目云服务繁體版

原文原文链接

本文环境是创建在solr集群上面的，未搭建环境的小伙伴能够移步至：http://my.oschina.net/u/2561483/blog/704307 web

1. 下载mmseg4j的jar包

须要两个jar : mmseg4j-core-1.10.0.jar mmseg4j-solr-2.3.0.jarbash

2. 加载jar包

将jar 放到solr集群中，下面的节点都要放。具体放在个人目录是：/root/solr-5.4.0/dist测试

而后配置solr参数在你建立的collection的配置文件solrconfig.xml中加入spa

好比个人是～/solr_home/webpage/conf/ 下面的solrconfig.xml:.net

<lib dir="${solr.install.dir:../../../..}/dist/" regex=".*\.jar" />

在建立collection的时候将dist下面的jar包加载进去code

配置schema.xml 加入自定义的字段和分词类型：server

<!-- mmseg4j -->
    <fieldType name="text_zh" class="solr.TextField" positionIncrementGap="100">
    <span style="white-space:pre">    </span><analyzer>
    <span style="white-space:pre">        </span><tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" />
    <span style="white-space:pre">    </span></analyzer>
    </fieldType>

<field name="my_content" type="text_zh" indexed="true" stored="false" multiValued="true"/>

3. solrcloud命令建立collection：

./bin/solr create_collection -c students -d server/solr/configsets/sample_techproducts_configs/conf -shards 3 -replicationFactor 3

4. 能够到solr管理界面查看

点这个schema browser 搜索你自定义的字段 my_content 能够查看状态了。xml

这说明字段都添加成功了。blog

还能够检查分词的效果，在solr 管理界面左侧边栏选项，输入测试语句，点击Analyse Values就能够啦：token

出现这样的效果说明分词成功~