ik中文分词插件官网 git
https://github.com/medcl/elasticsearch-analysis-ik github
下载和您ES匹配的版本,如今已经支持最新的2.2.0版本 json
源码压缩文件解压到任意文件夹 浏览器
一、首先将源代码用maven打包,这个打包不用必须在服务器上, 服务器
安装配置好maven后,进入源码所在文件夹执行以下命令 curl
mvn clean package elasticsearch
打包命令会下载不少依赖的包,会比较慢 maven
二、命令执行成功后在源码路径下生成以下目录, 编码
elasticsearch-analysis-ik-master\target\releases
找到这个文件 elasticsearch-analysis-ik-{version}.zip url
三、将第二部的zip文件解压缩到elasticsearch 安装目录的以下目录中,没有ik目录则手动创建
elasticsearch-2.2.0/plugins/ik
三、启动elasticsearch便可
./bin/elasticsearch
四、验证
浏览器输入相似以下地址,ip端口,yang是索引
http://192.168.0.128:9200/yang/_analyze?analyzer=ik&pretty=true&text="我是中国人"
可以显示以下信息则说明安装正确
{ tokens: [ { token: "我", start_offset: 0, end_offset: 1, type: "CN_CHAR", position: 0 }, { token: "中国人", start_offset: 2, end_offset: 5, type: "CN_WORD", position: 1 }, { token: "中国", start_offset: 2, end_offset: 4, type: "CN_WORD", position: 2 }, { token: "国人", start_offset: 3, end_offset: 5, type: "CN_WORD", position: 3 } ] }
五、插入数据,此处用curl方式插入数据须要注意中文编码问题,此处我用fiddler插入
连续插入多条相同数据,尝试查找执行以下命令
六、查找,关键词北京
七、结果json,关键词高亮
{ "took": 196, "timed_out": false, "_shards": { "total": 5, "successful": 5, "failed": 0 }, "hits": { "total": 3, "max_score": 2, "hits": [ { "_index": "index", "_type": "fulltext", "_id": "4", "_score": 2, "_source": { "content": "中华人民共和国,北京天安门" }, "highlight": { "content": [ "中华人民共和国,<tag1>北京</tag1>天安门" ] } }, { "_index": "index", "_type": "fulltext", "_id": "5", "_score": 0.61370564, "_source": { "content": "中华人民共和国,北京天安门" }, "highlight": { "content": [ "中华人民共和国,<tag1>北京</tag1>天安门" ] } }, { "_index": "index", "_type": "fulltext", "_id": "3", "_score": 0.61370564, "_source": { "content": "中华人民共和国,北京天安门" }, "highlight": { "content": [ "中华人民共和国,<tag1>北京</tag1>天安门" ] } } ] } }