ElasticSearch1.7之ik(中文)分词器的自定义分词扩展方式

随着数据量的越来越大,有一些定义的关键词已经不再是常用词汇,超出了ES自带的ik分词词库范围,比如:“奥利给”等别称和新闻话题词;这就出现了一些现象,如搜索“奥利给”,因为ik词库没有此词,故将词分为若干个字,检索时会将同时含有“奥”、“利”、“给”三个字的新闻都返回,就出现不准确的现象,很严重; 因此,我们要根据客户需求在系统中自定义分词词库,将这些词统一加入到词库中。   操作流程: 1. c
相关文章
相关标签/搜索