Elasticsearch分词机制、IK分词器、自定义分词、批量管理

分词 分词是指文本转换成一系列单词(term or token)的过程,也可以叫做文本分析,关键词为Analysis。 举例 彭于晏是最帅的明星 分词为:(彭于晏)(最帅)(明星) Character Filter 分词机制 效果 Character Filter 对原始文件进行处理:例如去除html标签,特殊字符等 Tokenizer 将原始文件进行分词:例:二院二部(二院、二部) Token
相关文章
相关标签/搜索