Lucene的分析过程

时间 2020-12-24

原文原文链接

回顾倒排索引的构建收集待建索引的原文档(Document) 将原文档传给词条化工具(Tokenizer)进行文本词条化将第二步得到的词条(Token)传给语言分析工具(Linguistic modules)进行语言学预处理，得到词项(Term) 将得到的词项(Term)传给索引组件(Indexer),建立倒排索引注：详细文档->倒排索引的理论过程见词项词典及倒排记录表分析操作的使用场景