Lucene——索引过程分析Index

Lucene索引过程分为3个主要操作步骤:将原始文档转换成文本、分析文本、将分析好的文本保存至索引中 一、提取文本和创建文档 从 pdf、word等非纯文本格式文件中,提取文本格式信息。建立起对应的,包含各个域的文档后,就可以对这些文本信息进行分析。 使用 Tika框架实现 二、分析文档 调用 IndexWriter对象的 addDocument方法,将数据传递给Lucene进行索引操作。 分析文
相关文章
相关标签/搜索