Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。apache
Lucene 软件包的发布形式是一个 JAR 文件,下面咱们分析一下这个 JAR 文件里面的主要的 JAVA 包,使读者对之有个初步的了解。工具
Package: org.apache.lucene.documentspa
这个包提供了一些为封装要索引的文档所须要的类,好比 Document, Field。这样,每个文档最终被封装成了一个 Document 对象。orm
Package: org.apache.lucene.analysis对象
这个包主要功能是对文档进行分词,由于文档在创建索引以前必需要进行分词,因此这个包的做用能够当作是为创建索引作准备工做。索引
Package: org.apache.lucene.index文档
这个包提供了一些类来协助建立索引以及对建立好的索引进行更新。这里面有两个基础的类:IndexWriter 和 IndexReader,其中 IndexWriter 是用来建立索引并添加文档到索引中的,IndexReader 是用来删除索引中的文档的。it
Package: org.apache.lucene.searchimport
这个包提供了对在创建好的索引上进行搜索所须要的类。好比 IndexSearcher 和 Hits, IndexSearcher 定义了在指定的索引上进行搜索的方法,Hits 用来保存搜索获得的结果。基础