Apache Lucene全文检索

Lucene4.0的官网文档:http://lucene.apache.org/core/4_0_0/core/overview-summary.htmlhtml

1、什么是lucene

        Lucene是一套用于全文检索和搜寻的开源程式库是全文检索的框架而不是产品(不像百度不一样), lucene其实就作两种工做:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户能够经过关键词定位源。数据库

        百科是这样说的:Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础创建起完整的全文检索引擎。apache

lucene能作什么架构

  

要回答这个问题,框架

先要了解工具

lucene搜索引擎

的本质。spa

实际上开放源代码

lucenehtm

的功能很单一,

说到

底,

就是你给它若干个字符串,

而后它为你提供一个全文搜索服务,

告诉你你要

搜索的关键词出如今哪里。

知道了这个本质,

你就能够发挥想象作任何符合这个

条件的事情了。

你能够把站内新闻都索引了,

作个资料库;

你能够把一个数据库

表的若干个字段索引发来,

那就不用再担忧由于“%like%”而锁表了;

你也能够

写个本身的搜索引擎„„ 

相关文章
相关标签/搜索