(一)概念介绍linux
1 分词: 把一串文字分割成多个关键词,也叫关键字.数据库
2 倒叙索引: 根据词来找文档 ,而普通索引是在文档中找词,因此效率很低.apache
(二) Lucene引入服务器
Lucene是apache软件基金会的一个项目,是一个开放源代码的全文检索引擎工具包,在Java开发环境里Lucene是一个成熟的免费开源工具。就其自己而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。工具
缺点:性能
(三) Solr介绍 (底层用的是Lucene)优化
同类型产品: ElasticSearch搜索引擎
(1) Solr是一个独立的企业级搜索应用服务器,它对外提供相似于Web-service的API接口。用户能够经过http请求,向搜索引擎服务器提交必定格式的XML文件,生成索引;也能够经过Http Get操做提出查找请求,并获得XML格式的返回结果.spa
基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,而且提供了一个完善的功能管理界面,是一款很是优秀的全文搜索引擎。开放源代码
使用 HttpSolrClient 进行远程调用
特色:
1. solr能够根据数据库表自动生成索引文件.
2. Solr能够动态的按期自动更新索引(对更新的数据进行索引的修改)
(2) 安装
(四)Solr与Lucene ,ikAnalyzer的关系
管理界面以下
之前歌词里的安河桥
如今这里的安河桥