全文索引 Solr

(一)概念介绍linux

  1 分词: 把一串文字分割成多个关键词,也叫关键字.数据库

  2 倒叙索引: 根据词来找文档 ,而普通索引是在文档中找词,因此效率很低.apache

  

 

(二) Lucene引入服务器

  Luceneapache软件基金会的一个项目,是一个开放源代码的全文检索引擎工具包,在Java开发环境里Lucene是一个成熟的免费开源工具。就其自己而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库。工具

  缺点:性能

  1. 效率过低
  2. 若是商品修改了,则须要同步索引文件.
  3. 若是商品新增了,则须要从新遍历从新索引.
  4. 从新生成索引文件的时间较长.

 

(三) Solr介绍 (底层用的是Lucene)优化

  同类型产品: ElasticSearch搜索引擎

 

   (1) Solr是一个独立的企业级搜索应用服务器,它对外提供相似于Web-serviceAPI接口。用户能够经过http请求,向搜索引擎服务器提交必定格式的XML文件,生成索引;也能够经过Http Get操做提出查找请求,并获得XML格式的返回结果.spa

  基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,而且提供了一个完善的功能管理界面,是一款很是优秀的全文搜索引擎。开放源代码

  使用 HttpSolrClient 进行远程调用

 

  特色:

  1. solr能够根据数据库表自动生成索引文件.

  2. Solr能够动态的按期自动更新索引(对更新的数据进行索引的修改)

  (2) 安装

  1. Solr5.0以上版本要求jdk必须是1.8
  2. 将Solr压缩包上传到linux服务器中
  3. tar -xzvf 压缩包名.tgz 进行解压
  4. 进入bin目录   使用命令   sh solr start 启动solr
  5. 进入 http://服务器IP:8983 查看页面,有页面就成功了.

 

 (四)Solr与Lucene ,ikAnalyzer的关系

  

   管理界面以下

  

 

 


 

      

        之前歌词里的安河桥

             如今这里的安河桥

相关文章
相关标签/搜索