本章重点介绍CentOS 安装部署Solr7 ,Solr的管理界面介绍,添加核心Core配置,Dataimport导入数据,Documents 在线维护索引,Query复杂查询和一些常见问题处理办法。html
Solr 是Apache下的一个顶级开源项目,采用Java开发,基于Lucene的全文搜索服务器。Solr能够独立运行在Jetty、Tomcat等这些Servlet容器中。java
这里谈到了Lucene,它是一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎,目的是为开发人员提供工具包,以方便的在系统中实现全文检索的功能。
而Solr 的目标是打造一款企业级的搜索引擎系统,能够独立运行。而且Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。mysql
首先安装环境的jdk是 jdk1.8 或者更高,建议tomcat是tomcat8.0或者更高git
You will need the Java Runtime Environment (JRE) version 1.8 or highergithub
[itdragon@localhost solr-server]$wget http://mirror.bit.edu.cn/apache/lucene/solr/7.1.0/solr-7.1.0.zip [itdragon@localhost solr-server]$unzip solr-7.1.0.zip [itdragon@localhost solr-server]$ls apache-tomcat-8.5-solr solr-7.1.0 [itdragon@localhost solr-server]$mkdir -p apache-tomcat-8.5-solr/webapps/solr [itdragon@localhost solr-server]$cd apache-tomcat-8.5-solr/webapps/solr/ [itdragon@localhost solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr-webapp/webapp/* ./ [itdragon@localhost solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/lib/ext/* ./WEB-INF/lib/ [itdragon@localhost solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/lib/metrics*.* ./WEB-INF/lib/ [itdragon@localhost solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/dist/solr-dataimporthandler-* ./WEB-INF/lib/ [itdragon@localhost solr]$cd ../../ [itdragon@localhost apache-tomcat-8.5-solr]$mkdir solrhome [itdragon@localhost apache-tomcat-8.5-solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr/* ./solrhome/ [itdragon@localhost apache-tomcat-8.5-solr]$vim webapps/solr/WEB-INF/web.xml <env-entry> <env-entry-name>solr/home</env-entry-name> <env-entry-value>solrhome地址,pwd查看</env-entry-value> <env-entry-type>java.lang.String</env-entry-type> </env-entry> <!-- <security-constraint> ......省略 </security-constraint> --> [itdragon@localhost apache-tomcat-8.5-solr]$cd bin/ [itdragon@localhost apache-tomcat-8.5-solr]$./startup.sh
第一步:系统环境准备:jdk版本在1.8,tomcat8.5
第二步:下载solr7,并解压在当前目录
第三步:在tomcat,webapps目录下建立solr目录,并将solr-7.1.0/server/solr-webapp/webapp/* 目录下的全部内容拷贝过去
第四步:将须要的jar导入到 WEB-INF/lib/ 下
第五步:在tomcat目录下建立solrhome(目录名自定义),并将solr-7.1.0/server/solr/* 目录下的全部内容拷贝过去
第六步:修改WEB-INF/web.xml 文件,指定solrhome的位置,并注释security-constraint 权限内容
第七步:启动tomcat,并访问http://ip:port/solr/index.html#/
注意:访问http://ip:port/solr/ 显示404,目前尚未找到缘由,网上说jar没到导入,但是笔者都导入了。web
看到管理页面说明安装成功sql
存在的问题
1 80端口占用
修改 tomcat/conf/server.xml 文件,更换端口号。
2 Logging页面,日志不能正常显示数据库
[itdragon@localhost solr]$mkdir -p WEB-INF/classes [itdragon@localhost solr]$cp /home/itdragon/solr-server/solr-7.1.0/server/resources/log4j.properties ./WEB-INF/classes/
第一步:在tomcat WEB-INF目录下建立classes目录
第二步:将solr-7.1.0/server/resources/目录下的log4j.properties文件拷贝到classes目录中,重启Solrapache
在管理页面,点击Core Admin,选择AddCore,添加核心json
name:自定义的名字,建议和instanceDir保持一致
instanceDir: solrhome目录下的实例类目
dataDir:默认填data便可
config:指定配置文件,new_core/conf/solrconfig.xml
schema:指定schema.xml文件,new_core/conf/schema文件(其实是managed-schema文件)
注意!在scheme下面有一个感叹号!
instanceDir and dataDir need to exist before you can create the core
若是你无论他,直接点击Add Core 会提示 solrconfig.xml 文件找不到
Error CREATEing SolrCore 'new_core': Unable to create core [new_core] Caused by: Can't find resource 'solrconfig.xml' in classpath or '/home/itdragon/solr/apache-tomcat-8.5/solrhome/new_core'
解决方法以下
[itdragon@localhost new_core]$mkdir conf [itdragon@localhost new_core]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr/configsets/_default/conf/* ./conf/ [itdragon@localhost solrhome]$cp -r /home/itdragon/solr-server/solr-7.1.0/contrib/ ./ [itdragon@localhost solrhome]$cp -r /home/itdragon/solr-server/solr-7.1.0/dist/ ./ 检查solrconfig.xml和contrib目录,dist目录的相对位置 <!-- <lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" /> ......省略 --> <lib dir="${solr.install.dir:../../}/contrib/extraction/lib" regex=".*\.jar" /> ......省略
第一步:将solr-7.1.0/server/solr/configsets/_default/目录下的conf 拷贝到 new_core 目录下。正确的目录结构:new_core/conf/solrconfig.xml
第二步:将contrib目录,dist目录拷贝到solrhome目录中
第三步:检查solrconfig.xml文件配置的路径是否正确,重启服务
重启服务后便可正常建立Core,而后instanceDir文件夹(new_core)里会自动生成一个core.properties文件
name=new_core config=solrconfig.xml schema=schema.xml dataDir=data
第二次建立core,就不用这么麻烦了,直接把第一次建立的new_core目录复制一份,修改core.properties文件中的name 便可。
在Core Selector 中选择刚建立的 new_core,会出现不少菜单。这是本章的另外一个重点。重点学习的内容:Query(查询页面),Documents (索引文档),Dataimport(导入数据),Analysis(分析,下章节和中文分词一块儿介绍)。其余了解便可。
点击Dataimport 显示 Sorry, no dataimport-handler defined! 解决方法以下
[itdragon@localhost ~]$cd solr-server/apache-tomcat-8.5-solr/solrhome/contrib/dataimporthandler/lib # 导入solr-dataimporthandler 和 mysql-connector-java jar包 [itdragon@localhost solrhome]$vim new_core/conf/solrconfig.xml <lib dir="${solr.install.dir:../../}/contrib/dataimporthandler/lib" regex=".*\.jar" /> ......省略 <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">data-config.xml</str> </lst> </requestHandler> [itdragon@localhost solrhome]$vim new_core/conf/data-config.xml <?xml version="1.0" encoding="UTF-8" ?> <dataConfig> <dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/jpa" user="root" password="root"/> <document> <entity name="product" query="SELECT pid,name,catalog,catalog_name,price,description,picture FROM products "> <field column="pid" name="id"/> <field column="name" name="product_name"/> <field column="catalog" name="product_catalog"/> <field column="catalog_name" name="product_catalog_name"/> <field column="price" name="product_price"/> <field column="description" name="product_description"/> <field column="picture" name="product_picture"/> </entity> </document> </dataConfig>
第一步:进入solrhome/contrib/dataimporthandler/lib 目录下,若没有lib则建立一个,导入solr-dataimporthandler-7.1.0.jar 和 mysql-connector-java-5.1.17.jar 包
第二步:修改new_core/conf/solrconfig.xml 文件,使其加载dataimporthandler/lib下的jar包
第三步:在new_core/conf/solrconfig.xml 文件底部添加DataImportHandler 内容
第四步:在new_core/conf/ 目录下建立data-config.xml(数据库配置和对应的字段),重启服务
jar包和sql文件:
https://github.com/ITDragonBl...
若是出现下图内容则说明配置成功。
Command:full_import:全量导入;delta_import:增量导入。
选择 全量导入,Execute执行,Refresh Status刷新查看状态,其余都选默认便可。
Clean:在索引开始构建以前是否删除以前的索引,默认为true
Commit:在索引完成以后是否提交。默认为true
Execute:执行导入
Refresh Status:刷新后才能看到数据发生了变化(点一次刷新一次)
索引的增长,修改,删除相关操做。其中修改的逻辑是先删除后增长。
比较重要的是前三个参数
Request-Handler(qt):update(新增,更新和删除都用update)
Document Type:提交的索引文档类型,有JSON、XML等格式
Document(s):提交的索引文档内容
Commit Within:每1000毫秒执行
Overwrite:true,若文档存在则默认覆盖
删除索引:删除用json格式会出错,用xml格式后面需添加< commit/>
工做中,咱们不可能为了个别数据去写代码修改数据,那么熟练使用Documents,对咱们的工做有很大的帮助。
查询全部价格在10到20之间的数据,并以价格降序输出商品类目名,商品标题,商品价格信息。
Request-Handler(qt):select查询操做
q(query):查询条件,key:value 形式,只能知足简单的查询
fq(filter query):过滤条件。对q的补充,实现复杂的查询。如:product_price:[10.0 TO 20.0] 表示价格在10~20之间。" " 表示无限,[ TO 20.0] 表示小于20.0
sort:对查询结果排序。如:product_price desc 表示价格降序
start,rows,开始页数,和每页多少条,简称页码
fl(field list):指定那些字段有返回值。多个值用","分隔。如:product_catalog_name,product_name,product_price
df(default field):默认域,当q查询没有key的时候,发挥做用
wt(write type):输出格式,通常都是json
hl(high light):高亮,搜索的结果若不高亮,那就没啥意义了。下一章会介绍
Dashboard:
显示了该Solr实例开始启动运行的时间、版本、系统资源(物理内存,交换空间)、jvm等信息
Logging:Solr运行日志信息
Java Properties:
Solr在JVM 运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。
Tread Dump:
显示Solr Server中当前活跃线程信息,同时也能够跟踪线程运行栈信息。
Overview:
包含基本统计如当前文档数;和实例信息如当前核心的配置目录
Files:
在线预览solrhome/new_core/conf/* 文件或者目录
Ping:
请求来检查核心是否启动并响应请求,点击后显示响应的毫秒数
Plugins / Stats:
插件及其状态
到这里Solr7 的安装部署,管理界面介绍就结束了。感谢阅读!欢迎点评!!