solrCloud的搭建能够有两种方式:使用solr内嵌的jetty来搭建;使用外部web容器tomcat来搭建。对于使用jett来搭建参考solr官方的手册照着作确定ok,下面我主要讲的是如何使用tomcat来搭建solrCloud。html
废话很少说,开始咱们的工做!java
1.搭建tomcat单机版solrnode
见个人上一篇博文solr安装-tomcat单机版web
2.安装配置zookeeperapache
具体下载,安装,配置不详细说了,很简单。只列出个人关键配置项,以下:bootstrap
clientPort=4181vim
server.2=hadoop.datanode5.com:2888:9888api
server.3=hadoop.datanode2.com:2888:9888
server.1=hadoop.datanode3.com:2888:9888
tomcat
3. 配置solrCloudbash
(1)先配置主服务器tomcat 10.2.50.46
vim /usr/apache-tomcat-7.0.54/bin/catalina.sh 在图片所示位置加入如下代码
JAVA_OPTS="$JAVA_OPTS -Dbootstrap_confdir=/usr/solr/collection1/conf -Dcollection.configName=myconf -DzkHost=hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181"
注:其中DzkHost是用来指定zookeeper服务器的ip和端口。 confdir目录指定全部的索引库都从collection1索引库中同步字段
(2)配置从服务器tomcat 10.2.50.28 和10.2.50.52
vim /home/tomcat/bin/catalina.sh 在和上图一样的位置加入
JAVA_OPTS="-DzkHost=hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181"
(3)配置solr collection配置文件
/usr/solr/solr.xml:配置hostport为tomcat的服务端口;配置zkHhost。
<solr> <solrcloud> <str name="host">${host:}</str> <int name="hostPort">8080</int> <str name="hostContext">${hostContext:solr}</str> <int name="zkClientTimeout">${zkClientTimeout:15000}</int> <bool name="genericCoreNodeNames">${genericCoreNodeNames:true}</bool> <str name="zkHost">hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181</str></solrcloud> <shardHandlerFactory name="shardHandlerFactory" class="HttpShardHandlerFactory"> <int name="socketTimeout">${socketTimeout:0}</int> <int name="connTimeout">${connTimeout:0}</int> </shardHandlerFactory></solr>
/usr/solr/collection1/core.properties:删除该文件(这样集群启动后就没有collection)
/usr/solr/collection1/conf/solrconfig.xml:修改以下配置项:
<dataDir>${solr.data.dir:/data_solr/example-collection}</dataDir>
将全部的这些配置同步到各个节点上。
(3) 保存后依次启动tomcat,输入http://10.2.50.46:8080,看到以下界面说明成功
正常状况下,应该是没有collection和core的,我这里是本身建立了一个collection。
(4)建立collection,shard,core
有两种方式:一种是建立collection,自动分配shard和replica;另外一种是建立collection,手动分配shard和replica。推荐后者,由于可控性强。
方式一:
curl
'http://localhost:7070/solr/admin/collections?action=CREATE&name=europe-collection&numShards=3&replicationFactor=3&maxShardsPerNode=3'
这样会出来一个collection,它有3个shard,每一个shard有1个数据节点,2个备份节点,即该collection共有9个core
缺点:不灵活,不能选择适合的节点,不能选择数据存放路径,不能选择实例存放路径
方式二:
curl 'http://localhost:8080/solr/admin/cores?action=CREATE&name=cz_collection-shard1-replica1&instanceDir=/usr/solr/cz_collection-shard1-replica1&dataDir=/data_solr/cz_collection-shard1-replica1&collection=cz_collection&shard=shard1'
curl 'http://localhost:8080/solr/admin/cores?action=CREATE&name=cz_collection-shard1-replica2&instanceDir=/usr/solr/cz_collection-shard1-replica2&dataDir=/data_solr/cz_collection-shard1-replica2&collection=cz_collection&shard=shard1'
这样能够建立出一个collection,并本身指定该collection的shard和replica的全部配置项。还能够继续接着建立。
以上两种方式的具体api调用,请参看solr官方文档。
(5)集群运维
a.集群会发生变化的就是collection的配置,所以当collection的配置文件发生变化后就应该使用命令更新zookeeper中配置文件信息,solr很好提供了运维工具:
#collection配置
#将配置文件上传到ZooKeeper中
java -classpath .:/usr/solr/lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181 -confdir /usr/solr/collection1/conf -confname myconf
#将上传到ZooKeeper中配置文件与Collection相关联
java -classpath .:/usr/solr/lib/* org.apache.solr.cloud.ZkCLI -cmd linkconfig -collection cz_collection -confname myconf -zkhost hadoop.datanode2.com:4181,hadoop.datanode3.com:4181,hadoop.datanode5.com:4181
b.对于collection,shard,core运维使用api接口便可,在此不说了。
参考文章:
http://myjeeva.com/solrcloud-cluster-single-collection-deployment.html#deploying-solrcloud
http://wiki.apache.org/solr/SolrCloudTomcat
http://wiki.apache.org/solr/SolrTomcat
http://blog.csdn.net/woshiwanxin102213/article/details/18793271
转载:http://blog.csdn.net/xyls12345/article/details/27504965