Solr/Lucene分布式搜索,Solr Integrate katta step1

时间 2019-11-25

标签 solr lucene 分布式搜索 integrate katta step1 step 栏目系统架构繁體版

原文原文链接

katta项目主页:http://katta.sourceforge.net/ html

Katta的介绍:http://blog.sina.com.cn/s/blog_43b8e6dd0100ne4b.html java

关于Solr整合Katta的讨论https://issues.apache.org/jira/browse/SOLR-1395 apache

1.下载分布式

katta:http://sourceforge.net/projects/katta/files/katta/ oop

solr:http://lucene.apache.org/solr/ spa

在上面的讨论中彷佛是使用的Lucene4.0,Katta0.6.2 .net

我直接使用 orm

katta:0.6.3 htm

solr:3.6.1 blog

2.分布式搜索是一个好的解决方案,本身动手开发是有很大难度的.我相信使用Lucene的人不少,而且也不少是直接使用Solr的.能把Lucene的索引文件放到Hadoop HDFS文件系统上我想是一个终极解决方案,可是最终要的是能作索引分片,而且能提供分布式搜索.Lucene的创始人Doug Cutting 也是建议katta这个解决方案的.见: http://wiki.apache.org/hadoop/DistributedLucene

由于涉及的技术比较多,并且技术门槛也较高,鲜有人整合成功.其中涉及的技术包括:Lucene,Solr,Katta,ZooKeeper,Hadoop RPC.最主要的整合Lucene和Solr必须有较深的实战经验.

3.整合

下载Solr3.6.1源码,solr-core,solrj两个,下载Katta-0.6.3源码,katta.zip解压后在src目录下已经存在.把这三个导入到Eclipse.如

整理好上面三个项目,而且使其能经过编译.

再建立一个java项目:如solr-katta-plugin,这个项目依赖于katta,solr-core,solrj.如:

在https://issues.apache.org/jira/browse/SOLR-1395上下载几个文件,从提交的时间上来看,应该下载我用线条标记了的.在Linux 终端中执行patch -p 0 -i *.patch,[*换成你下载的],当有询问是输入enter,或者输入y等.把源码解压出来.这里我已经OK,须要的读者能够发信给我我能够提供.

全部源码copy到solr-katta-plugin项目下的src目录,正常的话会出现很错误的.

第一步完成.