katta项目主页:http://katta.sourceforge.net/ html
Katta的介绍:http://blog.sina.com.cn/s/blog_43b8e6dd0100ne4b.html java
关于Solr整合Katta的讨论https://issues.apache.org/jira/browse/SOLR-1395 apache
1.下载 分布式
katta:http://sourceforge.net/projects/katta/files/katta/ oop
solr:http://lucene.apache.org/solr/ spa
在上面的讨论中彷佛是使用的Lucene4.0,Katta0.6.2 .net
我直接使用 orm
katta:0.6.3 htm
solr:3.6.1 blog
2.分布式搜索是一个好的解决方案,本身动手开发是有很大难度的.我相信使用Lucene的人不少,而且也不少是直接使用Solr的.能把Lucene的索引文件放到Hadoop HDFS文件系统上我想是一个终极解决方案,可是最终要的是能作索引分片,而且能提供分布式搜索.Lucene的创始人Doug Cutting 也是建议katta这个解决方案的.见: http://wiki.apache.org/hadoop/DistributedLucene
由于涉及的技术比较多,并且技术门槛也较高,鲜有人整合成功.其中涉及的技术包括:Lucene,Solr,Katta,ZooKeeper,Hadoop RPC.最主要的整合Lucene和Solr必须有较深的实战经验.
3.整合
下载Solr3.6.1源码,solr-core,solrj两个,下载Katta-0.6.3源码,katta.zip解压后在src目录下已经存在.把这三个导入到Eclipse.如
整理好上面三个项目,而且使其能经过编译.
再建立一个java项目:如solr-katta-plugin,这个项目依赖于katta,solr-core,solrj.如:
在https://issues.apache.org/jira/browse/SOLR-1395上下载几个文件,从提交的时间上来看,应该下载我用线条标记了的.在Linux 终端中执行patch -p 0 -i *.patch,[*换成你下载的],当有询问是输入enter,或者输入y等.把源码解压出来.这里我已经OK,须要的读者能够发信给我我能够提供.
全部源码copy到solr-katta-plugin项目下的src目录,正常的话会出现很错误的.
第一步完成.