转载 开源网络爬虫介绍及其比较

[b]Nutch [/b] 开发语言:Java http://lucene.apache.org/nutch/ 简介: Apache的子项目之一,属于Lucene项目下的子项目。 Nutch是一个基于Lucene,相似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,相似Eclipse的插件机制保证了系统的可客户化,并且很容易集成到本身的应用之中。 [b]L
相关文章
相关标签/搜索