使用nutch搭建相似百度/谷歌的搜索引擎

Nutch是基于Lucene实现的搜索引擎。包括全文搜索和Web爬虫。Lucene为Nutch提供了文本索引和搜索的API。css 1.有数据源,须要为这些数据提供一个搜索页面。最好的方式是直接从数据库中取出数据并用Lucene API 创建索引,由于你不须要从别的网站抓取数据。 2.没有本地数据源,或者数据源很是分散的状况下,就是须要抓别人的网站,则使用Nutch。html 1.安装 1.安装t
相关文章
相关标签/搜索