垂直搜索-爬虫部分

垂直搜索与通用搜索不同之处在于,通用搜索不需要理会网站哪些资源是需要的,哪些是不需要的,一并抓取并将其文本部分做索引。而垂直搜索里,我们的目标网站往往在某一领域具有其专业性,其整体网站的结构相当规范,并且垂直搜索往往只需要其中一部分具有垂直性的资源,所以垂直爬虫相比通用爬虫更加精确。 垂直爬虫抓取数据分成三个步骤:list-crawling(列表url抓取),detail-crawling(详情u
相关文章
相关标签/搜索