爬虫实战9—基于page rank的顺序调整

文章说明:本文是在学习一个网络爬虫课程时所做笔记,文章如有不对的地方,欢迎指出,积极讨论。 一、Page Rank PageRank算法计算每一个网页的PageRank值,然后根据这个值的大小对网页的重要性进行排序。 对海量的节点进行排序。排序策略算法。 Google的两大神器:(1)Page Rank ;(2)Big Table。 用于爬虫的两点: (1)优先抓谁; (2)数据爬取回来以后,查询
相关文章
相关标签/搜索