Hadoop与Spark算法分析(四)——PageRank算法

PageRank是用于解决网页重要性排序的关键技术之一,其基于网页之间连接关系构建一个有向图结构,实现各个网页级别的划分。一个网页的PageRank值(后面简称PR值),取决于其余网页对该网页的贡献和,以公式形式表示为,其中U表示全部网页指向网页b的网页集合,L(a)表示网页a的出度,d表示用户浏览一个网页的随机几率,用于解决网页关系间的陷阱问题。根据公式递归计算,各网页的PR值将最终趋于稳定。能
相关文章
相关标签/搜索