将连接视做投票
递归的意思是:假如如今要求C,指向C的入链只有B,那么得先求B的重要度,B重要度的大小取决于指向B的入链以及这些入链的重要度。
简单的递归公式
流模型
“随机”的解释:从i这个页面开始,它可能有di种选择,并且他作每一种选择的时候,选择的几率是相同的,即他决定到下一个页面是一个随机的选择(应该跳到那个页面),咱们把上面图中的矩阵叫随机邻接矩阵。算法
矩阵方程
Σri=1在这里表示限定条件,和流方程同样,不加限定条件会有无穷多个解。因此这里的限定条件是假定全部网页的重要度求和等于1。
矩阵的行和r向量相乘的时候就是对流公式的表示。
矩阵方程实例
幂迭代方法
两个向量的1范数,实际上是对应位置的差值绝对值之和。
r向量是全部网页的重要程度组成的向量。网络
幂迭代求解
总共是3个节点,初始化每一个节点的重要度分别是1/3。
r=r'的意思是,最后求得r'的值趋于稳定,再也不变化。优化
随机游动的解释
若是有不少页面指向页面j的话,那么它的重要度是很高的。
平稳分布
存在性和惟一性
在节点少的图中,若是新增一个节点的话,整个图是须要从新算的。可是在亿级节点的话,多一个节点少一个节点,对图的影响不必定大。像百度和谷歌就不会频繁的去计算。3d
按照流公式迭代不必定会收敛到咱们想要的结果。cdn
收不收敛?
a,b节点图,若是用1,0去初始化的话,会发现他们一直再对调。
ABCD图,全部的权重最后都归到了C这一个点。blog
随着矩阵运算的迭代,拿到的ABCD四个值都会很是很是趋于零。
PageRank问题
m这个点就是个陷阱问题,最终全部的权重都被吸到m这个点上。
终结者问题,最后的迭代结果是零零零,m这个点没有任何出链。
解决办法:随机传送
e表明所有的网页,就是说浏览者会随机的在所有网页中打开一个。
pagerank是一个针对图的算法,有名是由于,最先的时候谷歌用它作了一个所谓比较公正的网络排序,但后来人们对他作了各类优化,争取经过他的规则,把本身的网页提升比较靠前的位置,也经过优化来使结果更加的稳定。排序
pagerank能够帮你在有关联的图中找到最重要的节点。递归