[论文阅读笔记] node2vec Scalable Feature Learning for Networks

时间 2021-01-08

标签 html node 算法网络框架学习 scala 设计 htm blog 栏目 Scala 繁體版

原文原文链接

[论文阅读笔记] node2vec：Scalable Feature Learning for Networks

本文结构

解决问题
主要贡献
算法原理
参考文献

(1) 解决问题

因为DeepWalk的随机游走是彻底无指导的随机采样，即随机游走不可控。本文从该问题出发，设计了一种有偏向的随机游走策略，使得随机游走能够在DFS和BFS两种极端搜索方式中取得平衡。html

(2) 主要贡献

Contribution： 本篇论文主要的创新点在于改进了随机游走的策略，定义了两个参数p和q，使得随机游走在BFS和DFS两种极端中达到一个平衡，同时考虑到局部和宏观的信息。node

(3) 算法原理

node2vec算法框架主要包含两个部分：首先在图上作有偏向的随机游走，其次将获得的节点序列输入Skip-Gram模型学习节点表示向量嵌入(再也不赘述，参考DeepWalk）。算法

有偏的随机游走策略：
其定义了两个参数p（向后参数）和q（向前参数），在广度优先搜索（BFS）和深度优先搜索（DFS）两种极端中达到一个平衡，从而同时考虑到局部和全局的结构信息。给定源点u，利用有偏随机游走生成长度为L的序列，随机游走的转移几率计算公式设计以下：网络

c_i表示序列中的第i个点，c₀=u，Z为一个归一化常数。分母π_vx为v到x的非归一化的转移几率，以下所示（d_tx为上一跳节点t与下一跳考虑跳转节点的距离）：框架

以一个例子来解释，以下图所示：学习

假设随机游走的上一跳节点是t，当前节点是v，则依据上述转移几率公式的设计下一跳节点怎么选择呢？下一跳节点多是x₁，x₂，x₃和t。因为x₁与上一跳节点距离1跳，所以下一跳到节点x₁的非归一化转移几率为1，而x₂、x₃与上一跳节点距离2跳，所以下一跳到x₂和x₃的非归一化转移几率均为1/q，此外t与上一跳节点距离0跳，所以下一跳到t的非归一化转移几率为1/p。以上即是Node2vec中设计的权衡BFS和DFS的随机游走策略。scala

经过以上方式生成同构网络上的随机游走序列以后，采用Skip-Gram模型训练节点向量便可。设计

(4) 参考文献

Grover A, Leskovec J. node2vec: Scalable feature learning for networks[A]. Proceedings of the 22nd ACM SIGKDD international conference on Knowledge discovery and data mining[C]. 2016: 855–864.htm