来源:KDD 2018
注: 如有错误,欢迎指正
这篇KDD’18的文章,没有按照常规的方法将全部的node嵌入到同一的空间,由于文章提出 node 由于链接的 edge 类型(type)不一样,存在不兼容(incompatibility)的特性,因此最好可以根据不一样的edge type来定义不一样度量空间(metric space),保持同一个度量空间下,node的兼容性。
1. Abstract
在本文中,做者认为异构信息网络(HIN)中隐含着丰富信息的同时也引入了潜在的不兼容性,为了保留HIN中丰富但可能不兼容的信息,提出对HIN的综合转录问题。还须要提供一种易于使用的方法来有效利用 HIN 中的信息。本文提出HEER方法: 经过对 HIN 的边缘表示,与正确学习的异构度量相结合。
2. Introduction
网络嵌入学习节点的低维表示能够在原始网络中编码其语义信息,且容易和机器学习等方法相结合,可用于分类、链路预测。近来,研究人员证实了HIN 嵌入在做者识别等方面的有效性。
图 1 Network Embedding
HIN 异构性不只包含丰富的信息,还有潜在的不兼容的语义。传统的同构网络嵌入不论其类型,均等的处理全部节点和边,不会捕捉 HIN 的异质性。
如图1,stan,musical,Ang Lee是不一样类型的节点,由于musical和Ang Lee的embedding距离很远,会致使stan没法同时和两个embedding同时很近,所以须要学习两个不一样的度量空间,从而stan分别在两个度量空间中与对应的node距离很近。
图 2 异质网络嵌入学习中的不兼容现象
为解决该问题,本文在计算类似度 s 时提出度量向量 μ
该度量向量μ是对不一样类型的关系来进行embedding,g_{uv}是表示u,v之间的边的embedding。经过定义该类似度函数,可以得到基于不一样边类型r的类似度
3. 嵌入 HINs 的边缘表示(HEER)
3.1. 方法思想
经过边缘表示和耦合度量的可用性,获得反应边的存在和类型的损失函数,经过最小化损失,同时更新节点嵌入、边缘嵌入和异构度量,保持输入HIN中的异质性。对不一样的不兼容程度建模,其中两个边缘类型越类似,对应的指标越类似。
- 综合转录 HIN 中的嵌入信息
- 解决 HINs 中的语义不兼容
- 利用边缘表示和异质矩阵
- 使用神经网络学习节点和边的嵌入表示
3.2. 框架结构
图 3 HEER模型框架结构
HIN Embedding 定义
- 以后经过g函数来学习出边的embedding
- 一对节点间可能有多种类型的边,g(u,v) 包含此类关系
- 经过type之间的类似度,也就是定义的类似度函数和原始链接关系共同做为ground truth
- 最后训练出网络参数,从而可以学到网络的嵌入模型
类型接近度
对于每对节点(u,v)的边缘嵌入 guv
μr 为特定类型嵌入表示,兼容的边类型共享类似的 μ
目标函数
( KL 测量元权重和从嵌入表示获得的类似度间的差别)
将(1)代入(2)考虑全部的边类型,获得
4. Experiment
(边缘剔除率为0.4时)
5. 总结
- HEER模型,可以创建异构网络中不一样type之间的不兼容性,这是一种新的尝试,将不兼容的性质提出并经过不一样度量空间来表示。
- HEER模型可以同时学习网络中节点的node embedding和边的edge embedding。
局限性
- 没有考虑更复杂的网络结构信息,而是仅仅经过相邻节点的关系来肯定embedding,更复杂的关系能够经过meta-path来找到,这也可能成为该论文将来的研究方向。
参考:node
KDD'18|异质信息网络嵌入学习git