(翻译)腾讯双图网络

题目:在推荐系统中对社交属性的深度表达来应用双图attention网络

论文地址:https://arxiv.org/pdf/1903.10433.pdf

 

ABSTRACT

社交推荐利用社交信息来解决传统协作过滤中的稀疏性和冷启动问题方法。但是,大多数现有模型都假设社会影响来自朋友用户的信息是静态的并且处于恒定权重的形式下或固定约束。为了减轻这个强有力的假设,在本文中,我们提出了双图attention网络来进行协作学习两种社交效果的影响程度,其中一个是建模user-attention权重,另一个由动态和上下文感知的权重。我们还扩展了user领域中的社会效应到item领域,因此可以利用相关iten中的数据来进一步缓解数据稀疏问题。此外,考虑到不同的社会两个域中的实体可以相互影响,由于用户对商品的偏好,我们提出了一项新的基于策略的建议 + 基于上下文多层的融合策略来权衡各种社会影响的相互作用。在一个基准上进行实验数据集和商业数据集验证了我们模型中关键组件的有效性。结果表明,我们的模型可以实现与其他最新的社交推荐方法相同的准确率。

 

1 INTRODUCTION

推荐系统,旨在对用户的潜在兴趣进行过滤和推荐,具有广泛的应用并且可以带来大量的商业利益,尤其是在信息过载问题普遍存在的情况下和万维网的快速发展。 推荐人使用的常规协作筛选(CF)方法会遇到数据稀疏和冷启动问题。 为此,社交推荐可以避免利用用户的社交网络合并了更多有用的信息,已建议减轻这两个问题[5,12,18,19]。

 

以前作品和局限性 如今有很多集成了项目推荐和社交网络服务(SNS)的复合平台。 这些平台上的用户可以单击或为商品评分并与朋友互动。 用户对一件物品的偏好可能会受到她的朋友的影响,这激励了我们探索这种社会效应以提高推荐质量。先前的社会推荐研究无法建立社会模型以各种方式产生影响,例如通过信任传播[5,12,21],正则化损失[19,38],矩阵分解[8,17,36],网络嵌入[16、32、41]和深度神经网络[4、31]。

 

 

图1:用户社交网络中的两种社交效应(即同形效应和影响效应)的图示以及相关项目之间的图示。 这4种社交的关系共同影响了用户对item的决定。

 

但是,这些研究有几个共同的局限性。 第一,大多数研究假设相关的用户具有相似的偏好。这个假设不适合当代SNS,因为有各种类型的在线朋友,例如密友,休闲朋友和活动朋友[42]。 因此,直接把社交网络上的关系都看做相同权重是不合适的。其次,大多数作品会静态模拟朋友的影响。 这种假设忽略了社会效应的动态信息。 实际上,用户可能是在特定人群中受到一群特定朋友的影响项目,这使得社会影响是动态的,并依赖于具体环境。 第三,以前的方法缺乏可解释性对于社交影响,即它们无法明确指出用户的他们的朋友影响了对一项物品的偏好。

 

动机和理由 在现实世界中,人们的决定可能会受到各种因素及其行为的影响是多方面原因的结果。为此,我们探讨推荐系统中分为四个不同的社会影响,包括用户域中的两个影响,item域的两个影响,如图1所示。在用户域中,朋友可以通过两种方式相互影响。一方面,用户倾向于与朋友有相似的喜好,这被称为“社交同质”[23](图1.(a))。社会同质性经常会对用户导致固有的影响:不变+独立。另外,某位用户的朋友购买了一个item,可能会推荐给该用户,该用户可能会点击此个item,称为“社交影响”[20](图1.(b))。实际上,社会影响导致的影响,可能会随特定上下文而动态变化。例如,一个商业分析师可能会由不同的朋友(这些朋友会被娱乐新闻或商业新闻而影响)而有着不一样的分析结果。 因此,我们可以区分两个可能会影响用户偏好的情况:来自“社交同质”的静态效果、来自“社会影响”的动态效应,我们将相应用户的偏好称为静态和动态偏好(图1的部分)。

 

此外,在item中,存在类似的“社会效应”。一方面,某些相关item在暴露给用户时往往具有类似的性质。我们称这种是“item同质”(图1.(c)),这些是由用户的静态属性决定的。另一方面,如果在某个社区中某个item很受欢迎,其他相关项目将变成更有可能被该社交组中的用户点击的对象,这种现象可以称为“item影响”,具体取决于在特定情况下(图1.(d))。例如,一位商人和一位研究员都读了一篇关于人工智能的文章,但商人更喜欢另一篇关于金融的文章人工智能公司的信息,而研究人员倾向于点击在另一篇有关AI前沿突破的文章,我们称这种为动态影响。最后,如图1中的1〜4所示。用户域和项目域中的影响可能会共同产生影响用户对一项商品的决定。这种现象普遍存在Epinion,TwiŠer,Facebook和Netƒix等

 

方法与结果 为此,在本文中,我们提出DANSER(Dual graph Attention Networks for modeling multifaceted Social Eects in Recommender systems),在里面用到了GAT。DANSER由两个gats图构成,一个是user-gat,里面由两个gat组成,分别描述用户的同质、影响,另一个是item-gat,在用户域中,一个用于捕获社交同质性的GAT主动汇总了反映用户偏好的相邻用户的嵌入,并且输出用户静态特征的embedding。 另一个GAT会捕捉社交影响力,目的在于卷积相邻用户的上下文相关的一些属性,它表征了user和候选item的相关性,并输出用户的动态偏好embedding。 在item域中,两个类似的GAT作为双重架构旨在模拟物品的静态和动态在项间同质和影响的影响下,在相关项目之间。 这种双重机制具有两个优点:i)捕获同质性和影响力的GAT可以利用以下优势,对两个社会效应进行协作建模全局和局部视图,以调查用户项交互;ii)项目域中的两个GAT合并了来自相关领域的信息项目,可以进一步缓解数据稀疏性问题

 

因为user和item静态特征(静态也可以换成动态)可以共同影响一个用户在某个item上的行为。而且这4种行为在不同的user-item对上还有不一样的权重,所以我们提出来一个策略,来动态给这4个行为进行加权。我们把这个问题看成是一个上下文问题,并且把加权问题看成是一个有条件的策略。然后我们的问题就变成了优化损失。在模型训练过程中,我们使用随机策略梯度来更新我们基于神经网络的策略单元,并设计一个局部图感知的正则化来减少计算成本。 为了验证我们的模型,我们对来自Epinions的一个基准数据集进行实验,以及来自WeChat Top Story的商业数据集进行试验。结果表明,DANSER的性能优于最新模型在明确的反馈意见下(MAE改善了2.9%)和隐式反馈(增加4.5%的AUC)。

 

我们的贡献可以总结成下面这几点

i)一般方面:我们区分社会同质性、影响性;考虑静态、动态影响的社会影响力概念。 我们将用户领域中的两种社交效应扩展到项目领域,因此在推荐者中研究了四种社交效应系统。 这些一般方面使模型可以捕获更多信息信息并提高其能力。

ii)新颖的方法:我们提出了 DANSER,具有两个双重GAT和一个政策单元。 我们是第一个在社交推荐任务使用GAT的人,双重GAT可以在用户和项目领域中共同对四个社交效果进行建模。政策单位基于上下文,动态权衡两个领域中社会效应的四个相互作用根据具体情况。

iii)多方面的实验:我们将DANSER部署到一个基准数据集和商业数据集。 实验结果证明了DANSER相对于最新技术的优越性,所提出组件的有效性以及它的优点对社会效应进行建模具有良好的可解释性。

 

2简单介绍和背景介绍

在这篇文章中,我们首先整理出来一个user-item的交互矩阵R = {rui}M*N,M和N分别是user和item的总数。对于一个有隐式反馈的推荐系统,R由0 1组成,1代表用户点击了item,0代表没点击。对于显示反馈的系统,rui就是u对i的打分了(取值范围是1~5,越大代表越满意,0代表没有打分)。

RI(u)代表u用户打分过的item集合,RU(i)代表对i这个item打分过的用户集合。

我们假设用户之间的友谊网络存在信任,是一个图GU = (Vu,Eu),Vu是所有的用户集合,Eu是所有用户之间的边。Fu代表u用户的邻居用户,我们建议将u v两个用户之间的交互频率e(uv)也作为一个特征,代表着两个用户的连接程度。

问题表述:社交推荐任务可以定义为下面这样,给交互关系R(user和item之间),再给社交关系GU,我们来寻找在R中还没有过交互的u i之间的可能交互程度,也就是预测u点击未点击过的i的概率(为了隐式反馈),或者是u对i的打分(为了显式反馈)

未完待续(后面几天会持续更新)...