美图个性化推荐的实践与探索

时间 2019-11-06

标签个性化推荐实践探索繁體版

原文原文链接

互联网技术将咱们带入了信息爆炸的时代，面对海量的信息，一方面用户难以迅速发现本身感兴趣的信息，另外一方面长尾信息得不到曝光。为了解决这些问题，个性化推荐系统应运而生。美图拥有海量用户的同时积累了海量图片与视频，经过推荐系统有效创建了用户与内容的链接，大幅度提高产品的用户体验。

总览

美图个性化推荐主要应用于美拍APP，应用场景以下：算法

场景一：美拍直播，实时的在线个性化排序业务；
场景二：美拍热门（即美拍首页），典型的Feed流产品，用户可在热门Feed流中不断翻页滚动，探索和消费本身可能感兴趣的内容；
场景三：播放详情页下的“猜你喜欢”模块，用于推荐类似视频。网络

个性化推荐的目标是链接用户与内容、提高用户体验和优化内容生态。为了实现以上目标，算法须要理解内容，了解平台上可用于推荐的内容；同时也要理解用户，了解用户的兴趣爱好，从而进行精准推荐。架构

理解内容

理解内容，即内容的特征提取。美拍APP的内容是短视频，其特征可分为四部分：机器学习

基础特征，即视频的时长、分辨率、标签等基础属性；
视觉特征，即经过视觉算法，对人物的性别、颜值、年龄、身高，对视频的场景、对象等进行识别；
文本特征，美拍短视频有封面文字、标题、评论等文本信息，能够经过这些文本信息进行文本挖掘，提取一些关键字、topic、情感极性等文本特征；
交互特征，是用户与内容进行行为交互的产物，用户能够对某些内容进行点赞、评论、分享、播放等行为，经过对这些交互数据进行统计分析获得交互特征。

理解用户

对内容有必定理解以后，则要进一步理解用户，从而链接用户与内容。理解用户就是咱们常说的用户画像建设，建设用户画像须要了解用户的天然属性，如用户的性别、年龄、所在城市；社会属性，如职业、婚姻情况等；以及最重要的兴趣属性，除了了解用户在平台上的兴趣和偏好，也要尽量去探索用户在平台以外的兴趣爱好（打游戏、逛淘宝等）。函数

个性化推荐探索

推荐时效性
天下武功，惟快不破。美图的用户数量逐步增加，而每一个用户的兴趣点随着场景、时间也在同步发生变化。平台上新的内容源源不断，一个好的内容型产品每每不会错过任何热点。随着大环境的变化，推荐时效性显得尤其重要，对此推荐效果的提高也有很大优化空间。

召回时效性
如图7所示，首先创建一个实时更新的类似视频（I2I）索引；当用户播放视频或对其产生有效行为后，利用此索引，获得对应视频的类似视频进行召回。同时经过收集并分析用户的实时行为，计算用户对不一样内容类型的实时偏好，并实时获取用户对应偏好类型的实时榜单内容，从而得到实时召回的结果；

在引擎部分会融合实时及非实时的召回，并进行预估排序，最终将推荐结果综合呈现给用户。

预估时效性
假设预估模型多天内不更新，其离线评估效果的变化状况以下图所示。很明显，预估模型从次日开始就有大幅度的效用降低，大概一周内会降低至66%左右。根据该图表能够看出，预估的时效性会随着时间迅速降低，因此在预估的时效性上有很大的优化空间。

为了优化预估时效性，咱们选择了在线学习。以下图所示，以训练LR模型为例，左上是LR模型的预估方程和损失函数，在复杂的线上环境中，样本输入是随机的，即从此计算的方向以及步长也是随机的，实如今线学习能够简单采用在线梯度降低方式，可是选择这种简单的优化方式会形成模型更新的不稳定性和模型效用的不稳定性；同时简单的梯度更新方式会使得模型从旧样本学习到的有效信息被遗忘。

FTRL则是一种生成解析解的更新方式，详见左下的方程式，其中有四个项，第一个项保证参数随着梯度方向进行更新；第二个项保证模型的稳定性，使得每次更新的结果不会远离以前的结果；第3、四个项是常见的L1和L2正则约束；如图9右侧所示，为更新过程的伪代码。

以下图所示，基于上述FTRL的在线学习方法，咱们设计了实时特征与在线学习的流程与架构。 Arachnia收集到日志以后，FeatureServer经过Kafka组件获取到实时日志，进行实时特征计算更新特征。TrainServer还会收集用户不一样行为的日志，分正负样本，获得原始样本，再将原始样本与FeatureServer进行交互，索引到对应的特征列表，拼装成模型训练能够直接应用样本，供模型进行更新。

咱们设计基于Parameter Server架构的模型更新，模型更新阶段从Parameter Server获取模型参数，对样本进行预估，计算参数的更新，并将更新结果回流到Parameter Server中。因为在复杂的线上环境中，不一样行为的日志可能会产生不一样程度的延迟，好比在短期内都是正样本或负样本，这种状况下在线学习的稳定性会受到伤害。所以咱们设计了Balance Cache，控制不一样行为日志的消费速度使得样本的正负比例保持稳定。经过这样的架构设计，模型更新及特征更新都实现了秒级别更新。

内容多样性

多样性、准确性以及新颖性是衡量推荐系统效果很是重要的三个指标。同时最大化这三个指标从而给用户带来惊喜，使得用户在平台上留存，是推荐系统的一个终极目标。但在实际状况下，这三个指标每每须要权衡取舍，例如在大多数状况下，提高准确性的同时，推荐多样性指标可能会下降。所以，咱们将问题简化，对多目标问题进行从新建模，在保证必定的多样性和新颖性约束的前提下最大化推荐准确性。

那么，如何保证推荐多样性呢？首先要定义什么内容是同样的，从而知道什么内容是不同的。咱们能够经过运营对视频打标签、经过视觉算法进行视觉分类，而上述几种方法都依赖先验的类目体系，每每没法精确匹配用户时刻变化的细粒度兴趣点。一个UGC平台，其重要特性之一就是内容形态快速更新，有各类各样的创意会发展成小众类别，再从小众类别迅速发展成一个新类别，那么这种基于经验知的有监督方法是没法及时响应变化的，所以考虑利用用户行为序列对内容聚类。

内容聚类

在基于用户行为序列的内容聚类中，假设用户对于兴趣点会产生其行为序列，假设某个用户喜欢小鲜肉和舞蹈，那么基于这个兴趣点，他便会观看较多小鲜肉跳舞的视频。这个问题能够类比文本领域的Topic Model问题，看成者写文章时，须要先肯定文章主题，再基于主题肯定文章中使用到的词。

而对用户兴趣进行建模，咱们采用LDA的方法将用户类比为一篇文章，用户行为序列里的内容类比为文章里的词，那么能够对内容直接利用LDA模型进行聚类，从而匹配到用户兴趣。基于这样的假设，能够采用word2Vec对内容生成向量再进行聚类，也能够基于LDA的深化版本DSSM模型来对内容生成向量。如图19右侧所示，是DSSM方法的网络结构图。

展望

将来美图但愿可以挖掘更多的场景，为用户提供更多的个性化服务，从而全面提高用户的产品体验。咱们也但愿可以经过个性化的迭代与内容生态变化进行推演，从而更全面地优化内容生态，同时经过建设更深层次的模型进行精准推荐，从有监督的学习模型训练向强化学习的方法转变，进而预估推荐算法的指望收益，大幅度提高用户体验。

美图个性化推荐的实践与探索

总览

理解内容

理解用户

推荐流程

个性化推荐探索

推荐冷启动

内容多样性

展望