推荐系统:算法概述


现在,许多公司都会开发与本身业务息息相关的推荐系统。先荐做为第四范式研发的一款智能推荐产品,已为内容行业的众多媒体客户赋能,实现客户的营收增加。在本文中,咱们将会简要介绍现有的主要推荐算法及其工做原理。算法

协同过滤

协同过滤(CF)是最经常使用的推荐算法之一,即便推荐系统小白也能够轻松上手,用它来构建属于本身的我的电影推荐系统。微信

当咱们想向用户推荐某些内容时,最合乎逻辑的作法是找到与这个用户兴趣类似的其余用户,分析他们的行为,而后向咱们的用户推荐相同的物品。或者咱们能够查看用户的历史行为,推荐与它们相似的物品。网络

以上就是CF中的两种基本方法:基于用户(user-based)的协同过滤和基于项目(item-based)的协同过滤。运维

“最类似”在算法中意味着什么?

已知每一个用户的偏好向量(矩阵R的每一行)和每一个产品的用户评级向量(矩阵R的每一列)。函数

首先,只留下已知的两个向量的值。post

其次,假设要比较Bill和Jane这两位用户,从图中能够看到,用户Bill没有看过《泰坦尼克号》,用户Jane也没看过《蝙蝠侠》,因此咱们只能经过《星球大战》来测量两者之间的类似性。至于类似性,通常会采用余弦类似性或用户/项目矢量之间的相关性来测量。性能

最后一步,根据用户类似度,采用加权算术平均值填充表格中的空白单元格。学习

推荐中的矩阵分解

另外一种方法是使用矩阵分解,这种推荐算法相对更“优雅”。通常来讲,当涉及到矩阵分解时,不会过多考虑哪些项目将保留在结果矩阵的列和行中。使用这种推荐算法,咱们能够看到,u是第i个用户的兴趣向量,v是第j部电影的参数向量。google

所以,能够把u和v的点积近似为x(从第i个用户到第j个电影的等级),用已知的分数构建向量并用它们来预测未知等级。人工智能

例如,在矩阵分解后,咱们获得用户Ted的矢量(1.4, 0.9)和电影A的矢量(1.4, 0.8),以后只要计算矢量(1.4, 0.9)和(1.4, 0.8)的点积,就能获得A-Ted的等级,结果是2.68。

聚类

之前的推荐算法至关简单,这样的算法一般适用于小型的推荐系统。那么想象一下,咱们正在建一个大型推荐系统,在这个系统中,协同过滤和矩阵分解会花很长时间。这时候咱们应该作的第一件事就是聚类。

在业务开始时,缺少用户以前的评分,聚类是最好的方法。

在数据足够多的时候,最好使用聚类做为协同过滤中缩小相关选择的第一步。除此此外,聚类还能够改善复杂推荐系统的性能。

每一个群集分别表明一类典型的用户,基于用户群集中用户的兴趣画像,群集中的用户也会收到对应的推荐结果。

推荐中的的深度学习方法

在过去的10年中,神经网络技术取得了巨大的进步。如今,神经网络被普遍地应用于各个领域,并逐渐取代传统的ML方法。接下来咱们就分析一下YouTube是如何使用深度学习方法的。

毫无疑问,因为用户规模大、动态语料库和各类不可控的外部因素,为这样的业务场景搭建推荐系统是一项很是具备挑战性的任务。

据相关研究Deep Neural Networks for YouTube Recommendations,YouTube推荐系统算法由两组神经网络组成:一组用于候选生成,一组用于排序。如下是这项研究的主要内容:

将用户的历史事件做为输入,经过候选生成网络显著减小视频量,而后从大型语料库中建立一组最相关的视频。

生成的候选者与用户相关性最高,以后预测候选者的等级。该网络的目的是经过协同过滤提供个性化推荐。

在此步骤中会有少许与用户类似的候选者。接下来咱们须要越加仔细地分析这些候选者,以便作出最好的决策——该任务由排序网络完成。

排序网络能够根据目标函数为每一个视频打分,该目标函数使用的是描述视频的数据和与用户行为相关的信息。打分最高的视频会按分数排序,呈现给用户。

通过以上这两个步骤,咱们能够实现把庞大的视频集精准推荐给用户的操做,同时确保少数视频还是个性化推荐。

文章来源:Recommendation System Algorithms

以上内容由第四范式-先荐编译。

相关阅读:


推荐系统的工做流程

白话推荐系统

想要了解推荐系统?看这里!(2)——神经网络方法

想要了解推荐系统?看这里!(1)——协同过滤与奇异值分解

AutoML如何实现智能推荐系统的自动上线和运维?

入门推荐系统,你不该该错过的知识清单

如欲了解更多,欢迎搜索并关注先荐微信公众号(ID:dsfsxj)

本帐号为第四范式智能推荐产品先荐的官方帐号。帐号立足于计算机领域,特别是人工智能相关的前沿研究,旨在把更多与人工智能相关的知识分享给公众,从专业的角度促进公众对人工智能的理解;同时也但愿为人工智能相关人员提供一个讨论、交流、学习的开放平台,从而早日让每一个人都享受到人工智能创造的价值。

相关文章
相关标签/搜索