机器学习算法学习---推荐系统的经常使用算法(一)

归纳分类:
1) 基于内容的推荐:这一类通常依赖于天然语言处理NLP的一些知识,经过挖掘文本的TF-IDF特征向量,来获得用户的偏好,进而作推荐。这类推荐算法能够找到用户独特的小众喜爱,并且还有较好的解释性。这一类因为须要NLP的基础,本文就很少讲,在后面专门讲NLP的时候再讨论。

2)协调过滤推荐:本文后面要专门讲的内容。协调过滤是推荐算法中目前最主流的种类,花样繁多,在工业 界已经有了不少普遍的应用。它的优势是不须要太多特定领域的知识,能够经过基于统计的机器学习算法来获得较好的推荐效果。最大的优势是工程上容易实现,可 以方便应用到产品中。目前绝大多数实际应用的推荐算法都是协同过滤推荐算法。html

3)混合推荐:这个相似咱们机器学习中的集成学习,博才众长,经过多个推荐算法的结合,获得一个更好的 推荐算法,起到三个臭皮匠顶一个诸葛亮的做用。好比经过创建多个推荐算法的模型,最后用投票法决定最终的推荐结果。混合推荐理论上不会比单一任何一种推荐 算法差,可是使用混合推荐,算法复杂度就提升了,在实际应用中有使用,可是并无单一的协调过滤推荐算法,好比逻辑回归之类的二分类推荐算法普遍。算法

4)基于规则的推荐:这类算法常见的好比基于最多用户点击,最多用户浏览等,属于大众型的推荐方法,在目前的大数据时代并不主流。网络

5)基于人口统计信息的推荐:这一类是最简单的推荐算法了,它只是简单的根据系统用户的基本信息发现用户的相关程度,而后进行推荐,目前在大型系统中已经较少使用。机器学习

一、概念学习

协同过滤包括在线的协同和离线的过滤。在线协同是指经过在线数据找到用户可能喜欢的物品;离线过滤是指过滤掉一些不值得推荐的数据。大数据

 

咱们的问题是这样的m个物品,m个用户的数据,只有部分用户和部分数据之间是有评分数据的,其它部分评分是空白,此时咱们要用已有的部分稀疏数据来预测那些空白的物品和数据之间的评分关系,找到最高评分的物品推荐给用户。 

 

分类:htm

(1)基于用户的协同过滤。考虑用户之间的类似度,经过类似用户得到评价高分物品,将其推荐给目标用户。blog

(2)基于项目的协同过滤。考虑物品之间的类似度,经过目标用户对某些物品的评分,将类似物品推荐给他。get

(3)基于模型的协同过滤。目前最主流的,下面详细介绍。产品

二、基于模型的协同过滤

 

用机器学习的思想来建模解决,主流的方法能够分为:用关联算法,聚类算法,分类算法,回归算法,矩阵分解,神经网络,图模型以及隐语义模型来解决。

详情可见:

http://www.javashuo.com/article/p-bkloqygg-kq.html

相关文章
相关标签/搜索