推荐算法-余弦类似度

1、余弦类似度:算法

余弦值越接近1,就代表夹角越接近0度,也就是两个向量越类似,这就叫"余弦类似性"spa

二维向量的余弦类似度:3d

多维向量的余弦类似度(类比)blog

 

协同过滤(Collaborative Filtering, 简称 CF):it

  • 收集用户行为
  • 减噪与归一化处理
  1. 减噪:用户行为数据是用户在使用应用过程当中产生的,它可能存在大量的噪音和用户的误操做,咱们能够经过经典的数据挖掘算法过滤掉行为数据中的噪音,这样能够是咱们的分析更加精确
  2. 归一化:将各个行为的数据统一在一个相同的取值范围中,从而使得加权求和获得的整体喜爱更加精确。

2、基于物品的协同过滤推荐算法(itemCF):数据挖掘

算法思想:给用户推荐那些和他们以前喜欢的物品类似的物品class

用户行为与权重:点击-一、搜索-三、收藏-5 、付款-10file

用户 A、B、C搜索

商品 1、2、3、4、5、6im

  • 根据用户行为列表计算用户、物品的评分矩阵
  • 根据用户、物品的评分矩阵计算物品、物品的类似矩阵 
  • 类似度矩阵x评分矩阵=推荐列表
  • 推荐列表中用户以前已经有过行为的元素置为0

3、基于用户的协同过滤推荐算法(UserCF)

算法思想:给用户推荐和他兴趣类似的其余用户喜欢的物品

用户行为与权重:点击-一、搜索-三、收藏-5 、付款-10

用户 A、B、C、D、E、F  

商品 1、2、3、4、5、6

  • 根据用户行为列表计算物品、用户的评分矩阵
  • 根据物品、用户的评分矩阵计算用户、用户的类似矩阵
  • 类似度矩阵X评分矩阵=推荐列表
  • 将推荐列表中用户已有行为的元素置0

4、基于内容推荐算法

算法思想:给用户推荐和他们以前喜欢的物品在内容上类似的其余物品

1表示电影具备某个特征  0表示电影不具备某个特征

物品特征建模:Item Profile

  • 构建Item Profile矩阵(电影的特征项矩阵)
  • 构建Item User评分矩阵(用户电影的评分矩阵)
  • Item User x Item Profile = User Profile (用户对电影的喜好程度)
  • 对Item Profile和User Profile求余弦类似度

5、基于物品的协同过滤推荐算法(itemCF)说明:

一、根据用户行为列表计算用户、物品的评分矩阵

 

二、根据用户物品的评分矩阵计算物品、物品的类似矩阵

三、类似度矩阵x评分矩阵=推荐列表

四、推荐列表中用户以前已经有过行为的元素置为0

相关文章
相关标签/搜索