原论文在UMAP'16。文章并无过高深的模型,比较接地气;但其观点与结论很独到,而且在工业界具备很强的实际操做价值。session
针对推荐系统的研究大多关注在挖掘用户并不知道可是却与其兴趣相关的物品。不过每一个推荐系统所在的领域都有其各自的特色,本文所讨论的是电商领域的推荐系统,在电商领域中,给用户适当地推荐其过去曾经浏览过(或者消费过)的物品(reminders)一样具备必定的价值。网站
实验证实,在推荐结果中同时包含有reminders以及协同过滤(CF)等推荐方式的结果时,具备最好的效果。可是在推荐reminders时候也有不少须要改进的点:(1)如何避免太过明显的重复浏览的商品,避免已经无效商品(下架等);(2)如何推荐与用户当前购物需求相关的reminders。3d
首先,文章分析了用户对于电商网站的推荐内容中的reminders的接受度。以Zalando网站(一家欧洲的在线购物网站)为例,抽样了3000个重度用户,他们对18w+的商品有过310w量级左右的商品浏览记录,以及10w+的购买记录。对于这些用户,从日志中分析出有一下几个重要点:日志
1. 一个用户的购物session中平均有9次商品的浏览行为;平均每3次购物session会转化为一次购买行为。blog
2. 在推荐的商品中,有约1/10的商品是reminders,即用户以前已经浏览过这些商品;有约1/4的推荐列表中包含有至少一个reminders。排序
3. 在成功推荐的商品(在同一次session中,用户对该商品的点击浏览行为最终转化为购买行为)中,有约40%的商品为reminders。rem
4. 在用户最终转化成购买行为的reminders中,用户对这些商品在此前有过若干次的浏览行为。以下图所示:有成功推荐商品数与用户距离对该商品首次浏览时候的天数间隔的关系;以及成功推荐商品数与用户对该商品的浏览次数的关系。get
5. 在一次购物session中,用户平均浏览的商品类目约为2.7个,说明用户在一次session中的意图仍是比较有目的性的。it
reminders的推荐策略io
一个通用的流程是:
1. 获取用户在过去时间内有过浏览行为的商品集合,并从中筛选出哪些商品能够用做reminders。
2. 对这些reminders进行必定规则的过滤,并进行排序获得最终的reminders推荐结果。
排序的策略有:
1. Interaction Recency(IRec)
对某商品的浏览行为发生的时刻越接近,排序分越高。
2. Interaction Intensity(IInt)
对某商品的浏览行为发生的次数越多,排序分越高。
3. Item Similarity(ISim)
有过浏览行为的商品,与当前用户的购物意图(以当前实时浏览的商品来表示)越接近,排序分越高。
4. Session Similarity(SSim)
有过浏览行为的session,与当前用户的购物意图(以当前实时浏览的session来表示)越接近,排序分越高。而后再对排序较高的session中的商品进行IInt策略的重排序。
Feature-based Category Filtering
在电商领域,用户通常不多对相同类目下的商品进行重复购买,因此至少在必定时间间隔内,不该该给用户推荐与其以前已经购买过的商品属于相同类目的商品。
维护一个blacklist,对用户已经购买过的商品,将其类目加入到这个blacklist中,直至其又从新开始浏览该类目的商品再将其移出blacklist。
为了防止推荐商品太过于obvious,增长一个obvious gap的时间间隔,对于与当前时刻过近的时间段内用户浏览过的商品 ,咱们不该当将其看做reminders。
版权声明:
本文由笨兔勿应全部,发布于http://www.cnblogs.com/bentuwuying。若是转载,请注明出处,在未经做者赞成下将本文用于商业用途,将追究其法律责任。