【论文笔记】Deep Reinforcement Learning for Page-wise Recommendations

时间 2021-01-02

标签强化学习推荐系统论文繁體版

原文原文链接

1、Introduction 这里主要介绍了：强化学习是可以根据用户实时的反馈，捕捉用户的动态喜好，，实时更新策略（policy），还能实现长期收益的最大化。与其他不同的是，这里是生成一个网页的物品（网页版商城），是2D的，而不是1D的流式推荐（手机版商城）。（ps：对于手机用户来说，一般用户最关注的是第一个商品，把他最感兴趣的放在第一个就好了，但是对于页面来说，很难说用户最喜欢关注哪个地方

>>阅读原文<<