推荐系统的EE问题及Bandit算法

E&E问题简介 问题描述 条件:假设我们有K个准备推荐的item,每个item的回报的服从不同的概率分布p_item,且分布参数未知 目标:如果有T次机会推荐,如何制定决策过程从而获取最大的累积回报 See also:多臂赌博机问题(Multi-armed bandit problem, K-armed bandit problem, MAB) 表现形式 随机式(stochastic bandit
相关文章
相关标签/搜索