LinUCB算法理解

解决的问题 1、UCB的算法context-free: 没有充分利用推荐场景的上下文信息,为所有用户的选择展现商品的策略都是相同的,忽略了用户作为一个个活生生的个性本身的兴趣点、偏好、购买力等因素都是不同的,因而,同一个商品在不同的用户、不同的情景下接受程度是不同的 原理 1、每个arm维护一个特征向量: θ α \theta_{\alpha} θα​ 2、假设 : 每个arm的期望收益为ar
相关文章
相关标签/搜索