Cascade bandit 和DCM bandit

摘要   当用户在搜索引擎上查询感兴趣的条目时,通常得到一个包含相关网页链接的列表。用户从第一个网页链接开始,浏览所有的感兴趣的链接并点击,直至得到想要的结果或者是最后一个链接为止。这种用户浏览行为称为dependent click model(DCM)。论文通过最大化推荐的网页链接推荐满意度,向用户推荐最合适的网页链接。在此报告中,先介绍与论文相关的多臂赌博机问题(multi-armed ban
相关文章
相关标签/搜索