bandit算法（3）--UCB算法

时间 2020-12-24

标签 bandit算法 UCB算法繁體版

原文原文链接

引言前面已经介绍了两种bandit算法— ϵ -greedy算法和softmax算法。现在我们来总结下这两种算法的共有属性：两种算法在每一轮选择时，默认都是选择到目前为止最好的臂；除此之外，算法会尝试去探索一些目前看起来不是最好的臂： - ϵ -greedy算法探索的时候完全是随机的。 -softmax算法探索是基于到当前时刻臂的收益概率。收益概率越高，选择的概率越高

>>阅读原文<<

1. bandit算法（3）--UCB算法
2. UCB算法
3. Bandit算法
4. UCB算法升职记——LinUCB算法
5. Context-free Bandit算法
6. bandit算法与EE策略
7. bandit 算法资料大全
8. MAB问题和Bandit算法
9. 算法实习生学习之路--UCB算法
10. Bandit算法与推荐系统
更多相关文章...
• PHP 运算符 - PHP教程
• Scala 运算符 - Scala教程
• 算法总结-广度优先算法
• 算法总结-深度优先算法