RL稀疏奖励问题

时间 2021-01-16

原文原文链接

强化学习中状态空间大，在只有达到特定的状态才能给出奖励的设定下，agent很难探索到特定状态，怎么办？稀疏奖励问题是指agent探索的过程中难以获得正奖励，导致学习缓慢甚至无法进行学习的问题，并且广泛存在于现实中，比如围棋，人们很难去设定中间每步的奖励，并且状态空间巨大，使用全局奖励会有奖励稀疏且滞后的问题。对于稀疏奖励问题的资料首先推荐李宏毅老师关于稀疏奖励部分的讲解和国内这篇稀疏奖励综述。

>>阅读原文<<

1. 奖励稀疏_好奇心解决稀疏奖励任务
2. 深度强化学习中稀疏奖励问题Sparse Reward
3. 强化学习打卡之稀疏奖励和模仿学习
4. 如何解决稀疏奖励下的强化学习？
5. 【深度强化学习】7. 稀疏奖励和模仿学习
6. 稀疏
7. 数据稀疏问题(data sparseness)
8. 深度强化学习-稀疏奖励及模仿学习-笔记（七）
9. 稀疏矩阵习题
10. 稀疏数组
更多相关文章...
• Markdown 标题 - Markdown 教程
• jQuery Mobile 主题 - jQuery Mobile 教程
• PHP Ajax 跨域问题最佳解决方案
• IntelliJ IDEA中SpringBoot properties文件不能自动提示问题解决