机器学习：李宏毅深度强化学习笔记（四）Sparse Reward

时间 2021-01-12

标签机器学习 sparse-reward 繁體版

原文原文链接

https://blog.csdn.net/cindy_1102/article/details/87990012 Reward Shaping 当reward的分布非常分散时，对于机器而言学习如何行动会十分困难。比如说要让一个机器人倒水进水杯里，如果不对机器人做任何指导，可能它做很多次尝试，reward都一直是零。（不知道杯子在哪，不知道拿着手上的水壶干嘛，不知道水壶靠近杯子之后应该怎么做）

>>阅读原文<<