李宏毅深度强化学习笔记（七）Sparse Reward

时间 2021-01-16

原文原文链接

参考jessie_weiqing博客：http://www.javashuo.com/article/p-xflsdvey-sw.html 李宏毅深度强化学习课程 https://www.bilibili.com/video/av24724071 李宏毅深度强化学习笔记（七）Sparse Reward Reward Shaping 当reward的分布非常分散时，对于机器而言学习如何行动会十分困难