李宏毅深度强化学习笔记(七)Sparse Reward

参考jessie_weiqing博客:http://www.javashuo.com/article/p-xflsdvey-sw.html 李宏毅深度强化学习课程 https://www.bilibili.com/video/av24724071 李宏毅深度强化学习笔记(七)Sparse Reward Reward Shaping 当reward的分布非常分散时,对于机器而言学习如何行动会十分困难
相关文章
相关标签/搜索