【深度强化学习】7. 稀疏奖励和模仿学习

【DataWhale打卡】李宏毅老师视频中的最后两部分,sparse reward和imitation learning。 文章目录 1. Sparse Reward 1.1 Reward Shaping 1.2 Curriculum Learning 1.3 Hierarchical RL 2. Imitation Learning 2.1 Behavior Cloning 2.2 Invers
相关文章
相关标签/搜索