【深度强化学习】7. 稀疏奖励和模仿学习

时间 2021-06-19

标签深度强化学习入门深度学习自动驾驶强化学习繁體版

原文原文链接

【DataWhale打卡】李宏毅老师视频中的最后两部分，sparse reward和imitation learning。文章目录 1. Sparse Reward 1.1 Reward Shaping 1.2 Curriculum Learning 1.3 Hierarchical RL 2. Imitation Learning 2.1 Behavior Cloning 2.2 Invers

>>阅读原文<<

相关文章

相关标签/搜索

强化学习篇

深度学习 CNN

Python深度学习

Python 深度学习

深度学习篇

Pytorch 深度学习

深度学习——BNN

XLink 和 XPointer 教程

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<