2019年伯克利大学 CS294-112《深度强化学习》第2讲：监督学习和模仿学习（笔记)

时间 2021-01-01

原文原文链接

今天的课程中，我们将讨论模仿学习。我们首先来讲序列决策问题的定义。我们将从一般的监督学习讲到序列决策。我们将会讲解如何设定一个模仿学习问题？它本质上是对决策问题的监督学习。我们将会讨论直接模仿是否有效？它何时有效何时无效？以及我们如何使它能更频繁地有效等等。作为总结，我们将会讲解最近的相关工作，关于深度模仿学习、使用模仿学习来从图片中学习技能。最后如我们有足够的时间，我们将稍微讲解一下理论知识，分

>>阅读原文<<