2019年伯克利大学 CS294-112《深度强化学习》第2讲:监督学习和模仿学习(笔记)

今天的课程中,我们将讨论模仿学习。我们首先来讲序列决策问题的定义。我们将从一般的监督学习讲到序列决策。我们将会讲解如何设定一个模仿学习问题?它本质上是对决策问题的监督学习。我们将会讨论直接模仿是否有效?它何时有效何时无效?以及我们如何使它能更频繁地有效等等。作为总结,我们将会讲解最近的相关工作,关于深度模仿学习、使用模仿学习来从图片中学习技能。最后如我们有足够的时间,我们将稍微讲解一下理论知识,分
相关文章
相关标签/搜索