8.Imitation Learning模仿学习(李宏毅)

1.简介 模仿学习有人又称为学徒制学习,示范学习,但又有人觉得只有逆向强化学习才能称为学徒制学习。示范学习就是人类示范给机器,让机器去模仿学习。 不同于加强学习,在模仿学习中,机器可以与环境互动,但并不会得到Reward,因此模仿学习并非受到Reward影响,主要还是受到专家展示启发。 使用模仿学习的主要几点原因: Reward不好定义 如果手工制作的奖励可能会造成无法控制的行为,考试要100分是
相关文章
相关标签/搜索