李宏毅机器学习系列-强化学习之模仿学习

时间 2020-01-16

标签机器学习系列强化模仿繁體版

原文原文链接

李宏毅机器学习系列-强化学习之模仿学习模仿学习行为复制(Behavior Cloning) 逆向强化学习(Inverse Reinforcement Learning (IRL)) 第三人称模仿学习：总结模仿学习模仿学习就是根据演示来学习，不少时候咱们的任务没办法定义奖励，可是咱们能够收集不少的数据给机器去学习，方法通常有两种，一种叫行为复制，一种叫逆向强化学习： web 行为复制(Be

>>阅读原文<<