李宏毅机器学习系列-强化学习之模仿学习

李宏毅机器学习系列-强化学习之模仿学习 模仿学习 行为复制(Behavior Cloning) 逆向强化学习(Inverse Reinforcement Learning (IRL)) 第三人称模仿学习: 总结 模仿学习 模仿学习就是根据演示来学习,不少时候咱们的任务没办法定义奖励,可是咱们能够收集不少的数据给机器去学习,方法通常有两种,一种叫行为复制,一种叫逆向强化学习: web 行为复制(Be
相关文章
相关标签/搜索