Lee Hung-yi强化学习 | (8) Imitation Learning

时间 2021-01-02

标签 Lee Hung-yi强化学习繁體版

原文原文链接

Lee Hung-yi强化学习专栏系列博客主要转载自CSDN博主 qqqeeevvv，原专栏地址课程视频课件地址上一篇笔记讲了reward很稀疏的情况，但是在实际中，可能问题还会更进一步：很多场景是很难有一个明确的reward甚至没有reward。所以需要很厉害的agent或者直接由人来示范的资料/数据，让agent跟着做。本文会讲两个Imitation Learning的方法： 1）Be

>>阅读原文<<