DRL(一)——Supervised Learning and Imitation

时间 2021-01-02

原文原文链接

写在前面今天开始学习DRL了，其实RL还没完全看完…… 大概总结一下感觉这节课讲的内容是比较初级的一些方法，从标题就看得出来，Supervised Learning，和 Imitation。教授先是讲了imitation，就是通过人类的training，建立data，然后智能体用这个data来模仿。这样当然有很多问题，比如training中的情况可能不会包含所有的情况，总是会有新的情况出现；