DRL(一)——Supervised Learning and Imitation

写在前面 今天开始学习DRL了,其实RL还没完全看完…… 大概总结一下 感觉这节课讲的内容是比较初级的一些方法,从标题就看得出来,Supervised Learning,和 Imitation。 教授先是讲了imitation,就是通过人类的training,建立data,然后智能体用这个data来模仿。这样当然有很多问题,比如training中的情况可能不会包含所有的情况,总是会有新的情况出现;
相关文章
相关标签/搜索