论文阅读笔记《One-Shot Imitation Learning》

基本思想   模仿学习,顾名思义就是机器人通过模仿示教动作(Demonstration)从而学会完成某项任务的过程,这里包含几个重要的概念:状态(State, S t S_t St​),动作(Action, A t A_t At​),示教动作(Demo)和策略(表现为神经网络的参数 θ \theta θ),模仿学习就要利用神经网络实现根据当前的状态,示教动作和学习策略得到要执行的动作, A t =
相关文章
相关标签/搜索