Paper-2 精读GPS (2014 NIPS)

Guided Policy Search 概述 一、 GPS的基础知识 1.1 MBRL的Model已知 1.1.1 确定的dynamics model 1.1.2 随机的dynamics model 1.2 学习Model 1.3 Unknown Dynamics 1.3.1 Run the controller (policy) 1.3.2 Fitting dynamics 1.3.3 Imp
相关文章
相关标签/搜索