RL论文阅读6 - MB-MPO2018

文章目录 Tittle 标签 总结 针对问题: 解决思路 原理 1. 前序工作简介:Meta-Learning for RL **2. MPO原理** (1)模型学习: (2)Meta-RL 应用在学习的模型上 3. 算法 Tittle source 标签 Meta-learning Model-based 总结 针对问题: data inefficient MB算法过于依赖模型的准确率,如果模型
相关文章
相关标签/搜索