RL论文阅读9-mb-MBMF2017

文章目录 1. Tittle 2. 标签 3. 总结 3.1 针对问题 3.2 解决办法 4. 原理 4.1 神经网络动力学模型 4.2 模型的训练 4.3 MB-MF整合 1. Tittle source 2. 标签 Model-Based 3. 总结 3.1 针对问题 model free算法的data efficiency 低 3.2 解决办法 使用深度神经网络表示的环境动力学模型来初始化m
相关文章
相关标签/搜索