RL论文阅读5 - RWMFPE 2018

时间 2021-01-12

标签强化学习RL 人工智能繁體版

原文原文链接

Tittle source 标签 Model Based 总结提出了一个新的Model-Based学习的框架。如图：这个模型一共分成三个部分： V：用来将输入的图片编码成z。学习图像的抽象表示。 M：用来预测未来的z。M生成的是z的概率密度而不是直接生成z向量。 C：根据M产出的h和V产出的z，生成一个动作a。C一般是一个简单线性的。在训练时：先训练V，然后用V的产出训练M，最后整合训练C

>>阅读原文<<

1. RL论文阅读2-I2A.2018
2. RL论文阅读7 - MAML2017
3. RL论文阅读8-mb-ME-TRPO2018
4. RL论文阅读11-me-SNAIL2018
5. RL论文阅读21-MB-PILCO2011
6. RL论文阅读14-MB-PETS2018
7. RL论文阅读9-mb-MBMF2017
8. RL论文阅读13-mf-ACER2017
9. RL论文阅读12-mf-HER2017（更新）
10. RL论文阅读10-me-RL2.2016
更多相关文章...
• RSS 阅读器 - RSS 教程
• C# 文本文件的读写 - C#教程
• JDK13 GA发布：5大特性解读
• Scala 中文乱码解决