论文笔记-Learning Latent Dynamics for Planning from Pixels

Learning Latent Dynamics for Planning from Pixels 1 介绍 输入图像经过编码网络(灰色梯形)变成隐藏状态(绿色),然后隐藏状态可以被映射成奖励和图片。 为了预演,我们将当前图片经过编码网络变成当前隐藏状态变成绿色,然后进行各个序列的虚拟预测,计算各个序列的奖励,最后返回最好序列的第一个action执行 2 算法 Deep planning net
相关文章
相关标签/搜索