Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 论文翻译

文章目录 论文原文链接 摘要 INTRODUCTION 相关工作 背景 剖析利用 β \beta β-变分自编码器进行状态表示学习的方法 实验环境设置 没有辅助任务的model-free off-policy RL 应用 β \beta β-自编码器进行交替式的表示学习 β \beta β-自编码器端到端学习的尝试 我们的方法 在像素上的性能 简化实验 编码器产生的表示的能力 泛化到没有见过的任务
相关文章
相关标签/搜索