Improving Sample Efficiency In Model-Free Reinforcement Learning From Images 论文翻译

时间 2021-01-07

原文原文链接

文章目录论文原文链接摘要 INTRODUCTION 相关工作背景剖析利用 β \beta β-变分自编码器进行状态表示学习的方法实验环境设置没有辅助任务的model-free off-policy RL 应用 β \beta β-自编码器进行交替式的表示学习 β \beta β-自编码器端到端学习的尝试我们的方法在像素上的性能简化实验编码器产生的表示的能力泛化到没有见过的任务

>>阅读原文<<