DeepMind强化学习综述:快速和缓慢的强化学习

背景 近年来,深度强化学习(RL)方法在人工智能方面取得了令人瞩目的进步,在从Atari到Go到无限制扑克等领域都超过了人类的表现。 这一进展引起了对了解人类学习感兴趣的认知科学家的关注。但是,人们一直担心,深层RL可能太低样本效率-也就是说,它可能太慢-无法为人类学习提供一个合理的模型。 在本综述中,作者通过描述最近开发的技术来反驳这种批评,这些技术使深层RL能够更灵活地运行,比以前的方法更快地
相关文章
相关标签/搜索