DeepMind强化学习综述:快速和缓慢的强化学习

背景算法 近年来,深度强化学习(RL)方法在人工智能方面取得了使人瞩目的进步,在从Atari到Go到无限制扑克等领域都超过了人类的表现。微信 这一进展引发了对了解人类学习感兴趣的认知科学家的关注。可是,人们一直担忧,深层RL可能过低样本效率-也就是说,它可能太慢-没法为人类学习提供一个合理的模型。网络 在本综述中,做者经过描述最近开发的技术来反驳这种批评,这些技术使深层RL可以更灵活地运行,比之前
相关文章
相关标签/搜索