DeepMind强化学习综述:快速和缓慢的强化学习

时间 2020-01-25

原文原文链接

背景算法近年来，深度强化学习（RL）方法在人工智能方面取得了使人瞩目的进步，在从Atari到Go到无限制扑克等领域都超过了人类的表现。微信这一进展引发了对了解人类学习感兴趣的认知科学家的关注。可是，人们一直担忧，深层RL可能过低样本效率-也就是说，它可能太慢-没法为人类学习提供一个合理的模型。网络在本综述中，做者经过描述最近开发的技术来反驳这种批评，这些技术使深层RL可以更灵活地运行，比之前

>>阅读原文<<