Dopamine - 灵活、可重复的强化学习研究新框架

时间 2021-01-06

原文原文链接

文 / 研究软件开发人员 Pablo Samuel Castro 和Google Brain Team 研究科学家 Marc G. Bellemare 在过去的几年中，强化学习（RL）研究取得了多方面的重大进展。这些进步使 AI 智能体能够在一些游戏上超越人类 – 其中，令人瞩目的例子有：DeepMind 攻破 Atari 游戏的 DQN，在围棋中获得瞩目的 AlphaGo 和 AlphaGo