Dopamine - 灵活、可重复的强化学习研究新框架

文 / 研究软件开发人员 Pablo Samuel Castro 和Google Brain Team 研究科学家 Marc G. Bellemare 在过去的几年中,强化学习(RL)研究取得了多方面的重大进展。 这些进步使 AI 智能体能够在一些游戏上超越人类 – 其中,令人瞩目的例子有:DeepMind 攻破 Atari 游戏的 DQN,在围棋中获得瞩目的 AlphaGo 和 AlphaGo
相关文章
相关标签/搜索