Google发布“多巴胺”开源强化学习框架，三大特性全满足

时间 2021-01-15

原文原文链接

编译整理 | Just 编辑 | 阿司匹林出品 | AI科技大本营强化学习是一种非常重要 AI 技术，它能使用奖励（或惩罚）来驱动智能体（agents）朝着特定目标前进，比如它训练的 AI 系统 AlphaGo 击败了顶尖围棋选手，它也是 DeepMind 的深度 Q 网络（DQN）的核心部分，它可以在多个 workers 之间分步学习，例如，在 Atari 2600 游戏中实现“超

>>阅读原文<<