Google发布“多巴胺”开源强化学习框架,三大特性全满足

 编译整理 | Just 编辑 | 阿司匹林 出品 | AI科技大本营  强化学习是一种非常重要 AI 技术,它能使用奖励(或惩罚)来驱动智能体(agents)朝着特定目标前进,比如它训练的 AI 系统 AlphaGo 击败了顶尖围棋选手,它也是 DeepMind 的深度 Q 网络(DQN)的核心部分,它可以在多个 workers 之间分步学习,例如,在 Atari 2600 游戏中实现“超
相关文章
相关标签/搜索