DeepMind推出分布式深度强化学习架构IMPALA,让一个Agent学会多种技能

目前,深度增强学习(DeepRL)技术在多种任务中都大获成功,无论是机器人的持续控制问题,还是掌握围棋和雅达利的电子游戏。不过,这些方面的进展仅限于孤立任务。完成每一项任务都要单独调试、训练agent。 在最近的工作中,我们研究了如何训练单一agent去执行多种任务。 今天,我们发布了DMLab-30。这是一组新任务,包含了在统一视觉环境、通用动作空间(action space)中的多种类型挑战。
相关文章
相关标签/搜索