迁移学习比赛:OpenAI喊你重温「音速小子索尼克」

Root 编译自 OpenAI 量子位 出品 | 公众号 QbitAI 一直以来,在典型的强化学习研究里,常拿怀旧小游戏训练算法。 可算法的训练和测试环境都是同一个,这就会让那些本身带有超参数和靠死记硬背的算法获得不错的结果。 为了解决这个问题,OpenAI办了一个迁移学习的比赛,让大家训练出的AI智能体去玩世嘉经典「音速小子索尼克」,看哪个智能体能在从没见过的关卡里获得最佳的表现。 OpenAI
相关文章
相关标签/搜索