谷歌发布强化学习算法SimPLe，学习效率提升两倍

时间 2021-01-17

原文原文链接

深度强化学习(Deep reinforcement learning)利用奖励来推动软件政策朝着目标发展。该技术已被用于模拟社会规范的影响，创造出特别擅长玩游戏的人工智能，并为机器人编写程序，使其能够从恶劣的溢出中恢复过来。尽管强化学习功能多样，它也有一个明显的缺点：效率低下。训练策略需要在模拟的或真实的环境中进行大量的交互——远远超过普通人学习任务的需要。为了在视频游戏领域有所弥补，谷歌的研究

>>阅读原文<<