SEED RL — 大规模扩展强化学习

时间 2021-01-13

原文原文链接

文 / Google Research 阿姆斯特丹分部研究工程师 Lasse Espeholt 过去几年间，强化学习 (RL) 取得了令人瞩目的进展，近期在围棋 (Go) 和 Dota 2 等游戏上取得的成功也有力地证明了这一点。模型或智能体，通过探索环境（如游戏）来学习，同时针对特定目标进行优化。但是，目前的 RL 技术需要大量的训练才能成功完成学习，即便是简单游戏，这也使得迭代研究和产品构