SEED RL — 大规模扩展强化学习

文 / Google Research 阿姆斯特丹分部研究工程师 Lasse Espeholt 过去几年间,强化学习 (RL) 取得了令人瞩目的进展,近期在 围棋 (Go) 和 Dota 2 等游戏上取得的成功也有力地证明了这一点。模型或 智能体,通过探索环境(如游戏)来学习,同时针对特定目标进行优化。但是,目前的 RL 技术需要大量的训练才能成功完成学习,即便是简单游戏,这也使得迭代研究和产品构
相关文章
相关标签/搜索