直播实录 | AlphaGo Zero是如何实现无师自通的？

时间 2021-01-06

原文原文链接

本文为 10 月 29 日，圣何塞州立大学——刘遥行的论文共读直播分享实录。 Google DeepMind 团队在 Nature 上发表的最新论文，阐述了新版 AlphaGo 是如何从空白状态学起，不使用任何人类棋谱，通过自对弈强化学习，仅用 3 天训练时间就以 100:0 击败了上一版本的 AlphaGo，并用 21 天达到 AlphaGo Master 水平。 AlphaGo Zero 的核