DeepMind Nature论文解密，没有人类的围棋世界

时间 2021-01-06

原文原文链接

点击上方“中兴开发者社区”，关注我们每天读一篇一线开发者原创好文文/闻菲刘小芹编译新智元报道来源：Nature；DeepMind 　　DeepMind 如约公布了他们最新版AlphaGo论文，也是他们最新的Nature论文，介绍了迄今最强最新的版本AlphaGo Zero，使用纯强化学习，将价值网络和策略网络整合为一个架构，3天训练后就以100比0击败了上一版本的AlphaGo。