DeepMind Nature论文解密,没有人类的围棋世界

点击上方“中兴开发者社区”,关注我们 每天读一篇一线开发者原创好文 文/闻菲 刘小芹 编译  新智元报道  来源:Nature;DeepMind    DeepMind 如约公布了他们最新版AlphaGo论文,也是他们最新的Nature论文,介绍了迄今最强最新的版本AlphaGo Zero,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。
相关文章
相关标签/搜索