AlphaGo Zero与增强学习

2017年10月19日凌晨,DeepMind 在《自然》杂志上发表了一篇论文,正式推出人工智能围棋程序的最新版本——AlphaGo Zero. AlphaGo Zero成长史  最初AlphaGo Zero除了围棋的基本规则以外,没有任何关于围棋的知识;  3个小时之后,它通过自学入门围棋,成为人类初学者水平;  19个小时之后,它自已总结出了一些"套路",比如死活,打劫,先占边角等等;  自学第
相关文章
相关标签/搜索