国产AI围棋崛起，微信AI围棋绝杀同门师兄“绝艺”

时间 2021-01-15

AlphaGo退休之后

来源：腾讯野狐围棋、微信派，编辑：克雷格

在4月28日结束的世界人工智能围棋大赛上，腾讯AI Lab开发的“绝艺”意外输给了Phoenix Go，屈居第二。

Phoenix Go是微信翻译团队开发的人工智能围棋，算是“绝艺”的小弟，它们两个都出自腾讯，可谓“同根生”。

不同的是，Phoenix Go的优势在于，它基于AlphaGo Zero论文实现，同时做了若干提高训练效率的创新，并利用微信服务器的闲时计算资源进行自我对弈。

目前，PhoenixGo已经战胜过200多位人类棋手，这次战胜“绝艺”倒是出乎所有人的意外。

认识PhoenixGo：曾被认为是百度、阿里、Zero养的“金毛”

2018年初，PhoenixGo以Bensondarr等账号在腾讯野狐围棋上进行实战，目前已经战胜200多位棋手。

在公布正式身份之前，社区、贴吧等上面关于BensonDarr的猜测众多。

有的说BensonDarr的首字母缩写是“BD”，就是百度的狗，也有的注意到BensonDarr从来没有和绝艺指导下过棋，这很难解释。正常的话，其它AI应该都是非常渴望挑战绝艺，因此可能是阿里的狗。

看到Bensondarr这么强大，也有人说是Zero。

而Bensondarr换了金毛的头像后，就被棋友称为金毛。

这只金毛在野狐围棋上名气越来越大，直到世界人工智能围棋大赛在今年4月20日公布参赛阵容时候，它的身份首次公开：就是“绝艺”的自家兄弟PhoenixGo。

PhoenixGo是微信的几名工程师在开发机器翻译引擎“之余”抽空研发的AI程序。它基于AlphaGo Zero论文实现，同时做了若干提高训练效率的创新，并利用微信服务器的闲时计算资源进行自我对弈，缓解了Zero版本对海量资源的苛刻需求。

微信团队没有公布如何基于AlphaGo Zero论文实现，不过去年10月，DeepMind在Nature的一篇论文中，描述了AlphaGo Zero 的技术细节。

AlphaGo Zero完全不依赖于人类数据，因此，这一系统的成功也是朝向人工智能研究长期以来的目标——创造出在没有人类输入的条件下，在最具挑战性的领域实现超越人类能力的算法——迈进的一大步。

作者在论文中写道，AlphaGo Zero 证明了即使在最具挑战的领域，纯强化学习的方法也是完全可行的：不需要人类的样例或指导，不提供基本规则以外的任何领域知识，使用强化学习能够实现超越人类的水平。此外，纯强化学习方法只花费额外很少的训练时间，但相比使用人类数据，实现了更好的渐进性能（asymptotic performance）。

AlphaGo Zero 在其他方面也与之前的版本有所不同：

AlphaGo Zero 只使用围棋棋盘上的黑子和白子作为输入，而上一版本的 AlphaGo 的输入包含了少量人工设计的特征。

它只使用一个神经网络，而不是两个。以前版本的 AlphaGo 使用一个“策略网络”（policy network）来选择下一个落子位置和一个“价值网络”（value network）来预测游戏的赢家。这些在 AlphaGo Zero 中是联合进行的，这使得它能够更有效地进行训练和评估。

AlphaGo Zero 不使用“走子演算”（rollout）——这是其他围棋程序使用的快速、随机游戏，用来预测哪一方将从当前的棋局中获胜。相反，它依赖于高质量的神经网络来评估落子位置。

（详细细节请阅读新智元文章《【21天完虐Master】AlphaGo Zero横空出世，DeepMind Nature论文解密不使用人类知识掌握围棋》）

PhoenixGo对战绝艺：腾讯自家兄弟的游戏

在世界人工智能围棋大赛半决赛，PhoenixGo和绝艺分别顺利击败Leela Zero和天算围棋，令决赛成为腾讯两兄弟的对决。

28日中午12:30，决赛首局开战。

八冠王古力九段受邀为棋迷解说。猜到白棋的绝艺一出手就有创新，左下面对金毛的托扳定式，绝艺没有采纳人类耳熟能详的打完粘上，而是走出二路倒虎的新手。

随后的进程，绝艺一直保持着大贴目下白方的后发优势。不过双方差距并未拉大。

进入官子，执黑的金毛在下方二路大跳，入侵白空。绝艺出人意料的脱先跑到右上扳角。嗅到机会的PhoenixGo出手狠辣，147凌空一挤，左上一队白棋突然面临生死之危。

突然而至的危机，并不会让AI慌乱。

实战绝艺顺利将大队人马完整连回，但是胜负的重点仍在他处。继续掌控先手的PhoenixGo回到下边，令白棋目数大幅缩水。绝艺弈出一路“金鸡独立”经典手筋，PhoenixGo177妙手一靠还以颜色。此处战罢黑棋彻底完成逆转。

又进行了40手，绝艺中盘认输。

发球局被破，绝艺的决赛之旅顿生坎坷。

第2局拿到白棋的PhoenixGo发挥出色，始终保持着贴目优势，弈至159手绝艺强行收下右边官子，打破局面平衡。

面对绝艺的进击，PhoenixGo态度同样强硬，一刀切断黑棋19子大龙归路。惨烈的攻杀开始，黑棋大龙几经辗转，弈至191手虽能从上边凿出缝隙回家，但要付出左上角被吃的代价。

见此情景绝艺团队主动认输，比分变为2:0，PhoenixGo已经提前夺冠。

最终，Phoenix Go 2:1击败绝艺，赢下本届AI大赛，智能围棋世界冠军榜上又添新成员。

“星阵”战胜柯洁，国产AI围棋崛起

中国作为围棋的发源地，在AlphaGo诞生后的几年里也成为主要的AI围棋源头之一。

被同门兄弟击败的“绝艺”，是腾讯AI Lab于2016年3月4日开发出的AI围棋，当年8月绝艺就首次战胜职业棋手，11月第一次战胜世界冠军棋手江维杰（野狐ID若水云寒）。

2016年11月“绝艺”首次和柯洁交手，成绩一胜一负；2017年2月14日以后，绝艺对野狐帽子（世界冠军和全国冠军）的胜率，已经能够稳定在90%以上。不久前，“绝艺”还成为中国围棋国家队的训练工具。

在PhoenixGo战胜绝艺的同一个赛场上，另一家国产AI围棋“星阵”战胜了柯洁。

星阵的前身是清华大学由小川团队研发的“神算子”，曾在比赛中战胜世界冠军孔杰九段。

据“AI前线”报道，由小川曾介绍，星阵也借鉴了AlphaGo的基本架构，但在特征体系、模型结构、MCTS 算法架构等方面有所创新，力争用更少的计算资源和更少的训练样本完成模型学习。

现在，AlphaGo已经退休，但是它启发的无数后来者站在巨人的肩膀上，不断探索计算的奥秘。AlphaGo退休之后

编者按：本文来自微信公众号“新智元”（AI_era），来源：腾讯野狐围棋、微信派，编辑：克雷格，36氪授权转载。