虽然没有人机大战1.0时的全球瞩目,柯洁与AlphaGo的人机大战2.0依然吸引了众多国人的目光,在经历第一局1/4子的惜败以及第二局的中盘认输之后,在今天的第三局比赛中,柯洁全场被压制,虽然中途放手一搏挽回一些局面,无奈AlphaGo太稳健,最终“安乐死”。

其实早在比赛开始一个小时左右,棋圣聂卫平就表示,执黑棋的AlphaGo已经赢了,可以收子了。聂卫平还表示,AlphaGo的棋力非常高,已经完全超越了人类,虽然目前人类职业棋手的最高段位是九段,但AlphaGo至少达到了二十段。这是不是意味着,在围棋这件事上,人类几乎再无可能超越AlphaGo?

AlphaGo现在到底有多强?

按聂卫平关于二十段的说法,作为并不懂围棋的小编而言,总觉得太过夸张,总体来说,也不太容易理解。还好,DeepMind创始人兼CEO Demis Hassabis和首席科学家David Silver在中国乌镇·人工智能高峰论坛做出了更通俗的解释。

从AlphaGo挑战人类开始,针对不同的阶段,David Slver表示,DeepMind团队给AlphaGo确定了三个版本的名称:AlphaGo Fan(与樊麾对弈的版本)、AlphaGo Lee(与李世乭对弈的版本)、AlphaGo Master(驱动Master的版本)。他们三者之间最主要的差别就是棋艺水平,Google现场也展示了三者的围棋ELO等级分:

20170527_05_AlphaGo02

从图中可以看出,2015年10月登场的AlphaGo Fan等级分大约在2900分左右,2016年3月登场的AlphaGo Lee等级分大约在3700分左右(李世乭本人目前3530分),今年年初登场的AlphaGo Master等级分已经来到了4800分左右。而目前世界第一人柯洁的等级分也仅有3625分而已。对于AlphaGo Lee与AlphaGo Master之间的差距,Google认为大约在让3子左右。

而柯洁在得知这个差距之后,却彻底不淡定了,并发布微博称是一个可怕的对手:

20170527_05_AlphaGo03

值得注意的是,等级分的数值实际上是由一系列比赛中的胜负来确定的,这个数值在输赢都存在的情况下比较准确(高低都有参考值)。而AlphaGo Master之前一举面对职业围棋人士连胜60盘,等级分很可能还远没有达到真实的水平(上未封顶)。

人类还有机会?

微软亚洲研究院资深研究员郑宇博士认为,AlphaGo的综合实力目前走在了人类的前面,但并没有完全攻克围棋这项运动。

一方面,能通过短短几个星期的学习就能击败学棋二十多年的顶尖围棋选手,已经证明了人工智能的强大。因此,即便AlphaGo日后万一输了,我们也仍然应该为人工智能点赞,切不可再次否定人工智能的力量。

另一方面,AlphaGo采用这样的技术线路其实是根据人类自身对围棋的理解来设计的,即搜索+价值评判。也就是说我们先假设各种走法(执行下去),再评判这样走可能赢的机会大小。由于索搜空间巨大,即便用尽地球上所有的资源,也不能找到最优解。此时,在某个局面下对(未来输赢)价值的判断就变得尤其重要。在深度学习没有出现之前,这点一直是机器的弱项,因此,早年间人在这方面占有巨大优势。

从专业的角度来讲,AlphaGo用深度学习去逼近了一个价值判断函数,然后再跟蒙特卡洛搜索树结合的方法。这个近似解比目前人类的价值判断(可能)接近或者要略强一些,加上机器不知疲倦的搜索效率和无情感波动,综合来看走在了人的前面。

但AlphaGo得到的这个解远不是最优解法,围棋未来可探索的空间还很大,还没有被攻克。

同时,人类也在不断进步,人类后天的快速(小样本)学习能力是AlphaGo基于现在的学习方法还做不到的。短期来看人类获胜的概率小,但长远来看(未来5-10年)人类还有机会,可以从少量跟AlphaGo对弈的棋局中快速学习,尤其是在价值判断这块,人和机器人都还没有弄明白怎么回事,在没有明确的规则时,人相对于机器还有机会。

如果还是基于现有的学习体系,即便再给AlphaGo一亿副棋谱,再添加一万块GPU,它进步的速度也终将放缓,因为新增的棋谱和计算资源相对于2*10171这个搜索空间来说只是沧海一粟。

现在人类跟AlphaGo处在一个信息不对称的局面。人类跟AlphaGo对弈的次数还太少,获得的信息反馈也还远远不够。如果能够把AlphaGo开放出来,让更多的职业高手跟它对弈,让年轻的棋手来学习它的下法和招数,相信人类棋手也能够从中学习到很多,从而再次进步。

AlphaGo要“退役”?

当人类正在考虑通过跟AlphaGo的更多对弈来寻找到超越的机会时,我们却听到了一个“坏”消息,在今天柯洁跟AlphaGo的最后一局比赛结束后的发布会上,AlphaGo之父、DeepMind创始人戴密斯·哈萨比斯(Demis Hassabis)说:“本周的比赛聚集了围棋起源地最优秀的棋手参与,是AlphaGo作为一个竞赛系统能够对弈的最高级别对手。因此,本次中国乌镇围棋峰会是AlphaGo参加的最后对弈比赛。”换句话说,AlphaGo被宣布“退役”了,以后可能都不再跟人类棋手进行比赛。

哈萨比斯解释了为何做出这样的决定,他说:“周二(5月23日)来的比赛超出了我们的期望,我们见证了天才柯洁把阿尔法狗推向了极限,比赛也异常精彩。此次的配对赛和团体赛也为我们开创了新的天地,这种类型的比赛与合作都是史上第一次。AlphaGo和我们的团队都学到了很多。这种比赛展现了AI的最高水平,让人类挖掘了AI作为工具的潜力,从而帮助人类拓展新的知识领域、发现真相。”

不过,哈萨比斯宣布,人类棋手与AlphaGo的故事并不会就此结束。AlphaGo的启蒙老师、欧洲围棋冠军樊麾随后表示:“AlphaGo团队将与柯洁合作,对此次的棋局进行分析,根据AlphaGo内部的数据,与柯洁研究此次的对局,展现比赛的过程并做成视频,与全世界的围棋爱好者共同分享。AlphaGo团队还为全球围棋爱好者准备了一份礼物。AlphaGo在于李世石比赛后,进行了成千上万的自我对战。这些自我对战是AlphaGo最宝贵的财富,我们近期会公布50盘阿尔法狗自我对战的棋局。这些自我对战都是以慢棋的形式体现出来。”

据樊麾介绍,现在大众已经可以在DeepMind官网上下载10盘AlphaGo自站对局,以后每天会更新10盘新的对局。

此前,马云曾发表评论认为,AlphaGo的出现让围棋失去了乐趣,但是棋圣聂卫平并不这么认为。AlphaGo 的出现,就像鲶鱼一样刺激人类棋手进一步提升。然而,随着AlphaGo 的“退役”,人类恐怕再无机会在围棋上战胜它了,其他AI棋手还会给人类机会吗?