今天(5月23日),围棋人机大战2.0终于在大众的期待中拉开序幕,经过猜先,柯洁执黑先行,经过数小时的激战,柯洁以1/4子的劣势不敌AlphaGo,宣告首战失利。

在赛前,包括古力在内的不少业内人士都认为,柯洁能够取胜一盘都是小概率事件。可以说,柯洁的首战失利也在大家的意料之中。在赛后的新闻发布会上,柯洁表示,“(阿尔法狗)实在下得太出色了,我输的也没什么脾气,真的是很厉害。”

在接下来的四天里,柯洁还将在25日和27日再度迎战AlphaGo,另外,在24日和26日,还将分别进行人机配对赛和团队人机赛,具体赛程安排如下:

20170523_05_AlphaGo02

新老AlphaGo有何不同?

尽管与李世石对战的AlphaGo以碾压的姿态完胜,但它并没有就此停下前进的脚步,今年初在网络上一口气横扫60位冠军的Master,后来被证实是AlphaGo的升级版,它之所以能达成这一的成绩,或许有一种可能,DeepMind寻找到了一种机制来摆脱围棋中的“人类束缚”。

作为一个极其特殊的棋类和任务,围棋拥有数量极其庞大的可能性,总的局面数量达到 10^172,而可观测宇宙范围内的原子数量不过 10^80。这也意味着穷举绝对不是一条明智的路线。

20170523_05_AlphaGo03

最终 DeepMind 给出了一套能够 “模拟” 出人类顶尖高手的方案:深度学习 + 蒙特卡洛搜索树 + 自我进化。

深度学习用以分析人类棋盘,蒙特卡洛搜索树用来减轻工作量,自我进化用来提升能力。但有限的运算能力还是给 DeepMind 出了一个不小的难题,后者最终想出了一个办法:只对学习到的人类棋招进行蒙特卡洛搜索树运算,这恰如人类棋手依赖定式。

定式,又名定石,指的是人类下围棋长久积累下来的一种经验,对弈双方在特定情况下会遵循固定下法。著名棋手吴清源则将简单描述为 “在角部彼我棋子接触时最合理的走法”。

20170523_05_AlphaGo04

这些定式被记载在各式各样的棋谱当中,成为新手入门必看的书籍。

虽然定式是某种意义上是最合理的走法,但它却是理想化条件下的产物,想要完整复现定式,意味着双方都必须抱有同样的理想化思路。而历史上并不缺乏不遵守定式,或者用新定式打败对方的事例。

问题来了,为什么千变万化的围棋会出现定式?而且死守定式会输,不学习定式也会输。答案只有一个——人类需要定式来减少围棋上面的变化,这样进入中盘之后人类才能利用自身能力掌握棋局走向。

凑巧的是,这回我们遇到的是运算能力远超人类的计算机,让掌握更多乃至全部围棋奥秘拥有了一丝可能。

但究竟新AlphaGo怎么样摆脱 “人类束缚”?参考之前 “老 AlphaGo” 的工作方式,排除运算过程中所有人类元素可能是最彻底的方法。但这样一来就必须找到另外一种减轻运算压力的策略。目前来看,这个秘密也只能等 DeepMind 方面稍后公开了。

柯洁:不管输赢,这是我最后一次人机大战

对于今天的人机大战2.0,媒体以及围棋圈内人士都对此次比赛给出了各种预测。而对于这次的人机大战,柯洁也有自己的一些看法。柯洁在昨日深夜发布微博长文称,“无论输赢,这都将是我与人工智能最后的三盘对局。”

20170523_05_AlphaGo05

柯洁还表示,目前人工智能在围棋领域的发展非常快,无论是AlphaGo或者是国产的绝艺、日产的ZEN都有着强大的实力,但是它们没有对围棋的热情,只是冰冷的机器。他也表示会用自己的热情去迎接这次挑战,给热爱围棋关心这次比赛的朋友一个好的交代,让大家“且看且珍惜”。

20170523_05_AlphaGo06

Deepmind创始人哈萨比斯赛前曾表示:”本次比赛的宗旨是探索新的围棋打法。AlphaGo再过一万年也不可能穷尽所有围棋的定式。这次比赛其实不是人机大战,而是人类使用电脑作为工具探索新的东西,就像哈勃望远镜让人类发现新的领域一样。人工智能可以帮助专家以更快的速度解决问题。本次比赛的目的也不是AlphaGo还是棋手赢,最终还是人类赢。祝柯洁好运。 “