广告
最新版AlphaGo为什么叫Zero?据说是因为它学会了这项技术
导语:在今年五月完爆柯洁之后,Deepmind又在上个月发布了最新版的AlphaGo Zero,并表示它只需要3天时间,就能从零自学成才,以100:0的压倒性成绩完胜赢下韩国棋手李世石那版AlphaGo。最近,据说这个版本的AlphaGo又再度进化了。
在今年五月完爆柯洁之后,Deepmind又在上个月发布了最新版的AlphaGo Zero,并表示它只需要3天时间,就能从零自学成才,以100:0的压倒性成绩完胜赢下韩国棋手李世石那版AlphaGo。最近,据说这个版本的AlphaGo又再度进化了。

在谈AlphaGo的新变化前,我们先来聊聊它的命名。据传,AlphaGo从“出生”到现在经历了无数版本的迭代升级,在内部分别有不同的代号,但是对外公开的时候,Deepmind并没有刻意地给AlphaGo各个不同版本取名,只是外界根据不同版本AlphaGo对手的不同,将它们取名为AlphaGo Fan、AlphaGo Lee、AlphaGo Master,其中,AlphaGo Master就是在网络上挑落无数世界冠军,并最终打败柯洁的版本。

而最近这次更新中,Deepmind却直接给AlphaGo这个版本确定了一个名字,AlphaGo Zero,这是为什么呢?Deepmind又为什么取这样一个名字呢?据了解,这是因为AlphaGo学会了一项叫强化学习”(reinforcement learning)的AI技术,之所以叫Zero,就是因为它不再需要人类输入信息。



经过“强化学习”增强的AlphaGo不需要人类数据就可以自己获得超人一般的围棋技法,只需要划定下棋规则,AI就会随机对弈,制定出色的战略。

根据DeepMind最近在arXiv发表的论文,逆天的AlphaGo Zero又一次进化了,已经具备很强的通用性,可以学着完成其它任务。在论文中有这么两个例子,说它可以学习国际象棋和将棋,将棋是日本的一种游戏,与国际象棋类似。在两个案例中,AlphaGo Zero 24小时内就能获得超人一般的棋艺,达到击败世界冠军的水平。



为什么在两个游戏中AlphaGo可以获得卓越的技能呢?除了国际象棋与将棋没有围棋复杂之外,DeepMind有能力让AlphaGo Zero具备通用性,这样它就可以掌控各种不同的游戏,或许在不久的将来,AlphaGo Zero可以在任何游戏中碾压人类,即使是现在很多人认为非常具有挑战性的复杂即时战略游戏《星际争霸》。

在短短的几个月之内,AlphaGo已经变得如此强大,还有什么是人工智能不能掌控的呢?
Edit
注:机器人网原创文章,欢迎转载与分享,转载请注明出处。
广告
推荐使用浏览器内置分享