谷歌alphago和李世石的比赛棋谱吸引了不少的围棋爱好者,通过观察此次AlphaGo围棋VS李世石的棋谱,可以看出,人工智能还是比较强大的,下面来一起看下谷歌alphago和李世石的比赛棋谱精彩对局吧。
比赛采用5局3胜制,最终比赛获胜方将获得奖金100万美元。李世石在本轮战败后,只有剩下3局全部获胜才能以3:2总比分战胜AlphaGo,而AlphaGo下一局只需获胜即可宣布战胜李世石。
剩余赛程如下(北京时间中午12点开赛):
第三场比赛:3月12日(周六)
第四场比赛:3月13日(周日)
第五场比赛:3月15日(周二)
终盘画面,有网友说黑棋像个“死”字
在刚刚结束的人机围棋大战中,李世石再一次输给了谷歌的AlphaGo。目前来看,总体形势不容乐观,有可能李世石会连败五局。而机智的网友们马上开始发挥P图本领,通过棋谱来对可怜的小李子进行嘲讽。
▲这张图说AlphaGo在嘲讽小李子是一个弱鸡。
▲这两张棋谱写着李世石今天一定会输,因为写着今天我死。
网友嘲讽归嘲讽,但是李世石的实力还是毋庸置疑的。作为韩国最强棋手,李世石九段还是具有很大的实力的。希望小李子调整好心态,勇敢地面对接下来的三场对AlphaGo的比赛。
AlphaGo赢了,但我找到了它的两个“弱点”
谷歌人工智能(AI)程序AlphaGo围棋逆转战败李世乭九段的消息让人颇为震惊,大呼“最后的骄傲”也丧失了。确实,在很多事情上,人工智能都能够代替人类来完成。但就今天这局“世纪围棋”之战来说, 胜负在棋盘之外。或者说,AlphaGo的胜利并没有神奇到可以说“人工智能战胜人类”。
一、计算力强势碾压
在AlphaGo的系统上,开发团队使用了更大的计算机网络——包括170个GPU和1200个标准CPU。结合蒙特卡洛搜索算法,AlphaGo能够看到的可能性走法清晰而全面,纯计算的方式同时避免了失误的可能。计算机一分钟的计算量(实战中AlphaGo前期步时约1分钟),人脑也许需要半小时甚至更多。
而据搜狗CEO表示,如今AlphaGo的配置已有了极大的改善,其中GPU达到2000以上。也就是说,AlphaGo拥有了这个先决的优势条件,在走子上的表现也不足为奇。在Alphago之前,也已经有多种纯计算软件战胜棋力高强的人类选手。
从今天的对局来看,AlphaGo(执白)非常擅长近身肉搏,可见其局部计算之精密。
二、不懂大局谋划,形势判断仍未突破
AlphaGo和李世乭今天的对局中,前期李世乭使用大规模布局的作战方式,形势上偶有领先。但是,形势属虚,在后来近身肉搏的过程中,AlphaGo比李世乭要凶猛。比如下图,黑棋在左下方定型时,白子回到上方挑事,非常顽强,所以黑子才会被白子挖走一块又一块。
但是,这样说明计算机程序对于布局还没学会。布局变数比应着要多,形势要虚,判断依赖棋感。在这一点上,AlphaGo仍然体现出了电脑的弱点。古力九段表示,AlphaGo对厚势(外势)的判断没有搞清楚。
而恰好,李世乭的强项和弱项都和AlphaGo的特性对上了。“中国围棋第一人”柯洁九段分析称:“李世乭的强项是后半盘的翻盘能力,布局则是李世乭最差的地方,判断力也不是太好,这对于AlphaGo来说是个重大利好,因为计算机一般来说也是强在后半盘。”
三、AlphaGo在进取,但更多的是反应
到了中盘,尽管黑方已经定势,但AlphaGo非常进取,以致黑方未能坐实优势。这是AlphaGo表现优秀的一面。因为按理说,要破这种形势需要找到最优的妙手,可见AlphaGo的蒙特卡洛搜索算法的准确度有了极大的提高。
不过, AI目前只能在特定场景下,遵循规则产生特定的结果。在此对局中,AlphaGo虽然执白属后手,但基本无法抢得先手,也很少能够主导局面形势的变化,更多的是顺着对方走,直到对手失误。
曹大元九段在对局结束时表示,AlphaGo的表现令人吃惊,但人工智能与人类本质上还没有分出胜负。就弈棋而言,低手比棋谱,强手比计算,高手比棋理。
我们不能否认AlphaGo在人工智能上取得的突破,人工智能的复杂性和艰巨性不言而喻,它的每一小步都意味着人类科学迈出的一大步,即便它还是这么“蠢”,我们仍为它欢欣鼓舞。
图片来源:弈客直播
本人作为一名围棋爱好者,就此发表了一些个人见解,不喜勿喷,也欢迎交流。
【AlphaGo分析】
AlphaGo简介
AlphaGo去年10月击败欧洲冠军
谷歌曾于2014年以4亿欧元收购人工智能公司DeepMind。由DeepMind研发的AlphaGo项目已有两年历史,AlphaGo曾在去年战胜了欧洲围棋冠军樊麾(职业二段)。
去年10月5日-10月9日,谷歌AlphaGo在比赛中以5:0的比分完胜了欧洲冠军。除了战胜人类外,AlphaGo还与其他的围棋程序对战,获得了500场胜利。
AlphaGo原理简介
传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。此次谷歌推出的AlphaGo,将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。
其中一个神经网络“决策网络”(policy network)负责选择下一步走法,另一个神经网络“值网络”(“value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络 之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcement learning)。通过广泛使用Google云平台,完成了大量研究工作。
AlphaGo在与人的对弈中用了“两个大脑”来解决问题:“决策网络”和“值网络”。通俗来说就是,一个大脑用来决策当前应该如何落子,另一个大脑来预测比赛最终的胜利方。
值得一提的是,李世石也是第一次与机器对战,所以他无法像和人类对战那样,先研究对方的棋谱和下棋风格。李世石所能做的就是和自己对弈。谷歌AlphaGo也是通过这种方式锻炼自己,真正做到了“人工智能”。
关于这盘棋,会有很多解读。不止在今天,甚至在数十年之后,这盘棋还可能会被拿出来研究,从棋谱上,更从人机不同的思维上。不论未来回看这盘棋的是人类还是真正有了自我意识的AI,想必都会有与当下的我们不同的感受。而我们有义务把我们的感受和思考记录下来,让后人知道当时的人究竟是如何理解这盘棋,他们有哪些错误的认识、可笑的想法,又有哪些深刻的洞察。
我们来看看,今天这盘棋,究竟发生了什么。这盘棋可能将是有史以来职业棋手最难以统一意见的对局,以下观点是我个人见解,只是在围棋AI时代毫无预兆迅猛而来时,一名棋手尽可能理性的分析和思考。
一、李世石的针对性策略
从棋谱来看,我认为李世石在这盘棋前后主要使用了一个试探,和两个策略。
1)试探:从未出现过的布局
棋谱复盘人机大战
李世石第7手,没有按常规布局在上边连片,而选择走在右边。李世石自己在职业比赛中从未使用过这一开局,甚至整个职业围棋界,没有人见过这一开局。
李世石不按常规布局,显然是对电脑的一种试探。在去年10月AlphaGo对樊麾的五盘棋中,所有开局都是常规布局,虽然那五盘的开局在今天已经不是主流,但都是曾经流行一时的布局。
避开流行布局,甚至避开曾经流行过的已经被淘汰的布局,选择一个从未出现过的布局。李世石在考验AlphaGo在布局阶段的应变能力。我们知道AlphaGo的深度学习基于大量已有对局的数据,那么,面对一个棋谱库里从未见过的布局,AlphaGo你将如何应对?
AlphaGo给出了完美的回答。
棋谱复盘人机大战
白8挂角正常,黑9二间高夹最为激烈。白10,这一手……非常出色。
通常情况下,在右上白8遭遇二间高夹的时候,白10是“不存在”的一手,它不在任何定式之中。面对黑9,白棋有诸多定式选择,却没有白10这一手。
然而,我认为白10是好手。
白10的好处在于使黑7变成效率低下的一手,虽然在右上局部白棋稍稍亏损,但加上黑7的低效,白棋一点也不吃亏。
AI竟然会通盘考虑!传统的围棋AI,会根据已有棋谱来走定式,定式是经过长期检验的局部双方可以接受的定型。然而定式的弊端就在于,不同的周围环境,定式的适用性有所不同。从这盘棋来看,黑9夹击之后,白棋如果选择面对二间高夹最常用的“妖刀”定式,即走在15位,反而将使黑7的位置成为绝对的好点,黑7的效率将会大大提升。
实战白棋选择了一个定式里没有的、局部稍亏的、却使得黑7这个遥远棋子的效率变低的下法,非常清楚地证明了两点:
电脑不依靠背谱来下棋
电脑的考虑基于全局而非局部。
当然,第一点其实在对樊麾的棋谱中已经可以看出来。在对樊麾的常规开局中,AI出现了数次不同于“谱着”的下法。其中有一盘出现“大雪崩”定式,电脑选择的次序是定式和棋谱里没有的,而且是从逻辑上不如谱着的。注意,这里强调是逻辑上不如谱着,而不是在经验上。即,AI当时的次序是“绝对弱于”谱着,只可能亏没可能便宜,虽然选点是正确的,但在我们看来是“次序错误”。这体现出,AlphaGo不依赖于定式和谱着,但也暴露出AI在逻辑上的不足,反应在棋盘上就可能会出现次序错误。这一点,也是棋手普遍不看好AI能战胜李世石的一个原因。
但这一问题在这盘棋我们并没有看到。起码,没有非常明显地显现出来(后面会提到一个细微的类似问题)。
而第二点则是这盘棋AI开局给我们秀出的能力。他轻易摆脱了李世石设下的定式圈套,以全局的视野作出了定式中不存在的选择。
如果说第一点是我们在AlphaGo对樊麾时已经能够看到的情况,那么第二点则是这局棋在布局阶段对人类试探的完美答复。如果只依靠大量棋谱堆砌出来的局部图像识别,AI做不出这样的选择。