李世石alphago人机大战第二回合分析

来源:本站整理时间:2016/3/11 14:19:28作者:WangYK点击: 0 次评论:0

alphago在人机大战的第二回合也取得了胜利，这让很多人都感受到了人工智能的强大，那么在第二回合中究竟是alphago用了奇招还是李世石出现了失误呢？下面小编就为大家详细分析一下人机大战的第二回合战况。

李世石alphago人机大战第二回合分析

之前大家认为末盘官子肯定是Alphago强，中盘55开（因为人类不可避免会失误），小李的机会只在开盘布局。如果开盘没有积累足够的优势，根本没有中盘、尾盘的机会。但是两盘下来，中盘、尾盘alphago全面压制，开盘布局更像是alphago的强项。

从第二局来看，alphago已经不拘泥于棋谱的表现了，经常走出一些超出定式的具有新意的下法，但是从柯洁的现场点评来看，仔细分析没有一手是问题手，大多数都是可以接受的。

开盘小李左下实地占优，众多点评都说此局稳赢了，但是真的是优势么？白取实地黑取外势，职业棋手的感觉是白子获利，但是如果是职业棋手的判断出问题了呢？外势为虚，是因为中盘存在巨大变数，是否能将外事转化为实力，是要双方棋手拼杀计算决定的，人力是无法计算到中盘的细微之处的，但是如果电脑能呢？如果电脑的计算能力已经可以完成中盘局势的评估了呢？

局势的评估是开局布局的关键，也是蒙特卡洛法的关键。如果能评估最优、胜率最大的点，照着这些点平A就赢了。柯洁往往能先于其他直播解说发现"画风不对"，“小李子有危险”，确实表现出高出他人的实力。但是试想到中局混战的时候，柯洁也会简单的摆一摆，飞速的点目评估一下场上的局势，这不TM实际上就是蒙特卡洛方法么?柯洁再快，也不过是五十步笑百步的区别，跟alphago不可同日而语，alphago一秒钟内不知道已经算完了多少种变化，评估了多少局势了。

因此，开局的某些定式，可能仅仅是人类计算能力不足而妥协的结果。想想从古至今，多少定式被后来的棋手推翻，建立起新的定式？古人打过多少谱，现在的职业棋手每年打过多少谱，推翻旧的定式建立新的定式不难理解，那么想一想alphago一天就能打几万个谱，推翻我们现在的定式不是理所当然的么？！

这已经很恐怖了！！！alphago看李世石今天摆出的定式，可能好像我们看几百年前甚至几千年前流失的古谱一样，梦里都能笑醒了好么？事实也是如此，布局到定式一半果断脱先，李世石连完成定式的勇气都没有，只能以虚对虚。柯洁和一些解说都说要完成定式教alphago做人，但是真走下去恐怕也占不到便宜。当然脱离自己的开局，放弃“定式”的优势，和计算机拼计算力搏中期，也没有什么机会，就像今天这样，输得也很难看。

所以结论很简单，开局、中盘、收官，alphago全面压制，甚至两盘都没有收官的必要，alphago官子也肯定不会留下任何的机会。完败，没有任何余地。小李子之后的采访也承认完败。

还有更恐怖的可能：从alphago开局脱先开始，李世石就走上了败局。如前所说，职业选手看起来差不多的着法，alphago可不是这么看的，再接近的着法对于之后的胜率也是不一样的。人类是看不出来的，和人对决也不在乎，反正对手也觉得差不多，稀里糊涂就到中盘拼杀好了。alphago却是在开局积累胜势的，哪怕1手只强1%，开局20手下来，利滚利的优势也是吓死人的，更可怕的人类棋手还可能浑然不觉，甚至占了一些实地小利觉得自己占优势呢。什么时候看出来那是棋力的差距了，能看出来也不见得来得及翻，毕竟已入中盘，变化复杂，计算力的优势更大。

所以小李子还是做出了应对的，从开局布局就投入了比上一局多得多的时间和精力，花费了大量的计算。左下角的处理是职业棋手见到都不会放过的，但是我真的怀疑alphago根本不在乎局部的得失。再重复一遍，这样的下法是建立在中期强大计算力上的，人类模仿这种下法就是东施效颦了，想都不敢想。没有了定式的辅助，没有了经验的帮助，和几百万盘的计算机拼棋感，真的是难。

中盘alphago展现了多线作战的强大能力。经常毫不讲理的脱先，下一些奇怪的选点。脱先还是归功于强大的局势判断能力。举个例子，A战场投子价值10，B战场价值15，但是B战场搏杀几轮后因为空间减小，局势趋于确定价值在逐渐减少，当B战场价值9的时候，按人类的标准可能还是必应的一手，alphago毫不犹豫就脱先了，甚至A战场价值下降到7再转回B战场，甚至奔向同样价值9的C战场。这就逼迫小李子进入到了alphago的行棋节奏，被迫同时双线、甚至多线作战，这对于人类棋手捉襟见肘的记忆力、计算力无疑是雪上加霜，对狗来说却根本不是事。该弃的子果断弃，只要从其他地方获得更大的利益，而人类浑然不觉。尾盘的几手就有这样的表现，在结束刚开始会出现一些很贱的行棋顺序，关键棋中走出几手莫名其妙的，小李又不得不应的棋，再回头继续原来的行棋。这就是计算机，这就是程序，一丝不苟的完成胜率最大的行棋。

所以存在着这样一种可能，从某一刻开始，小李子想赢alphago就只剩下为数不多的几种选择，困难的不止是在多种变化中找出最后的正解，而且要找出正解的顺序。这些顺序可能包括在多个战场，走错一步，alphago都可能脱先，走出尖冲五路的妙手。这对于人类选手来说都没有在有限时间内解出的可能。小李子用时明显比第一局多了很多，用时也比alphago多，烧脑烧到这种程度，早晚会失误的。不是打拔的弱手，也是其他的弱手，早晚会"失误“的。

当中局面对变化时，当面对众多选择没法抉择最优点的时候，静静的等待alphago先手进攻的时候，胜利的天平已经倾斜了。无论你复盘的时候觉得哪手有问题，也不代表你能走出更强手，甚至说不定当时在alphago眼中，已经是无解的变化了。哪怕是复盘，人类也不能摆出所有的可能。所以往往看来觉得alphago平平无奇，没有妙手，但是就是没有攻击、翻盘的点。输都不知道怎么输的。绝望。

尾盘就不说了，不可能输给人类的。

善战者无赫赫之功。alphago在棋盘上展现出了强大的统治力。

李世石最后坚持着把最后的布局下完，我只能想到两个字：悲壮。李世石在人类看来是捍卫人类最高智力棋类的先烈，在alphago里眼里不过是自我完善路上的一块垫脚石。战胜小李可能是一个时代的终结，对于AI来说是一个更广阔的开始。

在最后的“垃圾时间”中，我们还是从中了解出alphago的一些特点，甚至是“弱点”。从每步的用时可以一窥alphago的“情绪波动”，莫名其妙的腾挪和骡子顺序展现出其超常的价值评价体系。其弱点可能还是在于劫财的处理，特别是“连环劫”这种无限循环的可能对于蒙特卡洛方法来说可能是一个盲点，至少在劫财的价值判定和计算用时上来说对于计算机来说还是存在一些问题。也许保密协议中真的有“不能打劫”之类的规定，可能是一个“阿奇琉斯之踵”。但是瑕不掩瑜，历史的车轮已经碾过了。

最后评价一句：李世石的表现无愧于职业棋手，无愧于曾经的世界最强。被alphago完败是他的不幸，甚至一蹶不振；和alphago对战也是他的幸运，以这样一种方式载入史册。

战后感想

现在职业棋手判断形势的算法，有明显漏洞。

职业棋手判断形势的算法大致可以概括成一句话：估算双方的目数（地盘大小）差距。

那如果地盘的边界没有完全确定怎么办呢？如果有先手官子就判给先手方，如果是双方后手官子就算一人一半。

那么有一些模糊的地方，比如说一块厚势折算成几目呢？这个就只能凭感觉了。

今天看各个平台的解说，大概是柯洁的判断最准确。柯洁在中盘阶段就点出黑棋盘面15目左右。古力一度判断小李优势，甚至到官子不多的时候还认为是细棋。金明完也差不多。麦克雷蒙的判断没有仔细听，好像比古力要准一点。芈昱廷在128手的时候认为还是细棋（这个时候柯洁已经判断黑棋明显领先了）。围棋TV的完全没有看，请各位补充。

暂且不论到底是谁的判断更准，我们可以简单看一下白128手时候各方的判断。有柯洁说黑棋领先一个贴目，也有说细棋的，甚至有说白棋小优的。这些职业棋手对同一局面判断上的分歧居然能超过一个贴目！这恰好证明了上述算法模糊之处可能产生的巨大误差。

那么我们思考一下误差可能产生在何处。第一，先手官子判给先手方。然而在棋盘上，“先手”是个相对概念，逆收官子屡见不鲜。甚至在有些情况下，面对“绝先”，奋力一搏选择脱先他头也不少见。第二，模糊判断。这个问题更大。职业棋手对一块棋厚薄判断的分歧，很可能导致点目结果的南辕北辙。

AlphaGo是如何做形势判断的呢？AlphaGo策略组合的其中一部分是价值网络。这一部分的原理以我的水平解释不清楚。为了方便理解，我们考虑前一代AI，Zen的判断方式：通过大量的随机采样估算“胜率”。打个比方，一盘棋下到120手。在这个时候AlphaGo随机落子完成一盘棋，然后判断哪一方在这个随机完成的一盘棋中获胜。重复这个流程多次，比如说十万次，然后其中三万次黑胜，七万次白胜，那么估算出白方的胜率就是70%。

当然，AlphaGo的价值网络比Zen的方式要先进很多，让估算的胜率更加准确。

感谢评论区 @刘嘉耿的补充：

AlphaGo并非完全随机地模拟剩下的棋局，而是参照了之前的棋谱用落子选择器找出最有可能的几个点，保证速度

从效果上来看，估算胜率的效果其实非常好。而且我认为，这样的判断方法是本质的。

为什么？首先要明确，虽然理论上来说，某一个局面下，要么是黑方必胜，要么是白方必胜。然而，由于围棋事实上无法被穷举，只能退而求其次估算概率，或者像人类棋手一样估算双方相差的目数。然而，在很多情形下，相差多少目数是没有意义的。

举个例子（此处应该有图），黑方确定目数70目，没有潜力。白方确定目数40目，有一块40目潜力的大空。如果黑方立即打入并活出，则40目的潜力只能转化成10目的实地，黑方获胜。如果黑方打入失败，则白棋40目大空围成，白方获胜。黑棋也可以选择保守的浅消，则白方的40目潜力大约能转换为25目实地。这个局面下，如果选择浅消，虽然最后差距会缩小，然而其实胜机也很少。很遗憾，这种局面下，职业棋手很难准确估算打入成活的概率，然而AlphaGo可以。于是心存幻想的人类棋手觉得落后不多，而打入无成算，选择浅消白棋大空，结果白方40目的潜力转化成25目实地，黑棋盘面仅多5目，从而落败。阿尔法狗估算出选择打入的胜率是40%，而选择浅消胜率仅为25%，于是毅然选择打入。不论最后胜负如何，选择打入显然是更好的策略。

换句话说，只“领先两目”而胜率80%，和“领先五目”而胜率70%，其实是前者优势更大，然而人类会认为后者优势更大。这或许是人类棋手的命门所在。

可叹的是，人类不可能通过大量随机采样来估算胜率。

针对评论，补充一点吧。评论区说古力是故意模糊判断形势，实际上他是点清楚了的。也许有这个成分在里面。但是，我作为一个常年在各大平台看围棋直播的棋迷，经常能看到对于同一盘棋的同一个局面，一个解说认为黑领先，另一个解说认为白领先的情况。而且这俩解说都是顶尖职业。事实上职业棋手并不能准确判断形势，即使是在中盘阶段末期。

以上就是关于李世石alphago人机大战第二回合的分析了，大家如果对第二回合还意犹未尽，可以下载复盘软件重新观看和分析，今天的介绍就到这里，更多关于本次人机大战的内容请关注5577我机网。