你的位置:首页问题答疑软件答疑 → 谷歌alphago是什么

谷歌alphago是什么

来源:本站整理时间:2016/3/11 11:21:28作者:GML点击: 0 评论:0

文章标签: 谷歌alphago

谷歌alphago最近相信已经被身边的朋友和网络给刷屏了,在两次围棋大战中几乎到达了顶峰,但是仍旧有不少亲们相信并不是很清楚这个是什么意思?下面小编就为大家简单的带来相关说明吧!

李世石比赛输了,人工智能逆袭了?人类真的败给人工智能了吗?

接下来,就让我们了解一下,这个逆天的谷歌人工智能AlphaGo到底是为何物?

1936年,艾伦·图灵提出了一种可以辅助数学研究的机器(后来被称为“图灵机”),80年过去了,人类在人工智能领域已经取得突飞猛进的发展。上世纪90年代,IBM超级计算机“深蓝”击败国际象棋世界冠军,引发了“电脑是否超越人脑”的热议。然而,围棋因其变化莫测的招式成为了AI(Artificial Intelligence,人工智能)难以攻克的“禁地”。当然,这个世界总有“不信邪”的人。DeepMind开发的AI程序AlphaGo,击败了欧洲围棋冠军樊麾。

AlphaGo是什么来历?

起初,DeepMind是英国的一家小型人工智能公司,专精于深度学习和分析建模领域,在2014年被谷歌收购。这家公司的创始人名叫德米斯·哈萨比斯(Demis Hassabis),他拥有剑桥大学和伦敦大学学院的计算机科学和认知神经科学学位,还是一位国际象棋大师。从外表上来看,“学生气”的哈萨比斯很普通,但是其对AI的见解和愿景改变了很多的看法,其中就包括著名物理学家史蒂芬·霍金。一直以来,霍金总是倾向于“AI威胁论”,认为智能机器终有一天会威胁人类的安全。不过在与哈萨比斯长谈了4个小时之后,霍金似乎转变了态度。

介绍完DeepMind的负责人,我们把目光转回到AlphaGo。事实上,AlphaGo成名已久,曾经先后与Crazy Stone和Zen(两款知名围棋程序)进行了500局对弈,仅有一局失利。此外,其也优于围棋程序Dark Forest,后者得到了马克·扎克伯格的支持。AlphaGo具备策略网络(Policy Network)和估值网络(Value Network)能力,前者分析局面、预测对手招式,后者负责判断胜率,可以在2微秒内走出一步棋,而Dark Forest仅具备第一种能力,并且走棋所花费的时间也要更慢。

当然,真正让AlphaGo成名的还是战胜欧洲围棋冠军樊麾,这在当时引起了轩然大波,甚至推升了谷歌的股价,毕竟这是电脑对人脑的一次胜利。更重要的是,站在计算机的角度来看,与象棋相比,围棋的难度要大很多,每个步数的潜在组合非常复杂,曾有专家说AI十年内都无法掌握围棋。

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,李世石输了。

阿尔法围棋(AlphaGo)是一款围棋人工智能程序。这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。

深度学习

阿尔法围棋(AlphaGo)的主要工作原理是“深度学习”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

两个大脑

阿尔法围棋(AlphaGo)是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13 个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

这些网络通过反复训练来检查结果,再去校对调整参数,去让下次执行更好。这个处理器有大量的随机性元素,所以人们是不可能精确知道网络是如何“思考”的,但更多的训练后能让它进化到更好。

第一大脑:落子选择器 (Move Picker)

阿尔法围棋(AlphaGo)的第一个神经网络大脑是“监督学习的策略网络(Policy Network)” ,观察棋盘布局企图找到最佳的下一步。事实上,它预测每一个合法下一步的最佳概率,那么最前面猜测的就是那个概率最高的。这可以理解成“落子选择器”。

第二大脑:棋局评估器 (Position Evaluator)

阿尔法围棋(AlphaGo)的第二个大脑相对于落子选择器是回答另一个问题。不是去猜测具体下一步,它预测每一个棋手赢棋的可能,在给定棋子位置情况下。这“局面评估器”就是“价值网络(Value Network)”,通过整体局面判断来辅助落子选择器。这个判断仅仅是大概的,但对于阅读速度提高很有帮助。通过分类潜在的未来局面的“好”与“坏”,AlphaGo能够决定是否通过特殊变种去深入阅读。如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。

那么,汇集了AlphaGo背后“最强大脑”的谷歌DeepMind究竟是一个什么样的存在?

打开DeepMind的官网,“破解智能,用它来让世界变得更好”的口号赫然映入眼帘。官网介绍称,DeepMind是由哈萨比斯(Demis Hassabis)、雷格(Shane Legg)与苏莱曼(Mustafa Suleyman)三人于2010年在伦敦创立的。

搜索一下资料我们可以发现,在这三人中,哈萨比斯是英国著名人工智能研究者,同时也是神经系统科学家、电脑游戏设计师与世界级的游戏选手,从小就有“神童”称号。雷格专注于机器学习领域,拥有人工智能领域的博士学位。苏莱曼则是一名英国企业家,除了帮助创立DeepMind,他还参与创立了一家专门研究社会问题、提供“冲突解决方案”的公司。

2014年,DeepMind正式被谷歌纳入麾下,这也是谷歌截至目前在欧洲地区的最大收购案。据传,在谷歌之前,包括特斯拉创始人马斯克、创始人扎克伯格在内的许多硅谷大佬们也都曾向DeepMind抛出过橄榄枝。可以说,虽然成立不到6年,但这家公司却似乎没有经历多少创业企业的艰辛,而是很早就飞上了枝头,成为了各类大牌科技企业、风险投资机构眼中的“香饽饽”。

那么,抛开一些科技企业拿人工智能炒作的嫌疑不提,DeepMind在成立的六年里又主要干过些什么? 为什么他们会具备受硅谷大佬青睐的潜质呢?

潜质之一,或许是这个团队对人工神经网络的研究。据媒体报道,早在2013年,DeepMind就创造出了可以模仿人类思维、学习如何玩电子游戏的人工神经网络。当年,DeepMind还获得了剑桥大学计算机实验室的“年度公司”奖项,名声大震。

DeepMind在人工智能、深度学习领域的研发实力还可以从成立以来发表的各类学术论文中一窥。近六年来,该公司不断在包括Neuron(号称神经科学界的“顶级期刊”)、Nature(全球最权威学术期刊之一)等杂志发表研究成果。尤其是在2014年被谷歌收购后,发表的尖端研究成果数量更是与日俱增。

最后一个,当然也是最给DeepMind“长脸”的就是AlphaGo。资料显示,AlphaGo和过去挑战人类的机器们最大的区别在于,它是一款具备“深度学习”功能的机器人,也就是说他不是为了下棋而设计的,是来“学习”下棋的,无时无刻不在模仿人类的思维进行学习。

那么AlphaGo究竟是怎么思考的?

AlphaGo的两个“大脑”

资料显示,AlphaGo下围棋的原理和人类有相似之处,一是判断局部,二是把握全局。

DeepMind此前在Nature杂志发表的一篇论文中,也曾有过细节方面的介绍。简而言之就是,AlphaGo总体上由两个不同功能的“大脑”网络组成:策略网络(Policy network)和价值网络(Value network)。

对弈中,AlphaGo的两个“大脑”协同工作。策略网络负责在当前局面下判断“最好的”下一步,可以理解为落子选择器;价值网络负责评估整体盘面的优劣,淘汰掉不值得深入计算的走法,协助前者提高运算效率,可以理解为棋局评估器。然后,两个“大脑”取各自选择的平均值,做出最终的决定。

AlphaGo不断升极的“脑力”也可以用它的战绩来证明。2015年,它就曾以5:0的绝对胜利打败过欧洲围棋冠军樊麾,让DeepMind由此有了向李世石“叫阵”的基础。据称,2015年那次也是人工智能程序首次在不让子的情况下战胜人类围棋选手。这一战绩,加上9日首场比赛就战胜了李世石,DeepMind对AlphaGo的信心或许还真不是空穴来风。

那么,在发明了迄今为止“史上最强机器人围棋选手”、名利双收后,DeepMind还打算干些什么?据透露,目前DeepMind正在与英国NHS(国家医疗服务体系)进行合作,并已经成立了“DeepMind健康”项目,并希望通过技术手段,帮助有意向参与的医护人员提高服务质量。或许在围棋选手后,DeepMind的下一个创造就是“机器人医生”。

在AlphaGo和李世石第二局对弈的尾声,担任评论的国家围棋队总教练明明知道李世石输了还在批评AlphaGo有俗手,声称如果他来给调一下,AlphaGo会下得更好,这说明他不光不懂人工智能,而且不懂围棋。

先说围棋:围棋如果目标是赢,俗手不俗手就不是判断依据,以前人的算力不足,只能借助模式识别能力来做模糊判断,但方法一模糊,判断的标准也就模糊了,所谓是否俗手的判断力,肯定有些对有些错,但会有大量的僵化的错误运用,最终导致鱼龙混杂……听听,像不像是在说中医!

再说人工智能:训练人工智能已经越来越像培养孩子了,你给他准备好他该上的课程(不是指死记硬背的内容,而是循序渐进的学习框架),再给他足够的时间练习,持之以恒,孩子的能力一定会逐渐增长的。其实孩子学习不好,绝大多数不是智力问题,而是各种原因导致的情绪问题。机器恰恰不存在情绪问题,只要设计的课程体系对了(在人工智能里就是所谓神经网络),练习足够充分(在人工智能里就是所谓深度学习),就一定能掌握好新能力。但是,长辈切忌把自己以为对的方法或知识强灌给孩子,知识是否正确,是在系统引导下、在充分的实践中总结出来的,越人为干涉效果越差。

围棋这个例子说明,人类的能力是有局限性的,在对很多复杂事物的认识上,人类的知识可能根本就是不完备的,甚至有大量谬误,围棋只是一个简单的例子,对很多复杂系统的认识都是如此,比如社会,比如经济,比如企业管理,比如中医养生......

机器战胜人类选手,是围棋历史上的一小步,却是人类历史上的一大步,尤其是AlphaGo和李世石对弈的第二局,证明了机器已经不用靠等人类犯错来取胜了,人类不犯错也赢不了,说明机器对围棋本质的理解超越的人类。人类本来就很难理解到复杂事物的本质,该是人类在机器的帮助下更新对世间万事万物的理解的时候了。

而人工智能的优势在于,只要给定目的,通过自我完善,机器就能做得越来越好,最终成为真正的专家,听听,是不是有点儿进化论的味道?本来嘛,人那么万能的动物,不也是进化来的吗!

因此,AlphaGo战胜人类顶尖围棋选手的意义,不在于什么挑战了人类智力游戏的极限,也不在于未来会让多少人失业,不在于达到了机器超越人类智力的奇点,而在于它宣示着另一种奇点的到来--人类可以借助非人类的认知能力去理解复杂事物的本质规律了。

不过对于人这种总喜欢清楚地了解因果的动物来说,人工智能能通过做得比我们好的结果来说明它们掌握了复杂事物的规律,但它们却不能清楚地详细道出其中的因果,因为多因素的综合作用,即使你能预测结果,也无法清晰地表述因果,人不行,机器也不行。

所以虽然有了个强力的助手,却不能增进我们对事物的显现知识的了解,至少不是详细的了解,但却不妨碍我们把事情做得越来越好。当然,这没什么大不了的,其实我们早就生活在一个自己无法完全了解的世界里了,想想相对论,想想量子力学,想想大脑的认知结构,你真的掌握了相关的专业知识吗?你确信自己不只是在重复科学家们、课本里、甚至只是媒体上的观点而已吗?多数人之所以相信相对论是正确的,并不是自己能做出清晰的证明,而只是知道爱因斯坦被公认为20世纪最伟大的科学家,并因此对他的言论产生的信任甚至盲目崇拜吧。

未来,AlphaGo(阿法狗)和Watson之类的智能工具将无处不在,人类将进入人仗狗势的时代。我们将能借助人工智能总统回避掉满嘴跑火车的川普;我们将能借助人工智能总经理提升公司业绩,甚至做到基业长青;我们将能借助人工智能管家管理我们的生活,让我们专注于最富创造力、最能彰显人性的事情上。当然,前提是,你不光要会利用人工智能,和人工智能亲密合作,还要像信任爱因斯坦一样信任人工智能。

这,才是真正的奇点,人工智能的奇点,这个奇点将会造成人类能力的空前进步,人类创造力的空前释放,人类文明的空前繁荣。

以上,是关于阿尔法的一些简单介绍,亲们可以了解一下~~!

游客评论

热门评论

最新评论

发表评论 查看所有评论(0)

(您的评论需要经过审核才能显示) 字数: 0/500

本周热门

找游戏 下应用

排行榜

游戏软件破解

关于安卓网 | 联系方式 | 发展历程 | 下载帮助(?) | 广告联系 | 网站地图 | 友情链接

Copyright 2011-2014 5577.com安卓网 鄂ICP备15005058号-1