刚刚,阿尔法狗再升级,100:0碾压旧版,三天走完了人类三千年的路

去年,围棋程序阿法狗(AlphaGo)连续击败多名人类围棋大师,最终夺得世界围棋冠军宝座。而就在前不久,谷歌DeepMind公司宣布阿法狗的妹妹,“史上最强人工智能”阿法零(AlphaGoZero)诞生。人工智能真的迎来了技术爆炸吗?这对我们又是福是祸呢?

在2016年击败柯洁,李世石,成功在围棋领域战胜人类的人工智能阿尔法狗,最近又传来了新的大新闻。

10月19日凌晨,阿法狗的开发公司DeepMind在知名期刊Nature上发表了一篇论文,宣布他们已于前不久研发成功了最新一代人工智能程序:阿法零(AlphaGoZero)。按照DeepMind开发团队的说法,阿法零不仅战胜了此前开发过的所有版本的阿法狗,且首次在人工智能领域实现了完全脱离人类的自我学习。

一个崭新的时代的曙光可能已经出现在地平线上了。

“这是全世界迄今为止最强大的人工智能”,团队主要负责人DavidSilver教授在采访中说。

在测试中,阿法零以100场全胜0负的绝对碾压优势战胜了她的姐姐—曾经在2016年击败韩国棋手李世石的阿法狗,此外,在和阿法狗强化版Master的对战中,阿法零也取得了89胜11负,接近90%的优胜率。而Master就是曾经3:0击败柯洁的那个人工智能。但这还不是最让人震惊的地方。要知道,在早期开发阶段,DeepMind公司为阿法狗输入了大量人类顶尖围棋棋谱,供其研习人类下围棋的套路。无论是阿法狗还是Master,她们的围棋技能提升很大程度上依赖于对人类的模仿。

而阿法零则完全没有得到任何“指点”,她对围棋的所有了解仅限于规则而已。开发者没有为阿法零提供任何帮助,而只是设计了一套“自我博弈”的学习机制。阿法零和一个自身分裂出来的“陪练”进行对弈。每一次,对手的水平都和自己旗鼓相当,在博弈中慢慢成长,总结和学习。换句话说,阿法零的围棋技能完全是从零开始无师自通的,Zero之名,即由此而来。

让科研人员自己都没有预料到的是,这种自我学习的成长速度可以用恐怖来形容。在论文中,DeepMind详细记载了阿法零在短短72小时内,如何实现了从猴子扔石头一般的菜鸟水平到纵横捭阖整个棋局的一代宗师的飞升。开始训练3小时,还是毫无章法,12小时,看起来摸到门路了,72小时,她达到了多少人类棋手终其一生都无法抵达的围棋九段水平。

就好像一个对武功一无所知的小白,只被人教了怎么握剑怎么劈刺砍,没学过任何剑法就闭门修炼,却练成了吊打武林一众高手的最强武功。

“我可以代表我们团队说,她的表现让我们都感到惊喜”,David教授在镜头前难掩兴奋,仿佛一个看着自己孩子长大的父亲。“她的表现已经超过了所有人的预期,她的能力一直在增长,胜率一直在增加。40天后,她已经打败了我们所制造过的所有阿法狗。”

阿法零在ELO等级分制度(一个博弈游戏评价体系)名列第一

另一方面,由于阿法零不依赖于大数据计算,也降低了它的成本。此前的阿法狗需要48个TPU(谷歌开发的深度学习芯片,类似手机电脑的CPU),而阿法零只需要4个就可以运行。

低成本,简洁算法,不依赖于人类经验,阿法零的原理很有可能有非常广阔的应用前景。“阿法零的成果完全可以迁移到其他领域,”DeepMind联合创始人和CEODemisHassabis如此说,“例如新能源,新材料和蛋白质折叠研究中。”

科幻电影《终结者》中,人工智能“天网”觉醒自我意识,发射核弹毁灭了全世界,之后制造出大量“终结者”机器人和人类展开旷日持久的战争。

科技圈内的名人对此也有类似看法,霍金,比尔盖茨和马斯克在不同的场合都发出过警告,认为人类不应低估人工智能发展可能带来的严重后果。马斯克在麻省理工学院参加研讨会时表示,研究人工智能如同在召唤一个恶魔,“如果让我猜人类最大生存威胁,我认为可能是人工智能。”

在去年阿法狗战胜柯洁后,关于人工智能会不会反而统治人类的讨论也一直在网上进行。

“当这个节点发生的时候,电脑对于世界的感知大概和一个四岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。”

想象一下,爱因斯坦和霍金的智商仅仅是正常人类的1.3倍到1.5倍,那么比人类智商高17万倍的电脑是什么样子?对于这样一个超级大脑,攻克所有绝症,发现宇宙的终极定律,破解能源危机乃至让人类永生,都不会是什么困难的事。

但反过来说,这样一个人工智能究竟是怎么看待人类?我们不知道。正如蝼蚁无法想象人类的想法(更不用提我们和超级AI之间的差距比蚂蚁大得多了),人类很可能完全无法理解人工智能的思路,而在如此天壤之别的智力差距下,任何试图阻止AI的行为都会很可笑。一如蚂蚁无法阻止人类一样。

如果你设定一个人工智能的目标是让你笑,那它可能会把你脸部肌肉弄瘫痪,来让你永远保持笑脸。如果你把目标设定成保护你的安全,它可能会把你永远关在家里。如果你让他终结所有饥荒,它可能会想:“太容易了,把人类都杀了就好了。”如果你把目标设定成尽量保护地球上的生命,那它会很快把人类都杀了,因为人类对其它物种是很大的威胁。

不过,上文这种观点更多的还是停留在哲学或科幻层面的讨论。多数人工智能学者不认为目前的人工智能研究水平达到了应该担心的程度,即使是最强大的阿法零,根本上也仅仅是在一个新领域有所突破,目前为止她除了下围棋还是什么都不会做的……

但人工智能在近几年的发展,确实可以用飞速来形容,在2012年左右的时候,围棋程序在让4或5子的基础上才能勉强击败九段围棋选手。仅仅五年后,它们就已经可以藐视一切人类对手了。几年后又会有什么新的变化?是就此止步,还是引发如同工业革命一般的又一轮技术爆发,乃至真的如上文所说,将带领我们走向死亡或永生?或许我们已经站在了一个崭新时代的门槛上,又或许我们只是目睹了一场即将落幕的科技大戏的终场。无论如何,就像《银河系漫游指南》中说的那样,“不要慌(Don'tpanic)”。

科技一直都是一把双刃剑,用得好可以为人类披荆斩棘开拓新的旅程,使用不当,也会伤到自己。大胆探索,但不要忽视风险,就好了。

THE END
1.阿法狗智能机器人相似应用下载智能阿法狗,是一款贴心实用的智能宠物私人助理!无所不知的阿法狗穿越时空来到地球,化身为小精灵,能讲笑话会陪聊,心里只装着自己和主人,然而性格反复无常,傲娇卖萌腹黑三无多种属性切换,请主人轻点调戏,否则会进入毒舌暗黑模式,后果很严重哦!应用特色:1.超强的语音识别能力!地球语沟通零障碍!萌萌还会唱歌给你听哦!2...https://m.wandoujia.com/apps/6809400
2.古今围棋最强者(二)——目瞪口呆的初赛02矛盾二、阿法狗悖论 理论上,阿尔法狗秒杀所有人类,无论如何要排在第一的。然而,AlphaGozero只排在第4。AlphaGo master 排在第9。如果说道策秀策等等说不清楚,那与master对局过得柯洁和李世石最说明问题,一个吻合度60,一个吻合度58,都在AlphaGomaster之上,这个肯定不对了。 https://www.jianshu.com/p/85a5b774b7ce
1.图商用车界的“阿法狗”终于问世了!从理念来看,这款车基本算是南京依维柯旗下轻客品牌依维柯未来的发展蓝图,也被业内专家认为是未来若干年轻型商用车的发展方向。从技术上来说,可以堪称商用车界的“阿法狗”,远远甩同类车型好几条街。 据凯斯纽荷兰工业集团亚太区副总裁、依维柯中国区总裁Michele Lombardi介绍,VISION概念车是以高效、专业的配送为目的而...https://www.autohome.com.cn/info/201605/888202.html
2.他14岁进入中科大少年班,29岁当研究员,为何说阿法狗某方面远逊...“阿法狗在和李世石下棋时,实际动用了上千个中央处理器(CPU)和数百个图形处理器(GPU),仅电费就高达上千美元。有人开玩笑说,这是一个不公平的比赛,因为李世石的功耗非常低,每天只吃两碗饭;计算机CPU和GPU却需要花这么多的电。”中国科学院计算技术研究所副所长、研究员陈云霁昨日在中国科协年会闭幕式上这样说。https://www.shobserver.com/wx/detail.do?id=390821
3.网络棋手横扫中韩高手疑似阿法狗柯洁一夜无眠首页 / 体育/网络棋手横扫中韩高手 疑似阿法狗柯洁一夜无眠 网络棋手横扫中韩高手 疑似阿法狗柯洁一夜无眠赵康丽 2017-1-2 17:02:04来源:赵康丽 相关阅读 荒唐!韩国视力障碍选手亚残奥会夺金:被曝视力1.0 还考驾照 体育 环球时报 2018-10-12 欧洲国家联赛:葡萄牙3:2力克波兰 C罗继续缺阵 体育 中国新闻...https://www.hndnews.com/p/13631.html
4.阿尔法狗是python做的吗阿尔法狗所用到的技术本文纯从技术角度,比较浅层的价绍一下阿法狗的组成:估值网络、走棋策略网络、树搜索。 1估值网络 估值网络,也叫价值网络,他是对当前的棋面进行估计,就是对当前的局面进行评估,计算一下谁领先,领先多少。就是估计两方赢得概率。在估计的同时,都假设每一方都是由阿法狗自己扮演的,因为它无法给对手建模。 https://blog.51cto.com/u_16099361/7736900
5.最强“新狗”AlphaGoZero发布柯洁:对于它的自我进步来讲,人类太...今年五月,柯洁对阵“阿法狗”。 (视频截图) 棋手古力也转发了这条微博,说:“20年不抵3天啊!我们的伤感,人类的进步!” “AlphaGo Zero”的发布再起引起网友对人工智能的热烈讨论,人工智能对人类的超越让人既惊喜又担忧。 在网友看来,机器虽然在比赛上胜过了人类,却无法取代赢得人类的情感,尤其对于广大围棋迷来说...https://www.guancha.cn/industry-science/2017_10_19_431491_2.shtml
6.柯洁对战阿尔法狗首战失利柯洁:我输得没脾气了教育频道[柯洁对战阿尔法狗首战失利 柯洁:我输得没脾气了]围棋世界第一高手中国柯洁与世界最强围棋人工智能“阿法狗”的围棋人机大战三番棋首局昨天在浙江乌镇进行,结果执白的阿法狗自始至终牢牢控制着局势,最终以1/4子的最微弱优势击败柯洁,拔得头筹。 人机大战首局柯洁执黑先行,柯洁认为阿法狗在之前连胜人类顶尖高手60局...https://edu.youth.cn/jyzx/jyxw/201705/t20170524_9861901.htm
7.柯洁微博约战AlphaGo:管你是阿尔法狗还是猫!在昨日比赛后,现世界排名第一的中国围棋选手柯洁九段在微博上发表言论,公然约战AlphaGo,不过谷歌总裁谢尔盖·布林并做出择正面回应。 柯洁在AlphaGo3:0击败李世石后,在微博写道:“来吧!管你是阿法狗还是阿法猫!我柯洁在棋上什么大风大浪没见过?让风暴再来的猛烈点吧!这个X我就装了怎样!” ...https://www.sohu.com/a/63232353_162522
8.阿尔法狗围棋十诀之九:定型抢先手朴廷桓的白3小飞不知道棋界有没有定论,阿法狗从没走过这种小飞,当然还是那句话,狗啥棋都走过,也包括这个小飞,只不过是场合下法,不会在周围这么空旷的情况下就去小飞,白3白5,在一个局部一直走(而且是走在对全局没有影响的角落里),连续送给黑棋两个先手,全局要点都被狗占去了,肯定是不行的。 http://www.360doc.com/content/21/0905/22/724272_994256308.shtml
9.“阿法狗”究竟是怎样打败世界冠军的?腾讯云开发者社区但为了赢得这场人机大战,科学家团队在训练“阿法狗”时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。 旧“阿法狗”训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。而此次,据研究团队介绍,新程序“阿法元”只使用了一台机器和4个TPU。 https://cloud.tencent.com/developer/news/208776