去年,围棋程序阿法狗(AlphaGo)连续击败多名人类围棋大师,最终夺得世界围棋冠军宝座。而就在前不久,谷歌DeepMind公司宣布阿法狗的妹妹,“史上最强人工智能”阿法零(AlphaGoZero)诞生。人工智能真的迎来了技术爆炸吗?这对我们又是福是祸呢?
在2016年击败柯洁,李世石,成功在围棋领域战胜人类的人工智能阿尔法狗,最近又传来了新的大新闻。
10月19日凌晨,阿法狗的开发公司DeepMind在知名期刊Nature上发表了一篇论文,宣布他们已于前不久研发成功了最新一代人工智能程序:阿法零(AlphaGoZero)。按照DeepMind开发团队的说法,阿法零不仅战胜了此前开发过的所有版本的阿法狗,且首次在人工智能领域实现了完全脱离人类的自我学习。
一个崭新的时代的曙光可能已经出现在地平线上了。
“这是全世界迄今为止最强大的人工智能”,团队主要负责人DavidSilver教授在采访中说。
在测试中,阿法零以100场全胜0负的绝对碾压优势战胜了她的姐姐—曾经在2016年击败韩国棋手李世石的阿法狗,此外,在和阿法狗强化版Master的对战中,阿法零也取得了89胜11负,接近90%的优胜率。而Master就是曾经3:0击败柯洁的那个人工智能。但这还不是最让人震惊的地方。要知道,在早期开发阶段,DeepMind公司为阿法狗输入了大量人类顶尖围棋棋谱,供其研习人类下围棋的套路。无论是阿法狗还是Master,她们的围棋技能提升很大程度上依赖于对人类的模仿。
而阿法零则完全没有得到任何“指点”,她对围棋的所有了解仅限于规则而已。开发者没有为阿法零提供任何帮助,而只是设计了一套“自我博弈”的学习机制。阿法零和一个自身分裂出来的“陪练”进行对弈。每一次,对手的水平都和自己旗鼓相当,在博弈中慢慢成长,总结和学习。换句话说,阿法零的围棋技能完全是从零开始无师自通的,Zero之名,即由此而来。
让科研人员自己都没有预料到的是,这种自我学习的成长速度可以用恐怖来形容。在论文中,DeepMind详细记载了阿法零在短短72小时内,如何实现了从猴子扔石头一般的菜鸟水平到纵横捭阖整个棋局的一代宗师的飞升。开始训练3小时,还是毫无章法,12小时,看起来摸到门路了,72小时,她达到了多少人类棋手终其一生都无法抵达的围棋九段水平。
就好像一个对武功一无所知的小白,只被人教了怎么握剑怎么劈刺砍,没学过任何剑法就闭门修炼,却练成了吊打武林一众高手的最强武功。
“我可以代表我们团队说,她的表现让我们都感到惊喜”,David教授在镜头前难掩兴奋,仿佛一个看着自己孩子长大的父亲。“她的表现已经超过了所有人的预期,她的能力一直在增长,胜率一直在增加。40天后,她已经打败了我们所制造过的所有阿法狗。”
阿法零在ELO等级分制度(一个博弈游戏评价体系)名列第一
另一方面,由于阿法零不依赖于大数据计算,也降低了它的成本。此前的阿法狗需要48个TPU(谷歌开发的深度学习芯片,类似手机电脑的CPU),而阿法零只需要4个就可以运行。
低成本,简洁算法,不依赖于人类经验,阿法零的原理很有可能有非常广阔的应用前景。“阿法零的成果完全可以迁移到其他领域,”DeepMind联合创始人和CEODemisHassabis如此说,“例如新能源,新材料和蛋白质折叠研究中。”
科幻电影《终结者》中,人工智能“天网”觉醒自我意识,发射核弹毁灭了全世界,之后制造出大量“终结者”机器人和人类展开旷日持久的战争。
科技圈内的名人对此也有类似看法,霍金,比尔盖茨和马斯克在不同的场合都发出过警告,认为人类不应低估人工智能发展可能带来的严重后果。马斯克在麻省理工学院参加研讨会时表示,研究人工智能如同在召唤一个恶魔,“如果让我猜人类最大生存威胁,我认为可能是人工智能。”
在去年阿法狗战胜柯洁后,关于人工智能会不会反而统治人类的讨论也一直在网上进行。
“当这个节点发生的时候,电脑对于世界的感知大概和一个四岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。”
想象一下,爱因斯坦和霍金的智商仅仅是正常人类的1.3倍到1.5倍,那么比人类智商高17万倍的电脑是什么样子?对于这样一个超级大脑,攻克所有绝症,发现宇宙的终极定律,破解能源危机乃至让人类永生,都不会是什么困难的事。
但反过来说,这样一个人工智能究竟是怎么看待人类?我们不知道。正如蝼蚁无法想象人类的想法(更不用提我们和超级AI之间的差距比蚂蚁大得多了),人类很可能完全无法理解人工智能的思路,而在如此天壤之别的智力差距下,任何试图阻止AI的行为都会很可笑。一如蚂蚁无法阻止人类一样。
如果你设定一个人工智能的目标是让你笑,那它可能会把你脸部肌肉弄瘫痪,来让你永远保持笑脸。如果你把目标设定成保护你的安全,它可能会把你永远关在家里。如果你让他终结所有饥荒,它可能会想:“太容易了,把人类都杀了就好了。”如果你把目标设定成尽量保护地球上的生命,那它会很快把人类都杀了,因为人类对其它物种是很大的威胁。
不过,上文这种观点更多的还是停留在哲学或科幻层面的讨论。多数人工智能学者不认为目前的人工智能研究水平达到了应该担心的程度,即使是最强大的阿法零,根本上也仅仅是在一个新领域有所突破,目前为止她除了下围棋还是什么都不会做的……
但人工智能在近几年的发展,确实可以用飞速来形容,在2012年左右的时候,围棋程序在让4或5子的基础上才能勉强击败九段围棋选手。仅仅五年后,它们就已经可以藐视一切人类对手了。几年后又会有什么新的变化?是就此止步,还是引发如同工业革命一般的又一轮技术爆发,乃至真的如上文所说,将带领我们走向死亡或永生?或许我们已经站在了一个崭新时代的门槛上,又或许我们只是目睹了一场即将落幕的科技大戏的终场。无论如何,就像《银河系漫游指南》中说的那样,“不要慌(Don'tpanic)”。
科技一直都是一把双刃剑,用得好可以为人类披荆斩棘开拓新的旅程,使用不当,也会伤到自己。大胆探索,但不要忽视风险,就好了。