一、世界人工智能发展历程和方向——大势所趋
人工智能(ArtificialIntelligence,简称AI)是指在机器上实现相当乃至超越人类的感知、认知、行动等智能。按照智能能力的不同,人工智能通常可分为通用人工智能和专用人工智能,或被称为强人工智能和弱人工智能。目前对通用人工智能有两种理解:一种是通用性的人工智能(GeneralArtificialIntelligence,简称GAI)是媒体和社会公众的一般理解,指的是能够处理很多任务的智能;另一种则是人工智能专业领域的准确名称,即人工通用智能(ArtificialGeneralIntelligence,简称AGI),是指在人工智能所有方面都达到人类水平,能够自适应地应对外界环境挑战,完成人类能完成的所有任务的人工智能。
长期以来,人工智能系统都是为了实现特定或专用目标任务的智能,属于弱人工智能或专用人工智能范畴。2018年以来,大规模预训练模型(简称大模型)通过在海量无标注数据上依托强大算力资源训练能适应一系列下游任务,实现了通用性的人工智能(GAI),拉开了通用人工智能的序幕,但当前仍没有达到真正的人工通用智能(AGI)。
(一)人工智能发展历程
人工智能的概念最早于1956年在美国达特茅斯学院召开的夏季研讨会上被正式提出。纵观人工智能近七十年的发展历程,大体上可分为三个阶段。
以上三个阶段中,前两个阶段的主要思路是设计新的理论和算法,用机器模拟人的智能,尽管在理论方法上取得了进展,但由于目标过高,与应用结合不够,使得人工智能发展几经起伏。第三阶段基于大数据的深度学习技术已成为当前人工智能的主流发展路径,在计算机视觉、自然语言处理、智能语音等技术领域实现了规模应用。其中,计算机视觉是人工智能技术中应用最为广泛的领域。计算机视觉是指通过计算机对图像或视频进行处理,使其能够自动识别、分析和理解图像或视频中的信息。2015年,由微软亚洲研究院何恺明、孙剑、任少卿、张祥雨提出的深度残差学习网络ResNet成为计算机视觉领域具有里程碑意义的代表性技术。ResNet的出现,使得超过上百层的更深层网络可以更有效地进行训练,推动了深度学习技术不断探索能力极限。目前,ResNet已经成为计算机视觉任务的首选架构,例如图像分类、物体检测和图像分割等。2023年,基于为人工智能作出的基础性贡献,ResNet的四位作者获得了未来科学大奖。
(二)当前人工智能发展新趋势
2018年以来,大模型首先在自然语言处理领域取得突破,以ChatGPT为代表的现象级产品拉开了通用人工智能的序幕,引发了新一轮人工智能发展浪潮。当前人工智能发展已由小模型时代迈向大模型时代。
大模型是“大数据+大算力+强算法”结合的产物,至少具有三个特点:一是规模大,神经网络参数规模要达到百亿以上;二是涌现性,要产生预料之外的新能力,这是人工智能发展近70年来,最具里程碑意义的新特性;三是通用性,能够解决各类问题。
ChatGPT之所以能表现出色,主要归因于几个关键方面的技术和策略。第一,其采用了大规模的训练数据,特别是互联网文本数据,以捕获丰富的知识和语言模式。第二,模型基于高效的Transformer架构,该架构通过自注意力机制,能够有效处理输入序列中各位置信息间关联依赖关系,极为适合自然语言处理任务。第三,ChatGPT通过多任务学习,提高了其在多样化问题上的泛化能力和生成能力。第四,模型还针对特定任务进行了微调,以更好地适应和解决特定领域或场景下的问题。第五,通过利用强化学习等技术进行模型调优,ChatGPT在特定任务上的输出更加接近人类的习惯,进而表现得以进一步提升。这些技术的融合和应用,使ChatGPT成为了文本问答任务中的佼佼者,激发了公众对强人工智能未来发展的无限遐想。
除语言能力以外,大模型也在迅速扩展视觉、听觉、具身(有身体的智能,能与环境进行交互)、行动等其他通用智能能力,在向多模态方向发展的同时,也将逐渐进入现实世界,发展实体智能,引发下一波人工智能发展浪潮。
但是,也应看到,大模型等通用人工智能技术在给世界经济社会发展带来巨大机遇的同时,也带来了难以预知的各种风险和复杂挑战。大模型是高度复杂的人工智能系统,特点是难以预测,当前取得的进展基本上是通过经验模式取得,大模型背后的智能发生和涌现机理尚不清晰,国际社会对如何构建一个安全的人工智能系统仍知之甚少。当前以大模型为代表的通用性的人工智能(GAI)已显现出伦理道德、数据安全等一系列风险,需要加强安全监管。未来,面对伴随着人工通用智能(AGI)的到来可能会引发的人类生存性风险,更需要严加防范。加强通用人工智能治理已成为世界各国面临的共同问题。
随着人类探索通用智能发展路径的越发清晰,全球正处于“AGI”(准强人工智能)的前夜,处在一个不确定性的状态,未来需要对大模型基础原理、安全与价值观对齐、人工通用智能(AGI)风险控制策略等方面开展深入研究,促进人工智能技术造福于人类。
(三)世界大国加快人工智能战略与政策部署
各国组建新型人工智能研发机构。美国国家科学基金会协同联邦机构,包括国土安全部、国防部、教育部、农业部等,联合成立了25家国家人工智能研究院;欧洲计划建立一所世界级人工智能研究所,在英国等多个欧洲国家设立科研中心;法国提出新建人工智能中心,并组建人工智能研究网络;英国扩建阿兰·图灵研究所,启动数据伦理与创新中心建设,成立新的人工智能技术学院。全球各大人工智能跨国公司和领军企业也在加快布局人工智能研发中心。
目前,全球人工智能发展正处于由弱人工智能向强人工智能过渡的阶段,人工智能已然成为主导国家战略竞争力的重要支撑和推动科技革命的重要力量。未来,“人工智能+高速移动互联”将成为人类社会生活的基本场景。着眼更长远的未来,强人工智能将会带来颠覆性、全局性影响,谁率先实现突破,谁就会掌握未来发展的主导权。如果我国在新一轮人工智能发展中落后,将会在全球竞争中处于不利地位。
二、中国人工智能发展现状和前景——大有可为
(一)我国人工智能基础理论和部分关键技术实现突破,人工智能与经济社会融合不断深入
经过多年的持续研发布局,我国人工智能科技创新体系逐渐完善,智能经济和智能社会发展不断深入,取得显著成效。
一是人工智能基础理论快速积淀。近年来,国内学者在问题求解、演化计算、模式识别、专家系统、智能控制等经典人工智能领域多有建树。特别是在新兴的深度学习理论和推理算法方面开展了大量研究,例如,北京大学提出深度跨媒体学习方法,显著提高了跨媒体检索的准确率;南京大学提出的“深度森林”模型是国际上第一个非神经网络和BP(反向传播)算法的深度学习方法。在类脑计算方面加强布局,类脑芯片、类脑计算系统、类脑应用等取得积极进展;中国科学院在脑机接口领域取得突破,研发了目前运行最快的头皮脑电(EEG)脑机接口系统;华为公司上线了气象大模型,在一系列气象学家关心的精度指标和极端天气预报中都展现出优势,具有强大竞争力和巨大潜力。
二是人工智能部分关键技术跻身世界先进水平。本轮人工智能技术爆发初期,我国在中文信息处理、生物特征识别、机器翻译、智能处理器、自动驾驶和智能机器人等技术方向上紧跟世界前沿,实现了部分人工智能关键技术突破。麻省理工学院第十七任校长拉斐尔·莱夫评价认为,中国在人脸识别和语音识别等人工智能领域居世界领先地位。主要包含了以下阶段性成果:中国科学院研发推出全球首款商用深度学习专用处理器“寒武纪”芯片,在运行主流智能算法时性能功耗效率大幅超越中央处理器(CPU)和图形处理器(GPU);商汤科技的图像识别技术、科大讯飞的语音识别与合成技术和语言翻译技术的产业化水平目前处于世界前列,受到国际认可。
在人工智能基础软硬件方面,华为发布了基于达芬奇架构的昇腾910和昇腾310两款人工智能芯片,力争打造以芯片为载体、从底层算法到应用开发的完整生态,为全球开发者和企业提供新的选择,也为我国企业提供了安全保障。在此基础上,鹏城实验室推出了“鹏城云脑Ⅱ”和正在研制“鹏城云脑”下一代设施。“鹏城云脑Ⅱ”是基于华为国产人工智能芯片打造的,作为国内首个全面自主可控的E级智能算力平台,具有国际领先的人工智能算力水平,已经在多个国际榜单上取得冠军。该平台约70%的机时对外开放共享,已支撑近千个国产人工智能模型训练任务与人工智能算法发布,成为我国最重要的开放共享、自主可控的人工智能大模型训练平台之一。而“鹏城云脑”下一代设施将是一款面向6G超宽带通信的智能化工具平台,采用了超大规模、高性能计算的体系架构,在芯片和系统全链条上均按照低功耗来设计,预计在2025年完成。“鹏城云脑”大科学装置将进一步推动我国人工智能国产自主产业生态的发展,必将成为支撑新一代智能网络通信创新研究的重大科学基础设施。
四是人工智能发展的创新生态初步构建。科技部在自动驾驶、城市大脑、智能医疗、智能语音、智能视觉等领域已构建起国家级开放创新平台,助力中小企业科技创新,推动行业技术进步和产业升级。某智能语音平台开发者团队数量超过80万家,已形成了覆盖技术研发、基础平台、物联网、智能硬件等完整人工智能产业链;某自动驾驶开放平台合作伙伴超过120余家,形成了全球规模最大的自动驾驶生态,覆盖了包括整车厂、零部件厂商、出行服务商、初创企业、通信企业、高校和地方政府等产业链各个环节。同时,人工智能领域的众创空间、孵化器、加速器快速发展,创业孵化体系逐步完善。
(二)中美引领大模型发展,我国语言大模型与美国差距正在逐步缩小,视觉、多模态、具身等新一代大模型有望实现齐头并进
目前,国际大模型领域已形成美国引领,中国紧跟的格局。根据中国科学技术信息研究所2023年5月发布的《中国人工智能大模型地图研究报告》,从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,中国在大模型数量方面位居全球第二。
中国大模型研发呈现蓬勃发展态势。截至2023年5月已发布79个大模型,大部分为语言大模型。
国际上的基础大模型主要分为语言、视觉、多模态等主要类别。其中,在语言大模型方面,OpenAI的GPT系列和谷歌PaLM2等已形成领先优势,我国已研发出智源“悟道·天鹰”、百度“文心”、华为“盘古”、“鹏城·脑海”、阿里通义等语言大模型,但与海外顶尖水平仍有一定差距。随着人工智能模型开源生态的繁荣,中美大模型的差距将逐步缩小。
在视觉和多模态大模型方面,我国有望扭转跟随局面,实现中美齐头并进。视觉大模型上,智源研究院创新研发路径,首创“上下文图像学习”“以视觉为中心”作为核心建模思想,用图像理解、解释、输出图像,研发出视觉通用多任务模型Painter,对Painter模型针对物体分割任务作出优化后,研发出国际首个利用视觉提示完成任意分割任务的通用视觉模型SegGPT,已成为与Meta发布的基础图像分割模型SAM齐名的国际视觉大模型关键里程碑成果。多模态大模型上,智源研究院研发出首个打通多模态输入到多模态输出的统一多模态预训练模型Emu,超越了此前DeepMind的多模态大模型Flamingo,刷新八项性能指标,并且模型能力覆盖图像与文本的生成及视频理解,能完成任意图生文和文生图的多模态任务。中国科学院自动化所研发出的三模态(图文音)大模型“紫东太初”目前已具有全模态能力,达到国际先进水平。
(三)我国人工智能整体发展已进入全球第一梯队
美国智库信息技术与创新基金会(ITIF)2019年发布《谁在人工智能竞赛中获胜:中国、欧盟还是美国?》报告,从人才、研究、企业发展、应用、数据、硬件六个维度,系统性对比中美欧人工智能技术创新与生态构建能力。2021年1月,ITIF发布该报告的2021年更新版本,指出美国仍然保持着巨大的总体领先优势,但中国得分相比于2019年有明显增长,总排名反超欧盟上升至第二位,仅次于美国。我国的应用场景丰富,相比国外有一定优势。但是,报告也显示,中国在人工智能研究、人才、企业发展等方面与美国相比差距明显。
根据英国媒体机构TortoiseMedia发布的2023年全球人工智能指数排名,目前人工智能领域综合情况全球排名前三的国家分别是美国、中国和新加坡。其中,中国在运营环境和政府战略方面领先于美国,在基础设施、科研、发展、商业紧随其后,但在人才方面与美国差距较大。
另据中国科学技术信息研究所2023年7月发布的《2022全球人工智能创新指数报告》,按照2022年人工智能创新指数得分排名,将46个参评国家分为四大梯队,其中,第一梯队国家得分为50分以上,只有美国和中国进入,中国人工智能创新指数已连续三年保持全球第二的水平。
(四)我国人工智能发展的优势条件
目前,我国在人工智能技术上持续深耕、快速积累,在政策、数据和市场应用上具有一定优势。
一是强有力的战略引领和政策支持。2017年《新一代人工智能发展规划》发布后,开启了我国人工智能发展的系统部署。《规划》发布后,各部门和地方积极推动落实,国家发改委、教育部、科技部、工信部等部门相继出台多项举措,北京、上海、天津、重庆、广东等近20个省市出台了人工智能规划和行动计划,纷纷加大研发投入,设立研发机构,制定人才引进、财税优惠等配套政策,带动企业加快智能化步伐,产学研协同推进人工智能发展的格局初步形成。
三是丰富的应用需求孵化应用场景。我国具有全球规模最大、较为成熟的互联网市场,人工智能在互联网领域的应用空间广阔。我国作为全球制造业大国,各细分领域都面临转型升级,对人工智能应用具有巨大需求。我国新型城镇化加速推进,城镇规模不断扩大,利用人工智能改进城市基础设施、提升城市治理水平潜力巨大。同时,我国老龄化问题日益突出,居民收入水平不断提升,消费结构加快升级,对医疗、教育、养老等智能化产品和服务需求迫切。
四是具有潜力的青年人才快速成长聚集。我国加大对人工智能人才培育。2018年,国家自然科学基金委新设人工智能一级学科代码F06,加大对人工智能基础研究的支持;国务院学位办2022年底新设智能科学与技术一级学科,全国各大高校加快布局人工智能学院,扩大本科和研究生培养规模。我国人工智能学者数量大幅增加。根据清华大学AMiner数据库分析,截至2023年6月,全球人工智能学者数量共计16.4万人(这里“人工智能学者”指在国际人工智能领域顶级会议或顶级期刊上发表过至少一篇论文的科研人员),其中,我国人工智能学者约3.6万人,占比21.9%,与美国人工智能学者数量(3.7万人)相当。在学者成果产出方面,2022年,我国人工智能论文总量和高被引论文数量已居世界第一,并且我国人工智能专利数量略微领先于美国和日本。
(五)我国人工智能发展的薄弱环节
一是人工智能基础理论和原创算法差距较大。我国人工智能研究起步晚,原创性贡献不多。近年来,随着各国加快人工智能理论创新探索,模型和方法不断有新的突破,包括深度学习模型、生成对抗网络等新的重大成果和原创性理论贡献仍以西方国家为主。大模型构建、训练、调优对齐、推理部署等多个流程使用的主要算法及核心技术大部分来自美国。虽然我国在人工智能领域内高影响力论文数量增长明显,顶级论文和重大理论创新还主要源自美国、英国、加拿大等国家。
二是在高端芯片、关键部件、高精度传感器等方面基础薄弱。在图形处理器(GPU)、专用集成电路(ASIC)和现场可编程门阵列(FPGA)等人工智能芯片方面,英伟达、英特尔、高通、超威等欧美国家企业占据垄断地位:英伟达在GPU领域占据了全球近84%的市场份额,赛灵思(Xilinx)和阿尔特拉(Altera)占据了FPGA市场将近61.9%的份额。美国波士顿动力公司的人形机器人产品(Atlas)依靠其在高精度传感器和运动控制算法上的巨大优势,目前已连续完成台阶跳跃、后空翻、单腿三级跳等高难度动作,在智能感知和智能行为融合上达到新的高度。
三是尚未形成具有国际影响力的人工智能开源开放平台。当前,国际巨头企业纷纷建立人工智能开放平台,打通硬件—系统—产业链条,主导建设创新生态。我国在面向特定应用领域已经陆续建立了国家级人工智能开放平台,但在机器学习等通用开源算法平台方面布局不够,且对产业链的带动性不足,国际影响力不够。
六是高水平人才不足。根据清华大学AMinerAI2000全球最具影响力人工智能学者榜单,在全球人工智能高影响力学者(全球最具影响力人工智能学者入选依据:近十年间,人工智能的20个子领域里论文被引量分别排名前100的学者上榜,各领域排名前10的学者当选当年最具影响力学者)中,美国人数最多,近三年均稳步在1100人以上,占比约六成;中国位列第二,数量稳步增加,超过了230人,占比一成多,但与美国的差距并没有缩小,美国是中国的近五倍。
从以上几点来看,我国发展人工智能既有很好的基础和优势,也面临巨大挑战,需要探索一条适合我国国情的发展道路。应坚持科技引领、应用驱动的战略导向,以促进人工智能与经济社会深度融合为主线,以提升科技创新能力为主攻方向,全面推动人工智能应用。应通过科技引领和应用驱动的双向发力,实现我国人工智能在理论上尽快补上短板,技术上自主可控,产业上占领制高点,全面增强经济创新力和国际竞争力。
三、全面推进中国人工智能高质量发展——勇毅前行
2023年4月28日召开的中共中央政治局会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。我国人工智能发展要深刻把握国际通用人工智能技术发展趋势,开展前瞻性技术研究,着力实现弯道超车。同时,要加强政策、人才、底层基础软硬件、开源开放等生态环境的打造,营造良好环境。另外,要加强风险研判,积极推进人工智能治理,推动我国新一代人工智能持续健康发展。
(一)持续完善我国人工智能规划和政策体系
(二)加强通用人工智能基础理论研究和关键技术研发
前瞻布局通用人工智能前沿技术研究,开展大模型基础原理和新架构探索,视觉、视频、多模态、具身等下一代大模型研究,利用大模型解决重大科学问题,形成具有国际影响力的通用人工智能原创理论体系。
引领通用人工智能关键核心技术创新,重点突破分布式高效深度学习框架、大规模认知与推理、可控内容生成、高效低成本训练与推理等关键算法研发,建立我国通用人工智能技术创新体系。
(三)夯实人工智能基础软硬件生态底层基础
推动国产人工智能芯片实现突破,面向通用人工智能技术发展需求,能够全面支撑大模型训练、多模态处理、科学计算等场景算力需求,并探索可重构、存算一体、超规格高算力智能芯片等新型架构芯片,提供支撑我国人工智能发展的算力保障。加强自主开源深度学习框架研发攻关,在大模型分布式训练和多端多平台推理部署等方面提升核心能力,研发模型开发、训练、压缩、推理全流程工具。支持人工智能芯片和深度学习框架开展广泛适配和融合优化,打造人工智能国产基础软硬件深度协同生态。
(四)加强数据、算力等资源的汇聚及共享
夯实算力基础设施建设。加强智算中心建设,逐步提高算力设施国产化率,为大模型研究提供高性能计算资源和服务。推动中国算力网建设,实现国家级超算中心、智算中心、“东数西算”数据中心的互联互通,实现全国大型算力的协同调度和高效计算,推动云、网、算等资源融为一体,形成支撑数字经济发展的国家级算力基础设施和统一算力大市场,为人工智能技术创新和产业智能化转型提供普惠算力。
(五)加强人工智能风险预判和治理体系建设
(六)强化人工智能在服务企业升级中发挥更大作用
人工智能作为一项渗透性极强的颠覆性技术,对实体经济及社会生活的方方面面都具有极其重要的意义,是建设现代化经济体系、实现高质量发展的重要支撑。企业作为社会经济活动的基本单位,直面市场、服务市场,是最活跃的创新力量。要实现传统产业改造,新兴产业不断壮大,现代化产业体系加快形成,就要打好一套“组合拳”。一是龙头企业要发挥引领作用,打造开放、协同、共享的创新生态系统,特别是构建一个包括从基础研究到应用推广的全链式人工智能创新生态系统,助推传统企业向智能化高端化转型。二是加大对人工智能产业的支持和投入,通过设立人工智能创新基金、支持人工智能企业上市等方式,增强该类专精特新“小巨人”利用金融力量为企业不断造血。三是搭建人工智能开放创新平台,通过平台资源和技术赋能服务企业、高校和研究院所,加速人工智能技术的研发和应用,不断提高技术创新能力。四是积极引导推动数据的开放和共享,促进各个领域之间的数据融合和互通,形成全社会共建共享的数据资源库,切实推进人工智能与实体经济深度融合。
(七)加强人工智能教育和人才培养
(八)加强人工智能国际交流与合作
我国人工智能的发展,应积极参与全球人工智能领域的标准制定和技术交流,加强与国际顶尖人工智能企业和机构的合作,推动人工智能技术的全球创新和发展。通过加强国际合作机制建设,建立人工智能领域的跨国合作框架,促进全球人工智能技术的开放和共享。加强人工智能领域的知识产权保护,建立国际人工智能技术标准和知识产权保护机制,促进人工智能技术的国际化应用和交流。积极参与国际人工智能标准制定,推动人工智能标准化国际化进程,提高我国在国际标准制定中的话语权和地位。加强国际人才交流与合作,鼓励优秀人工智能人才到国外交流和学习,引进国际优秀人才来我国工作和合作。与国际顶尖人工智能企业和机构建立战略合作伙伴关系,共同开展技术研发、应用推广、人才培养等领域的合作,加速形成具有国际竞争力的人工智能产业集群。参与国际人工智能赛事和竞赛,提高我国人工智能技术的国际影响力和竞争力。