百度这波赢麻了!文心大模型3.5扒掉了所有国产AI大模型的“底裤”

最近,“百模大战”迎来了第一次专业会考,可以看作是各个大模型实力检验的“期中考试”。

权威IT市场研究和咨询公司IDC日前发布了首个大模型评估报告——《AI大模型技术能力评估报告,2023》,对国内主流AI大模型进行了一次专业且系统地评估。

虽然结果公布之前心里多少有个大概,但真正看到统一维度和评定标准下,各个大模型的差距直观展示到面前的时候,多多少少还是有些震撼。

IDC《AI大模型技术能力评估报告,2023》:百度7项满分、综合评分第一

这份报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一!

这三个绝对第一,把百度文心大模型的基础技术深度和产业应用覆盖广度,展现的淋漓尽致。

要知道,在全球大厂当中,百度首个发布了对标ChatGPT的大模型产品文心一言。算是起步最早,也是第一个敢于对国外大模型发起挑战的国产大模型。

所以,那句话怎么说来着,你大爷终究还是你大爷。

“百模大战”第一次会考:文心大模型3.5拿下7个满分、3个绝对第一

IDC在业界的“江湖地位”相信不用跟大家过多介绍了,从1964年至今,IDC在全球110多个国家跟踪技术趋势,也是也是最早进入中国市场的科技市场研究机构之一。

过去10年,IDC的研究报告被超100个IPO申请引用。其研究服务覆盖三大领域四大类别,在金融、能源、医疗、制造、零售、政府和通信服务等行业的研究引领全球。

在此之前,尽管各种第三方测试报告众多,但市面上一直缺少统一的大模型评估标准。大多数企业依旧在拼参数量级,通过更大的参数量来提升模型的准确度。

但“无脑”堆参数量级,到了一定程度之后,就会出现数据多少和模型的性能收益出现边际效应递减的现象,投入和产出不成正比了。随着大模型的越来越多,业界迫切需要一套科学的大模型评估标准。

IDC选择在这个时候发布第一个大模型评估报告,自然意义重大,而且极具参考价值,给大模型发展指明了道路,也为用户选择厂商提供帮助和建议。

我们来看看IDC是怎么评估大模型的。

首先,IDC将大模型分为三层,即服务生态、产品技术以及行业应用。

同时,对每一层的能力进行测评,主要考察指标为:算法模型、通用能力、创新能力、平台能力、安全可解释、大模型的应用行业以及配套服务和大模型生态等10余个指标(具体包括36项细颗粒度的评估标准),每个指标有1分-5分五个层级,得分越高代表厂商大模型技术能力越强,最终评估结果通过雷达图展示。

其次,在大模型的选择上,IDC选取了中国市场9家大模型技术厂商进行重点研究,分别为阿里巴巴、百度、第四范式、科大讯飞、澜舟科技、云从科技、智谱AI、中国电信智科以及中科闻歌。

除此之外,IDC还观察到了360、MiniMax、华为、商汤科技、腾讯等大模型。IDC也表示,会持续更新测评,涵盖更多技术厂商。

IDC《AI大模型技术能力评估报告,2023》:百度获算法模型、行业覆盖唯一满分

根据评估报告,百度文心大模型获得了7项核心指标满分(5分):算法模型、通用能力、创新能力、平台能力、生态合作、行业覆盖、能源行业;

3项国内唯一满分(5分):算法模型、行业覆盖、能源行业;

5项指标4分:安全可解释、服务能力、金融行业、工业行业、医疗行业。

在大模型的评定标准中,“算法模型”和“行业覆盖”是衡量大模型能力极其重要的两个指标。其中,“算法模型”是大模型能力最为核心的要素,“行业覆盖”体现了大模型在产业落地上的实力。这两个指标,百度文心大模型在众多厂商中均获得唯一满分,核心技术上明显领先其它竞品。

多个公开测评显示,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表现;综合能力在评测中超过ChatGPT,遥遥领先于其他大模型。

在评估报告中,IDC对百度文心大模型也不乏溢美之词。

IDC在报告中指出,百度AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

IDC认为,百度文心大模型源于产业实践,服务于产业实践。在近年的大模型技术探索与产业实践中,百度文心形成了支撑大模型产业落地的关键路径,构建文心大模型层、工具平台层,以及以基于文心大模型构建的系列产品与社区。

另外,IDC很看重百度的一点——百度文心大模型不只是一个模型或者一个产品。文心大模型包含数30多个大模型,涵盖基础大模型、任务大模型、行业大模型的三级体系,可以全面满足产业应用需求。

不仅如此,作为推进大模型在行业深度应用的关键举措,百度文心联合国网、浦发、泰康、吉利、哈尔滨市、深圳燃气、TCL、上海辞书出版社等企业单位,合作发布了涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等11个行业大模型,加速推动行业的智能化转型升级。

文心大模型为什么这么强?三大核心优势别人学不来

“当别人刚刚开始思考如何进行训练的时候,我们已经在推理上冲出了很远。”李彦宏曾经说过,算力可以买来,创新能力是买不来的。

在笔者看来,文心大模型今天“遥遥领先”的背后,除了长期技术积累、行业先发带来的领先之外,核心还在于百度“芯片-框架-模型-应用”四层技术栈优势、知识增强的核心特色以及繁荣的大模型生态三大优势。

大家都知道,过去,无论是PC还是移动时代,IT技术栈都是三层,芯片层、操作系统层、应用层。但到了人工智能时代,IT技术栈变成了四层,即:芯片层、框架层(深度学习框架)、模型层(比如文心大模型、信息分发大模型、交通大模型、能源大模型等)、应用层。

百度投入人工智能已经超过10年,在芯片、框架、模型、应用四层有全栈布局,在关键核心技术攻坚上,是全球为数不多的全栈布局的人工智能公司,在四层架构都有自主研发的领先产品和技术,因此可以进行端到端的优化,迅速提升大模型训练和推理的效率。同时,文心大模型是完全自主可控的,做到了数据可控、框架可控、模型可控。

比如,在框架层,百度拥有自研的深度学习平台飞桨,有力支撑了大模型的高效训练和推理。

飞桨与文心的协同优化,让文心大模型3.5最新版本的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

而在芯片层,百度自研的昆仑芯,已实现两代通用AI芯片产品的量产及落地应用。昆仑芯1代AI芯片于2020年量产,在百度搜索引擎、小度等业务中部署数万片,是国内唯一一款经历过互联网大规模核心算法考验的云端AI芯片,同时也被广泛部署在互联网、工业制造、智慧金融、智慧交通等领域。

搭载新一代架构XPU-R的昆仑芯2代AI芯片于2021年6月回片并当天点亮,8月量产发布。昆仑芯2代AI芯片是国内首款采用GDDR6显存的通用AI芯片,相比昆仑芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有显著增强。昆仑芯2代AI芯片已经开启互联网及各行业客户交付,当前商业化进展顺利。据悉,百度昆仑芯前两代的产品已有数万片的部署,第三代会在明年的年初上市。

百度文心大模型全景图

另外,知识增强作为文心大模型的核心特色之一,实现了更高的效率、更好的效果、更强的可解释性。在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

“百模大战”终局提前预演:百度已提前胜出下一个是谁?

今年,AI大模型成为行业关键词。一波由ChatGPT带动的“百模大战”正愈演愈烈。如今出门开发布会不提AI大模型,都不好意思跟人打招呼。

据媒体不完全统计,在OpenAI发布ChatGPT后,全球已发布数百个大模型,仅今年上半年在中国就发布了80多个大模型产品。到今年下半年,预计国内市面上的大模型将超过百款。

与此同时,我们也能清晰的看到,有的大模型各项能力已经愈发成熟,提前进入商业化落地探索阶段。而绝大多数大模型,还在给观众看PPT。

激烈厮杀过后,当热情消退,“百模大战”的终局将如何发展?

百度集团副总裁吴甜判断,国内“百模大战”将会走向在少量大模型上衍生出广泛应用生态的终局。大模型产业生态可类比芯片代工厂,把大数据、大算力、大算法都封装,建设自动化、数字化、标准化的生产模式。未来依托几个少量大模型,将会衍生出非常广泛的应用生态。

“像文心一言这样的大模型并不是想要做就能做起来的,需要有多年的积累、综合的能力和坚定的信心,一直投入下去,才能够做好。从这一点上可以看到,将来只能有少数的大模型。”

当下AI大模型还在“野蛮生长”阶段,此次IDC的评估报告的发布,不仅是主流AI大模型的真实水平的一次集中检验,更是“百模大战”终局的一次提前预演。相信随着炒作大潮褪去,谁在“裸泳”,即将一目了然了。

国产AI大模型的上半场比拼,百度已经提前胜出,下半场会是谁?

THE END
1.爱?标客ai.标客爱标客If you see this page, the nginx web server is successfully installed and working. Further configuration is required.For online documentation and support please refer to nginx.org. Commercial support is available at nginx.com.Thank you for using nginx....http://mp.iflytek.com/
2.评测:8家国内大模型谁最好用?今日,百度AI大模型产品文心一言和王小川创办的百川智能宣布,已通过《生成式人工智能服务管理暂行办法》备案,成为首批通过备案的8家公司,可正式上线面向公众提供服务。 据了解,国内八家大模型分别为:百度的文心一言、抖音的云雀大模型豆包、智谱AI的GLM大模型智谱清言、中科院的紫东太初大模型、百川智能的百川大模型、商...http://www.sycaijing.com/news/details?id=131996
1.AI大模型盘点百度旗下15款AI产品,你更喜欢哪一款?在人工智能领域,百度不断探索和创新,推出了一系列AI产品和服务。这些产品覆盖了从基础的AI平台到特定应用场景的解决方案,体现了百度在AI技术应用上的广泛布局。 一、千帆大模型平台 百度智能云推出的千帆大模型平台,为企业提供一站式的大模型开发和运行服务。该平台集成了多种预训练语言模型和AI技术,支持自然语言处理...https://blog.csdn.net/star_nwe/article/details/142451402
2.大模型的春天,与百度的答卷据IDC《AI大模型技术能力评估报告,2023》显示:百度获算法模型、行业覆盖唯一满分,报告指出,百度AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。 基于李彦宏提出的“重构”战略,百度大模型已经悄然进入到具体的应用解决方案。在9月5日,百度智能云...https://www.donews.com/article/detail/5232/59890.html
3.百度AI大模型助力ToB业务飞跃,C端挑战待解,营收增长6%至1346亿元【百度在2023年第四季度的财报中首次披露,由文心一言等大模型带来的收入显著,但C端增长和变现仍面临挑战。】2023年2月28日,百度公布了2023年第四季度及全年的业绩报告,显示全年总营收达到1346亿元人民币,同比增长9%,第四季度营收为350亿元,同比增长6%。这一超预期的营收增长,得益于人工智能技术的推动,尤其是大模型...https://stock.hexun.com/2024-03-01/212035399.html
4.文心大模型和百度AI开放平台哪个好有什么区别优缺点文心大模型和百度AI开放平台对比页面从功能、价格、点评为您详细介绍了文心大模型和百度AI开放平台哪个好,好用,区别,对比,优缺点,便于您更好的了解产品。https://www.36dianping.com/vs/kff0.html
5.百度AI伙伴基于文心大模型的AI搜索对话工具百度搜索AI伙伴是基于文心大模型的AI搜索对话工具,用户可免费进行对话、AI绘画和其他内容创作。 立即使用:https://chat.baidu.com/ 百度AI伙伴拥有以下能力: 回答你的一切问题,在大模型的基础上,我集成了全网搜索结果,提供更加可信的回答 帮你创作、提供灵感,包括社交媒体文案/生成图片/写周报 ...https://www.aihub.cn/tools/chatbot/baidu-chat/
6.2024年的百度大模型,离「钱」越来越近若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024年百度创始人李彦宏在百度智能云方向的OKR就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。 百度智能云是百度AI能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。 https://www.tmtpost.com/7001118.html
7.百度AIStudio模型库飞桨AI Studio模型库是用户选择深度学习模型、体验Demo效果和创建模型产线等内容的地方,支持用户轻松地创建和管理自己的模型,同时可利用体验相关模型产线,并进行二次开发。包含计算机视觉、自然语言处理、智能语音、文心大模型、科学计算、量子计算等任务方向算法,覆盖智慧金融、智慧安防、智慧工业/能源、智慧城市、智慧...https://2b2c.com/case/54489.html