雷石产业观察:机器学习与大模型,人工智能赛道上的明珠

如今,人工智能已经深入到社会的方方面面,渗透到每个人的日常生活,从自动驾驶到人脸识别,再到机器翻译。

然而,大家似乎只知人工智能,却少有人了解机器学习。其实,人工智能得到广泛应用,其底层基石正是机器学习。

绝大多数涉足人工智能的公司,无论是提供解决方案的科技公司,还是应用人工智能的行业用户,都会把机器学习作为其主要业务领域之一。

未来,随着人工智能的社会普及和行业深入,机器学习在产业界的重要性会得到进一步加强。在新兴的大模型领域,会有机会涌现出一批科技创新企业,成为人工智能赛道上真正的明珠。

机器学习是人工智能的基石

机器学习就是让计算机来模拟人类的学习行为,是人工智能的核心,是使计算机具有智能的根本途径。

机器学习具有两个典型的过程,一是训练,二是推理。这两个过程,都需要大量的算力作为保障,尤其是“训练”,不仅需要庞大的AI算力,往往还需要海量的数据。

机器学习的训练和推理,相当于人类的学习和工作。其中训练的过程尤其重要,就像人类要通过16-20年的漫长学习才能具备工作能力一样。训练的结果则是“模型”,类似于人类的知识。而推理的过程则是把模型(知识),应用到实践工作中。

以自动驾驶为例。自动驾驶汽车上都安装了很多摄像头和传感器,用于探测路况。根据采集到的视频等数据,做出判断之后,决定下一步操作:转弯、并线、加速、减速等。这个过程就是推理,推理依赖的不仅是实时采集到的数据,更需要使用训练产生的模型。

训练的工作是在推理之前完成的。自动驾驶公司要进行数十万,甚至上百万公里的实际道路学习。对于测试中获得的图片和影像数据,通过人工等标注方式,告诉计算机什么是路人、什么是车道、什么是限速牌等等。计算机需要通过各种算法对数据进行分析,最后形成了模型,被装载到自动驾驶汽车上。

目前,机器学习被普遍采用的部署方式是:在云侧进行训练,因为需要大量的数据和算力;在边侧或者端侧进行推理,因为需要低时延和贴近应用。

机器学习的不同实现方式

当前,人工智能的主要处理对象是自然语言、图片、视频等,从这些数据中提取信息,进行处理分析,并加以理解,最终落地实际应用。机器学习的对象,也正是这些数据。如何从数据中获得知识,一直是科学界和产业界共同努力的方向。

按照训练(学习)方式的不同,机器学习通常可以分为监督学习、非监督学习和强化学习三大类。

监督学习,也被称为有导师的学习,如同老师教学生一样。在监督学习过程中,训练的每个示例都是要有标注的,就像上面提到的自动驾驶实际道路学习一样。监督学习依赖于高质量的数据,包括数据的质和量。质——必须准确,否则计算机就会学到错误的知识,导致推理出错;量——要覆盖到实际道路的所有情况,否则计算机就不知道该如何应对该情况。

非监督学习,即没有导师的学习,训练的数据不需要做标记,减少了人工做数据标识的工作量,而且能够覆盖人想象不到的情况。比如在AI工业质检中,可能的产品缺陷种类太多,人工很难穷举。非监督学习的实现难度更大,是机器学习的未来发展方向。

强化学习也叫增强学习,其训练过程不需要数据,而是通过特定环境中一系列行为的后果进行学习。强化学习输入的是环境反馈,即奖惩信号,类似于马戏团的动物训练过程。

此外,深度学习和联邦学习,也是机器学习正在快速兴起的两个分支。前者已经在AlphaGo上得到成功实践,后者则由于数据安全的要求而随着隐私计算得到应用。

迅速壮大的行业应用市场

在这个快速增长的市场中,机器学习算力、机器学习开发平台、机器学习行业应用,将占据非常重要的组成部分。

在算力层面,除了专业的芯片公司,很多科技公司也在开发用于机器学习的芯片。比如,华为的昇腾芯片、AWS的训练芯片Trainium和推理芯片Inferentia、阿里云的推理芯片含光800等。

人工智能应用要想落地,还必须要有机器学习开发平台的支持,这是一个面向开发者、数据科学家、业务分析师的PaaS平台。目前,机器学习开发平台的提供商大致有两类,一类是云服务商,比如AWS的SageMaker、华为云的ModelArts等;另外一类是专业的人工智能公司,比如第四范式的SagePlatform、九章云极的DataCanvas等。

在应用层面,随着越来越多的企业开始数字化转型以及智能化升级,机器学习在行业市场得到了广泛应用,为人工智能赋能产业提供助力。除了人脸识别、自动驾驶、机器翻译等消费级应用,工业质检、新药开发、金融风险评估等企业级应用,也越来越多。

另外比如蛋白质结构研究,是生命科学领域的基础问题。深势科技与阿里云机器学习PAI团队合作,通过全新的蛋白质结构预测推理加速方案FoldAcc,结合深势Uni-Fold最新模型代码和参数,将单次预测能支持的最大氨基酸序列长度提升至6.6k,覆盖99.992%已知的蛋白序列。

无论是机器学习的行业应用还是通用应用,未来都会有更多的科技创新企业涉足其中。这也对其提出了更高的要求——既要懂前沿的AI科技,也要有深度的行业洞察,两者缺一不可。

正在快速兴起的大模型市场

从机器学习的实现方式可以看出,“模型”是机器学习的关键环节,它是“训练”的结果,也是“推理”的基础。要得到一个好的模型,需要海量的高品质数据,也需要海量的算力支持,可谓成本高昂。

一方面是模型训练的投资巨大,另一方面是每个行业应用都是差异化的,这就导致需要重复进行大量的模型训练,使得机器学习的成本居高不下,阻碍了行业应用的普及。

大模型的概念,由此而快速兴起。国内一些头部科技公司亦涉足其中,比如华为的盘古和百度的飞桨等。

大模型更准确的叫法应该是基础模型,是大规模预训练的结果,因为有着多达千亿甚至上万亿的参数,而被称为大模型或者超大模型。

大模型被称为规模化生产高性能机器学习模型的生产线:通过提炼各大领域的共性来进行大规模预训练,生产出标准化的基础大模型;然后再根据各个行业不同的共性需求,训练出行业预训练大模型;最后根据具体应用场景的需求,通过少量定制开发形成推理模型,从而落地应用。

这样的逐级训练大模型的方式,可以最大程度降低全社会在机器学习成本上的投入,实现AI应用的规模化落地。仍以自动驾驶为例,如果每个整车厂都要从头开始做模型训练,无疑是很大的浪费,毕竟大家面临的道路情况是一样的。如果有专业第三方公司来训练和提供标准化的大模型,就可以避免重复投入。这样,既降低成本又能提升性能,使自动驾驶更快落地。

大模型市场才刚刚起步,未来发展空间很大,当然变数也很大。训练好大模型和应用好大模型,同样重要。在这两个环节上,未来或许会涌现出一批创业企业,尤其是专注于生产行业大模型的科技创新企业。

THE END
1.大连·2024玩具展会玩具:电子电动、塑胶玩具、木制、纸板类玩具、娃娃、布毛绒玩具、积木、拼插玩具、充气玩具、儿童活动及运动产品、骑乘玩具、智能玩具、模型玩具、DIY玩具、音乐玩具、教育产品、幼儿教育产品、电子早教产品、幼教游乐设施、教玩具科教STEM/STEAM产品:教学用具(普通教具、幼儿教具)、幼儿园用品、特殊教育用品教育出版物:动漫...http://dl.expowindow.com/dz/342_440_2024.html
1.2023(第五届)全球交通座椅系统创新技术峰会(9.2224)3)基于中国人体驾乘数据的座椅自适性调节模型算法研究 4)基于CHAS舒适性测试体系研究 ...3)它羁绊:无条件直给的人与宠物亲密体验 4)情绪表演:为了寻找共鸣的情绪表演 5)基于四大中国设计趋势...新能源:上海重塑、上海电气、大连新源、同济大学、大连化物所、河南豫氢动力等; 家具类:碧桂园、美的...https://www.dongchedi.com/article/7275552558763475519
2.一种可定制化多尺度全身刚柔混合人体肌骨数字模型目的 针对现有肌骨模型建模精度差,有限元模型计算效率低的问题,本研究创新性提出耦合两种模型建立一种可定制化多尺度全身刚柔混合人体肌骨数字模型,实现多场景下人体动作的多尺度多物理的高精度、高效率耦合模拟。方法 基于医疗影像数据在有限元环境中运用显示动态有限元法与参数化编程建立多尺度全身刚柔混合肌骨数字模型...https://read.cnki.net/web/Journal/Article/YISX2024S1A70.html
3.大连沙盘公司大连沙盘模型公司大连沙盘模型制作公司大连沙盘...大连艾景沙盘模型制作公司(13889196675),专注于精品模型制作与技术创新。公司一直致力于模型技术开发与设计制作,是一家以市场为导向,以技术源于创新、质量精于管理的专业模型公司。它有着诚信、服务、客户至上的态度,有着团结、敬业、激情、超越自我的核心价值观。 大连艾景模型制作公司服务宗旨:高端质量、优质服务。承接...http://site.china.cn/zhanlanshejizhiz/5039482776.html
4.基于代理模型的萤火虫优化方法及Isight应用研究本文以Isight作为设计研究平台,为了系统化应用在代理模型及优化方法方面的研究成果,采用二次开发的方式,进行了用户功能定制,将代理模型技术与萤火虫优化方法相结合,给出了一般优化设计流程,解决了3个不同机械设计问题,为多样化的CAO方法提供帮助,利于工程应用。 https://cdmd.cnki.com.cn/Article/CDMD-10141-1015357016.htm
5.玻璃钢雕塑模型售卖亭门头装饰造型定制广东方圳玻璃钢厂20年定制玻璃钢景观雕塑,创意花盆,设备外壳,商场艺术休闲椅,售卖亭,模型,门头,装饰造型等城市家具.异形玻璃钢制品3D建模深化设计加工,厂家1件起定批发价为您省钱.https://www.fzfrp.cn/
6.地形地貌城市规划沙盘新能源沙盘房地产沙盘大连艺匠模型科技有限公司,是一家集模型设计与制作于一体的模型公司。主营:地形地貌城市规划沙盘,新能源沙盘,房地产沙盘。拥有模型界高素质、高水准的建筑模型制作师;以及经验丰富、技术娴熟的环境造景师。https://www.yijiangmodel.com/
7.手工金属制作新大连号集装箱船模型集装箱船模型「模型玩具」【模型玩具】相关产品图 【模型玩具】相关搜索 【模型玩具】近期上新 张家界展览模型泡沫雕刻经销批发 仿真泡沫雕刻公司批发零售 厂房模型 吉春古建建筑模型 抚州产业园学校沙盘来图定制 淄博模型 东营建筑模型 德州厂房沙盘制作设计新颖 徐州农业沙盘南京游乐市场建筑模型口碑好 ...http://china.makepolo.com/product-detail/100068482983.html
8.大连蛇岛自然博物馆馆内模型标本mov格式模板视频素材下载企业定制授权 网络传媒微电影/宣传片 影视传媒电影/电视剧/综艺 医疗医美肖像权敏感用途 数字转售课件/视频彩铃等 不限授权范围数量/时长 不限子公司数量及...这是一个1920x1080PX分辨率的高品质【大连蛇岛自然博物馆馆内模型标本】宣传片 实拍素材素材,【词语读音】:da lian she dao zi ran bo wu guan guan ...https://shipin520.com/sp-5087576.html
9.xxadmin.yhryj.com/kpf98671998.htm如何训练大模型 JEALOUSVUE成熟40岁APP 看一级黄色网站 938.10MB 63好评 黄色毛片免币看 美国...大连大连小姑娘和他爸爸操逼操逼黄片操逼黄片操逼大操逼黄碟 615.74MB 888好评 二次元好看污污的...甜蜜惩罚我是看守专用宠物这部剧中的台词,你怎么看 艳女Tv 国产老熟女老妇女69xxx 29.14MB 65%...http://xxadmin.yhryj.com/kpf98671998.htm
10.百付科技赠送运营推广方案 支持源码私有化部署和AI定制开发 AI应用开发 训练AI模型 数字人克隆 AI无人直播 AI短视频矩阵 数字人交互 AI解决方案 AI对话机器人 每个企业都需要一套AI系统来降本增效 搭建属于企业自己的AI对话机器人,提高效率节省人力。 AI无人直播 ...https://www.baifuai.com/
11.大模型+"大模型+"(Large Model Plus, 简称LLM+)是一个概念,指的是将大型预训练模型(通常是指参数数量在数十亿甚至数千亿的人工智能模型)与不同领域、任务或技术相结合,以发挥更大的作用和价值。以下是一些关于"大模型+"的关键点: 领域专业化:通过在特定领域的数据上进一步训练(微调),大模型可以更深入地理解和适应该...https://www.jianshu.com/p/b68de4b044ba