雷石产业观察:机器学习与大模型,人工智能赛道上的明珠

如今,人工智能已经深入到社会的方方面面,渗透到每个人的日常生活,从自动驾驶到人脸识别,再到机器翻译。

然而,大家似乎只知人工智能,却少有人了解机器学习。其实,人工智能得到广泛应用,其底层基石正是机器学习。

绝大多数涉足人工智能的公司,无论是提供解决方案的科技公司,还是应用人工智能的行业用户,都会把机器学习作为其主要业务领域之一。

未来,随着人工智能的社会普及和行业深入,机器学习在产业界的重要性会得到进一步加强。在新兴的大模型领域,会有机会涌现出一批科技创新企业,成为人工智能赛道上真正的明珠。

机器学习是人工智能的基石

机器学习就是让计算机来模拟人类的学习行为,是人工智能的核心,是使计算机具有智能的根本途径。

机器学习具有两个典型的过程,一是训练,二是推理。这两个过程,都需要大量的算力作为保障,尤其是“训练”,不仅需要庞大的AI算力,往往还需要海量的数据。

机器学习的训练和推理,相当于人类的学习和工作。其中训练的过程尤其重要,就像人类要通过16-20年的漫长学习才能具备工作能力一样。训练的结果则是“模型”,类似于人类的知识。而推理的过程则是把模型(知识),应用到实践工作中。

以自动驾驶为例。自动驾驶汽车上都安装了很多摄像头和传感器,用于探测路况。根据采集到的视频等数据,做出判断之后,决定下一步操作:转弯、并线、加速、减速等。这个过程就是推理,推理依赖的不仅是实时采集到的数据,更需要使用训练产生的模型。

训练的工作是在推理之前完成的。自动驾驶公司要进行数十万,甚至上百万公里的实际道路学习。对于测试中获得的图片和影像数据,通过人工等标注方式,告诉计算机什么是路人、什么是车道、什么是限速牌等等。计算机需要通过各种算法对数据进行分析,最后形成了模型,被装载到自动驾驶汽车上。

目前,机器学习被普遍采用的部署方式是:在云侧进行训练,因为需要大量的数据和算力;在边侧或者端侧进行推理,因为需要低时延和贴近应用。

机器学习的不同实现方式

当前,人工智能的主要处理对象是自然语言、图片、视频等,从这些数据中提取信息,进行处理分析,并加以理解,最终落地实际应用。机器学习的对象,也正是这些数据。如何从数据中获得知识,一直是科学界和产业界共同努力的方向。

按照训练(学习)方式的不同,机器学习通常可以分为监督学习、非监督学习和强化学习三大类。

监督学习,也被称为有导师的学习,如同老师教学生一样。在监督学习过程中,训练的每个示例都是要有标注的,就像上面提到的自动驾驶实际道路学习一样。监督学习依赖于高质量的数据,包括数据的质和量。质——必须准确,否则计算机就会学到错误的知识,导致推理出错;量——要覆盖到实际道路的所有情况,否则计算机就不知道该如何应对该情况。

非监督学习,即没有导师的学习,训练的数据不需要做标记,减少了人工做数据标识的工作量,而且能够覆盖人想象不到的情况。比如在AI工业质检中,可能的产品缺陷种类太多,人工很难穷举。非监督学习的实现难度更大,是机器学习的未来发展方向。

强化学习也叫增强学习,其训练过程不需要数据,而是通过特定环境中一系列行为的后果进行学习。强化学习输入的是环境反馈,即奖惩信号,类似于马戏团的动物训练过程。

此外,深度学习和联邦学习,也是机器学习正在快速兴起的两个分支。前者已经在AlphaGo上得到成功实践,后者则由于数据安全的要求而随着隐私计算得到应用。

迅速壮大的行业应用市场

在这个快速增长的市场中,机器学习算力、机器学习开发平台、机器学习行业应用,将占据非常重要的组成部分。

在算力层面,除了专业的芯片公司,很多科技公司也在开发用于机器学习的芯片。比如,华为的昇腾芯片、AWS的训练芯片Trainium和推理芯片Inferentia、阿里云的推理芯片含光800等。

人工智能应用要想落地,还必须要有机器学习开发平台的支持,这是一个面向开发者、数据科学家、业务分析师的PaaS平台。目前,机器学习开发平台的提供商大致有两类,一类是云服务商,比如AWS的SageMaker、华为云的ModelArts等;另外一类是专业的人工智能公司,比如第四范式的SagePlatform、九章云极的DataCanvas等。

在应用层面,随着越来越多的企业开始数字化转型以及智能化升级,机器学习在行业市场得到了广泛应用,为人工智能赋能产业提供助力。除了人脸识别、自动驾驶、机器翻译等消费级应用,工业质检、新药开发、金融风险评估等企业级应用,也越来越多。

另外比如蛋白质结构研究,是生命科学领域的基础问题。深势科技与阿里云机器学习PAI团队合作,通过全新的蛋白质结构预测推理加速方案FoldAcc,结合深势Uni-Fold最新模型代码和参数,将单次预测能支持的最大氨基酸序列长度提升至6.6k,覆盖99.992%已知的蛋白序列。

无论是机器学习的行业应用还是通用应用,未来都会有更多的科技创新企业涉足其中。这也对其提出了更高的要求——既要懂前沿的AI科技,也要有深度的行业洞察,两者缺一不可。

正在快速兴起的大模型市场

从机器学习的实现方式可以看出,“模型”是机器学习的关键环节,它是“训练”的结果,也是“推理”的基础。要得到一个好的模型,需要海量的高品质数据,也需要海量的算力支持,可谓成本高昂。

一方面是模型训练的投资巨大,另一方面是每个行业应用都是差异化的,这就导致需要重复进行大量的模型训练,使得机器学习的成本居高不下,阻碍了行业应用的普及。

大模型的概念,由此而快速兴起。国内一些头部科技公司亦涉足其中,比如华为的盘古和百度的飞桨等。

大模型更准确的叫法应该是基础模型,是大规模预训练的结果,因为有着多达千亿甚至上万亿的参数,而被称为大模型或者超大模型。

大模型被称为规模化生产高性能机器学习模型的生产线:通过提炼各大领域的共性来进行大规模预训练,生产出标准化的基础大模型;然后再根据各个行业不同的共性需求,训练出行业预训练大模型;最后根据具体应用场景的需求,通过少量定制开发形成推理模型,从而落地应用。

这样的逐级训练大模型的方式,可以最大程度降低全社会在机器学习成本上的投入,实现AI应用的规模化落地。仍以自动驾驶为例,如果每个整车厂都要从头开始做模型训练,无疑是很大的浪费,毕竟大家面临的道路情况是一样的。如果有专业第三方公司来训练和提供标准化的大模型,就可以避免重复投入。这样,既降低成本又能提升性能,使自动驾驶更快落地。

大模型市场才刚刚起步,未来发展空间很大,当然变数也很大。训练好大模型和应用好大模型,同样重要。在这两个环节上,未来或许会涌现出一批创业企业,尤其是专注于生产行业大模型的科技创新企业。

THE END
1.《中等职业学校专业目录(2010年修订)》化工机器检测与故障诊断 化工仪表及自动化 化工仪表及自动化系统安装与维修 化工仪表及自动化产品营销 精细化工 化学制药 日用化工 涂料与胶黏剂 食品添加剂 饲料添加剂 精细化学品营销 生物化工 生物制药技术 高分子材料加工工艺 橡胶工艺 林产化工 核化学化工 ...http://www.360doc.com/document/24/0727/14/79930059_1129804432.shtml
1.火化炉BLP1000M6BLCremationSystems,Inc.此为机器翻译文本。(查看英文原文) 浏览此产品的买家也同时浏览: BL Cremation Systems, Inc. 的其他产品 Animal Cremation Equipment 火化炉BLP 200 动物落地式自动 火化炉BLP 500 动物落地式自动 火化炉BLP 750 动物落地式自动 火化炉BLP 1000 动物落地式自动 ...https://www.medicalexpo.com.cn/prod/bl-cremation-systems-inc/product-124029-982469.html
2.想鹿非非三,美女露屁股露胸视频,欧美人与动物100 四,大鸡吧操我免费漫画,樱桃黄色国产视频区三50成熟女人 五,姐姐在黄网当主播笔趣阁最新章节更新时间,无码国产色欲ⅩXXX视频 六,老婆遇到了帅哥单男,主动上位高潮不断 - ThePorn,又大又硬又长的网站 七,飞渡浮舟云类似软件 ...http://crm.startashow.com/public/static/file.php/mokerlo/14641.html
3.法医嫡女:王爷,别太坏智能化改造、数字化转型,是企业提高效率的可行路径。2018年,乐清电气产业开始尝试机器换人。乐清市经济和信息化局副局长臧晓微说,大部分中小企业对‘智改数转’只有模糊的概念,认为是一种趋势,需要转。但是怎么转却不十分清楚。-- 统联精密首次公开发行股票募集资金总额为8.55亿元,募集资金净额为7.73亿元,较原拟募...http://www.csfae.cn/do_paplo/23742.html
4.想拥有一只恐龙鸡吗?转基因宠物或成流行——中国青年网4、可爱的机器宠物 未来宠物有可能未必是活物。工程师们在设计机器宠物的时候,让它们模仿真正动物的动作,这个任务并不简单。 “我们要教机器宠物的事情非常之多,可能数不胜数,而动物和人类可以通过基因遗传来明白这些事情,”机械工程麻省理工学院副教授Sangbae Kim说。即使是看似简单的动作,对机器宠物来说都可能会很...https://t.m.youth.cn/transfer/index/url/news.youth.cn/kj/201601/t20160104_7488156.htm
5.暂引樱桃破人与动物色色视频 294.88MB 534好评 小三月在尼哥面前跳骚舞被强奸 性乳美女丝足交突破swag 在线88av藤咲紫 164.33MB 966好评 男人用大鸡巴操女人视频软件 柳州记免费观看 啊啊啊插我操我好舒服视频 103.39MB 101好评 夏思凝三级片 不求不满中文字幕 http://crm.wymi.net/index.php/mokerlo/22641.html
6.病害动物尸体(精选八篇)1.焚烧:是通过氧化燃烧,杀灭病原微生物,把动物尸体变为灰烬的过程。焚烧可采用的方法有:柴堆火化、焚烧炉和焚烧窖/坑等。此方法(1)需消耗大量能源。据了解,采用焚烧炉处理200kg的病死动物,至少需要燃烧8L/h的柴油,大约64元每个小时;(2)占用场地大,选择地点较局限。应远离居民区、建筑物、易燃物品,上面不能...https://www.360wenmi.com/f/cnkey92aeihe.html
7.以动物为主人公的童话故事作文900字(精选33篇)以动物为主人公的童话故事作文900字(精选33篇)在学习、工作或生活中,大家都看过童话吧,童话故事是儿童文学的重要体裁,具有浓厚幻想色彩的虚构故事,你还在找寻优秀经典的童话故事吗?以下是小编收集整理的以动物为主人公的童话故事作文900字,欢迎阅读,希望大家能够喜欢。https://mip.wenshubang.com/dongwuzuowen/717305.html
8.亚马逊河杀手排行榜(亚马逊河里有什么危险动物)宠物排名第十二的是美洲豹。是美洲最大的猫科动物,体长可达2米。被称为“无情的猎杀机器” 排名第十一的是电鳗。电鳗是种神奇的动物。它们自身带电,当受到威胁时,会放出电流保护自己 排名第十的是世界上最大的淡水鱼。原产于亚马逊河,斯奎布河和南美洲盘地。钓鱼爱好者的最爱 ...https://www.yq003.cn/article/33853.html