EAS架构及使用方法人工智能平台PAI(PAI)

模型在线服务EAS(ElasticAlgorithmService)是一种模型在线服务平台,可支持您一键部署模型为在线推理服务或AI-Web应用。它提供的弹性扩缩容和蓝绿部署等功能,可以支撑您以较低的资源成本获取高并发且稳定的在线算法模型服务。此外,EAS还提供了资源组管理、版本控制以及资源监控等功能,方便您将模型服务应用于业务。EAS适用于实时同步推理、近实时异步推理等多种AI推理场景,并具备完整运维监控体系等能力。

点击可查看EAS架构分层详细说明

基础设施层:支持异构硬件(CPU或GPU)的基础设施,并提供了AI专属的GU机器规格和抢占型实例,以帮助您降低成本并提高效率。

容器调度层:通过自动扩缩容等多种方法,帮助您在业务的波峰波谷中更高效地管理集群资源,实现降本增效的目标。支持以下几种方法:

弹性扩缩容:当业务负载呈现显著的波峰波谷时,通过开启弹性扩缩容功能,系统可自动调整实例数量,实现动态管理线上服务的计算资源,避免资源浪费。

定时扩缩容:在可以预估业务负载的场景中,服务可以定时将实例数自动扩缩容到指定数量,从而避免资源浪费。

弹性资源池:如果专属资源组内资源已经占满,服务会自动将扩容的实例弹到按量计费的公共资源组机器上,以保障服务的稳定性。

模型部署层:通过服务部署发布的多项功能,帮助您实时高效地监控服务状态,并简化服务发布和更新流程,以适配最合理的计算资源。服务部署发布支持的功能如下:

一键压测:支持动态加压,并能自动寻找服务的负载上限。此外,还提供了实时查看压测秒级监控数据和查看报告的功能。

灰度发布:支持将多个服务加入同一个灰度群组,其中一些服务用于生产环境,而另一些服务则用于灰度环境。此外,还支持切换每个服务的流量分配比例,以进行更灵活的灰度测试。

流量镜像:支持将当前服务的流量按照一定比例镜像到目标服务中,同时不影响当前服务的正常运行。这一功能主要用于测试新服务的性能和可靠性。

推理能力:目前EAS支持的推理能力如下:

实时同步推理:适用于个性化搜索、智能对话等场景,具有高吞吐、低延迟的特点,同时不影响线上业务的正常运行。系统还可以根据业务需求适配合理的部署机型,以实现最佳的运行效果。

近实时异步推理:适用于文图生成、视频处理等场景,在推理服务内部集成了消息队列。使得服务能够按需进行弹性扩缩容,且无需进行运维工作。

使用EAS进行模型部署时,支持镜像部署和Processor部署两类部署方式,对比介绍如下。

EAS镜像部署的流程图如下。

此方式的部署要点如下。

镜像部署可以进一步细分为镜像部署服务和镜像部署AI-Web应用两种部署方式。

镜像部署服务:适用于通过镜像快速部署服务的场景,部署后可通过API调用服务。

镜像部署AI-Web应用:更适用于通过镜像快速部署Web应用的场景,部署后可通过Web应用链接直接打开应用页面进行访问试用。

PAI为您提供了多个典型场景的官方镜像便于您高效一键部署,您也可以结合业务需求自行开发模型并制作镜像,制作完成的镜像需上传至阿里云镜像服务ACR中,便于部署时选择使用。

建议您将模型和模型的前后处理代码文件上传至存储云产品,后续通过挂载方式来获取对应内容,而非直接打包至自定义镜像中,在后续模型需频繁迭代更新时,可方便地替换模型。

使用镜像部署时,建议您自行构建一个HTTPServer,后续使用EAS部署好服务后,EAS会将调用服务的请求转发至您自行开发的HTTPServer中,自建的HTTPServer需避开EAS系统监听端口8080和9090。

使用自定义镜像进行部署时,请务必将您的镜像上传至ACR中再进行使用,否则可能导致在部署时镜像拉取失败。如果您使用DSW进行模型开发训练,也需将镜像上传至ACR中才可在EAS中使用。

如果您的自定义的镜像、预热数据等内容可在其他多种场景下应用,您也使用PAIAI资产的镜像和数据集功能,将其沉淀为对应的AI资产进行统一管理。当前EAS不支持使用NAS-CPFS类型的数据集。

准备好模型和Processor文件等服务部署前的准备内容后,分别上传至存储云产品(OSS、NAS),EAS通过挂载存储云产品来获取部署前所需的准备内容进行服务部署。

EASProcessor部署流程如下。

PAI为您提供了多个典型场景的官方Processor供您使用,您也可以结合业务需求自行开发模型并开发自定义Processor文件,完成后分别上传至阿里云存储产品OSS或NAS。

建议您将模型和Processor文件独立开发分别存储,后续可在部署时配置模型挂载路径,Processor文件中可使用get_model_path参数来获取配置的模型路径,便于后续模型需频繁迭代更新时,可方便地替换模型。

使用Processor部署时,EAS会根据您选用的推理框架自动拉取官方环境镜像来部署服务,并基于Processor文件自动为您部署一个HTTPServer用于接收后续调用服务的请求。

使用Processor方式部署时,您需要保障模型的推理框架和Processor文件的开发符合开发环境要求,不如镜像部署方式灵活高效,因此更建议您使用镜像方式进行模型部署。

名词

描述

资源组

EAS将集群资源分为不同的资源组进行隔离,创建模型服务时,您可以选择将其部署在默认的公共资源组或自己额外购买的专属资源组。

使用公共资源组时:后付费(按量付费)模式,服务开始部署后即开始使用资源,服务结束后即释放资源。

使用专属资源组时:预付费(包年包月)和后付费(按量付费)两种计费模式,专属资源组的生命周期与服务无关,资源购买后即开始计费,资源释放后即结束计费。

模型服务

模型文件和在线预测逻辑部署成的常驻服务。您可以对模型服务进行创建、更新、停止、启动、扩容及缩容操作。

模型文件

通过离线训练获得的离线模型。基于不同框架会得到不同格式的模型,通常与Processor一起部署,从而获得模型服务。

Processor

包含在线预测逻辑的程序包,通常与模型文件一起部署,从而获得模型服务。针对常用的PMML、TensorFlow(SavedModel)及Caffe模型,EAS提供了预置的官方Processor。

自定义processor

EAS预置Processor无法满足所有的服务部署需求,您可以通过自定义Processor,实现更灵活的服务部署。EAS支持通过C++、Java或Python开发自定义Processor。

服务实例

服务进程。每个服务可以部署多个服务实例以提高能够支持的并发请求数。部署服务时,服务实例会部署到资源组中的机器上,如果资源组中有多台机器资源,EAS会自动将不同实例部署到不同的机器资源中,从而更好地保障服务高可用性。

高速直连

EAS提供高速直连的网络访问方式,EAS资源组和您的VPC网络连通后,您可以使用高速直连功能。后续无需通过网关,客户端可直接访问模型服务,可以大幅度提高访问性能、降低访问延时。

EAS支持的地域包括华北2(北京)、华东2(上海)、华东1(杭州)、华北3(张家口)、华北6(乌兰察布)、华南1(深圳)、华南2(河源)、华南3(广州)、西南1(成都)、中国(香港)、日本(东京)、新加坡、印度尼西亚(雅加达)、美国(硅谷)、美国(弗吉尼亚)及德国(法兰克福)。

EAS资源组收费:

公共资源组中,根据每个模型服务占用的资源量计费。

专属资源组中,根据资源组管理的服务器资源包年包月或按量计费。

存储类云产品:

公网NAT网关:

准备推理资源。

准备模型、模型前后处理代码文件等内容。

在部署工具维度上:EAS支持通过界面化或命令行方式部署服务和管理服务,不同工具的部署流程和操作要点存在差异。

操作类型

界面化方式

命令行方式

部署服务

管理服务

包括:

查看模型调用信息。

扩容、缩容、启动、停止及删除模型服务。

在部署方式上:EAS支持镜像方式部署(推荐,包含镜像部署、镜像AI-Web部署两个细分部署场景)和Processor方式部署。

部署类型

对比介绍

参考文档

镜像部署服务(推荐)

适用场景:使用镜像快速部署模型服务。

优势:

可通过镜像保障模型开发训练环境与部署运行环境的一致性。

典型场景已为您预置了很多官方镜像,您可使用官方预置镜像一键部署。

也支持自定义镜像部署,无需进行部署的工程化改造,部署便捷。

镜像部署AI-Web应用(推荐)

适用场景:使用镜像快速部署模型服务,更适用于将模型部署为Web应用的场景。

典型场景已为您预置了很多官方镜像,如Stable-Diffusion-Webui、Chat-LLM-Webui等,支持基于Gradio、Flask、FastAPI等框架实现HTTPServer,您可使用官方预置镜像一键部署。

模型+processor部署服务

EAS为您提供了常见模型框架的预置Processor,例如PMML、XGBOOST等,通过EAS预置的Processor可以快速启动服务,但可能无法满足特定的业务需求。

您还可以构建自定义Processor,以实现更为灵活的业务逻辑处理。

服务部署完成后,您可以通过在线调试功能发送HTTP服务请求,来验证服务是否能正常推理。

服务运行正常后,您可以开通服务监控报警来监控服务资源的使用情况。

也可以开启水平或定时自动扩缩容功能,来实时动态管理线上服务的计算资源。

将模型部署为WebUI应用:您可以通过控制台在浏览器中打开Web应用页面,交互式地使用已部署的模型推理服务。

THE END
1.人工智能应用指南:全面解析AI的使用方法与技巧ChatGPT是一种基于GPT(生成预训练)模型的人工智能助手,可以依照使用者输入生成连贯、有逻辑的文本。其优势在于能够快速生成大量文本,节省人力成本。 2.1.2 ChatGPT的利用方法 - 注册并ChatGPT平台; - 熟悉界面和基本操作; - 输入难题或需求,等待系统生成回答; ...http://www.slrbs.com/jrzg/aizhishi/295578.html
2.AI教程入门:轻松掌握人工智能基础知识设想一个场景,你正在厨房忙碌,突然需要查询某个食谱。这时,一个智能语音助手能够通过你的语音指令,快速搜索并提供所需信息,无需你离开厨房动手操作。这是一种AI在日常生活中应用的范例。 AI基础知识:定义与分类 人工智能的基本概念 人工智能可以定义为:一门研究如何使计算机具有智能行为的学科,其目标是使计算机能够模...https://www.imooc.com/article/347845
1.AI创建全解析:从基础入门到高级应用,全面掌握人工智能开发技巧创建路径的基本步骤: 1. 选择工具:在软件中,选择钢笔工具或形状工具,这是创建路径的主要工具。 2. 绘制路径:按照需求,在画布上绘制出想要的路径。可以通过点击和拖动来创建直线或曲线。 3. 调整路径:采用直接选择工具或路径编辑工具,对路径实微调和优化。 https://www.yanggu.tv/webgov/aitong/483853.html
2.终于有人总结了人工智能知识!(非常详细)零基础入门到精通,收藏这一篇就...首先,我们定义了人工智能的基本概念,这是理解整个领域的基础。随后,通过对人工智能发展历程的梳理,我们展示了其从诞生到如今的演变轨迹,凸显了其在科技进步中的重要地位。 接下来,我们深入探讨了机器学习与深度学习这两项核心技术。它们作为人工智能领域的两大支柱,不仅推动了技术边界的不断拓展,也为实现更高级别的智...https://blog.csdn.net/xx16755498979/article/details/144030340
3....赛事咨讯AI小知识:5分钟,带你了解人工智能的基本常识AI小知识:5分钟,带你了解人工智能的基本常识 人工智能的定义 人工智能领域苦于存在多种概念和定义,有的太过有的则不够。 作为该领域创始人之一的Nils Nilsson先生写到:“人工智能缺乏通用的定义。” 随着计算机为解决新任务挑战而升级换代并推而广之,人们对那些所谓需要依靠人类智慧才能解决的任务的定义门槛也越来...http://www.js.sgcc.com.cn/html/main/RGZHSC/article/683129.html
4.Photoshop2023Beta内置Ai绘图功能上线,你还不知道?Adobe Photoshop 2023 Beta内置的AI绘图功能是一次重大的升级,该功能将彻底改变用户处理图像的方式。本文将详细介绍Photoshop 2023 Beta中的AI绘图功能,包括其基本概念、功能特点、使用方法、实战应用以及使用技巧。 一、基本概念 Photoshop 2023 Beta中的AI绘图功能是一种基于人工智能的技术,它可以根据用户输入的文字描述...https://www.yutu.cn/news_52069.html&wd=&eqid=8e908048000381e500000006648180bf
5.计算机应用基础说课稿(精选11篇)1、课程目标:通过本课程学习学生将能够,通过本课程的学习,学生应能够掌握计算机基础知识、计算机基本使用方法、文字信息处理方法、电子表格处理数据、电子演示文稿信息处理、图像处理等常用工具软件的基本使用方法和了解网络的基本应用。培养学生的自学能力和获取计算机新知识、新技术的能力,在毕业后具备较强的实践能力、创新...https://xiaoxue.ruiwen.com/shuokegao/386213.html
6.Illustrator(AI)制图软件矢量绘图中的渐变网格基础及使用方法介绍本文介绍Illustrator渐变网格的一些基础概念、基本用法以及技巧。 Illustrator渐变网格的基础概念 看下图,Illustrator渐变网格物体中的这几条线叫网格线,网格线间相交的点叫网格点(除此以外的点叫节点),四个点围成的面积叫网格面片。(见下图) A. Anchor point 节点 ...https://www.jb51.net/softjc/94613.html
7.确定基本的AI技术概念如果扩展 AI 的主要概念(即机器展现通常与人类能力相关的功能的领域),你会看到机器如何学习模式、解释数据和使用数据推理。 为此,我们需要向机器馈送大量数据它才能学习。 此外,机器学习创建的算法各不相同,从简单的线性函数到极其复杂的函数,例如人工神经网络。 https://learn.microsoft.com/zh-cn/training/modules/leverage-ai-tools/2-identify-basic-ai-technology-concepts
8.高中信息技术课程标准1.理解信息及信息技术的概念与特征,了解利用信息技术获取、加工、管理、表达与交流信息的基本工作原理,了解信息技术的发展趋势。 2.能熟练地使用常用信息技术工具,初步形成自主学习信息技术的能力,能适应信息技术的发展变化。 (二)过程与方法 3.能从日常生活、学习中发现或归纳需要利用信息和信息技术解决的问题,能通过...https://www.fqkhzx.cn/index/article/view/id/94.html
9....你进军人工智能领域的全流程技术体系和实战指南(LLMAGI和AI...学习后将掌握:机器学习和深度学习的概念,常用的机器学习算法和神经网络算法。 人工神经网络,自然语言处理,机器学习,深度学习,遗传算法等各种人工智能领域的基本概念及其在Python中的如何实现。 认识和掌握相关人工智能和Python编程的基本知识。 还会掌握了AI中使用的基本术语以及一些有用的python软件包,如:nltk,OpenCV,pan...https://blog.51cto.com/alex4dream/6535665
10.AI入门之深度学习:基本概念篇AI入门之深度学习:基本概念篇 1、什么是深度学习 1.1、机器学习 ? 图1:计算机有效工作的常用方法:程序员编写规则(程序),计算机遵循这些规则将输入数据转换为适当的答案。这一方法被称为符号主义人工智能,适合用来解决定义明确的逻辑问题,比如早期的PC小游戏:五子棋等,但是像图像分类、语音识别或自然语言...https://blog.itpub.net/70037994/viewspace-3024487/
11.《人工智能基础》课程教学大纲1.5帮助学生了解大语言模型的基本原理和架构。 课程目标2:帮助学生掌握人工智能的相关技术。 2.1帮助学生学会Keras的安装和使用方法。 2.2帮助学生掌握数据获取与处理的方法。 2.3帮助学生用Keras搭建各种神经网络模型,掌握模型的训练、评估和使用方法。 (三)课程目标与毕业要求、课程内容的对应关系 ...https://energy.suda.edu.cn/25/30/c31046a533808/page.htm
12.人工智能的基本概念有哪些人工智能相关概念包括机器学习、监督学习、无监督学习、强化学习、深度学习、迁移学习、联邦学习。 人工智能的基本概念有哪些 企服解答 人工智能(Artificial Intelligence)相关概念如下: 机器学习(Machine Learning) 监督学习(Supervised Learning) 无监督学习(Unsupervised Learning) ...https://36kr.com/p/dp1458898134188807
13.AI产品经理必修课:NLP技术原理与应用注:当数据量足够大时,使用基于神经网络的深度学习方法处理意图识别和实体抽取任务可以取得更好的效果。 四、自然语言理解基本技术 自然语言理解基本技术分为词法分析、句法分析、语义分析三类。 1. 词法分析 词法分析包括分词和词性标注。 1.1 分词 word segmentation ...https://maimai.cn/article/detail?fid=1344416486&efid=gLTpz8BGwd9RNHvy0tNDuA
14.学好revit有什么用,零基础学revit视频教程Revit是建筑信息模型(BIM)软件,在建筑设计和施工过程中发挥着重要作用。与传统的CAD软件相比,Revit具有更多的功能和优点,可以提高建筑设计的效率和准确性。本文为想要学习和掌握Revit软件的人介绍了学习Revit的最佳途径和方法。 1.了解Revit软件的基本概念和功能 ...https://www.nanhuajiaoyu.com/chanye/news/19897.html
15.泾阳县人民政府本课程包括短视频策划、拍摄与后期制作等全部流程。本课程包含工作项目概述如下:短视频的概念、分类、盈利模式等基础知识,短视频的策划方法和拍摄技法,使用专业视频编辑软件完成短视频的剪辑、字幕与音频的添加、转场与特效的应用等后期制作工作,运用专业视频特效合成软件短视频制作片头,合成与输出完整的短视频...https://www.snjingyang.gov.cn/zfxxgk/fdzdgknr/jgsz/jgsz_20377/xzfgzbm2022/xjyj/bmgk_20415/202306/t20230613_1643809.html
16.Agent学习机器人工智能基本概念神经网络案书方案书解决AI计算机...人工智能实战 使用C#的机器学习机器人和Agent解决方案 Agent多Agent系统监督学习书 学习基本概念及其AI解决方案书 神经网络书籍 ¥73 折后¥73 发货地: 北京 包邮 品牌: 基本概念 风格: Agent 学习 机器 人工智能 基本概念 神经网络 案书 方案书 解决 ...https://www.zhe2.com/note/608526797274
17.一文读懂AI:人工智能的基本概念与实际应用一文读懂 AI:人工智能的基本概念与实际应用 摘要:近年来,人工智能(AI)因其巨大的潜力而在各行各业引起了广泛关注。然而,要全面理解 AI 并非易事,尤其是对于那些对技术概念不太熟悉的读者而言。接下来,大眼仔旭将以最通俗的语言来解析 AI 的概念,探讨它是如何运作的,以及它在现实生活中的应用。 AI 的最简单...http://www.dayanzai.me/ai-artificial-intelligence.html
18.一次性搞懂什么是AIGC!(一篇文章22个基本概念)想象一下,当机器能够认知我们的常识,当艺术被赋予新的定义,当创造力不再是人类的专利,广告营销行业定将迎来一场生产变革巨浪。数英将持续保持对AIGC领域的关注,通过资讯分享、科普认知、方法总结和深度访谈等,和大家一起,多方位走进AIGC的世界。 本期内容,我们将梳理22个AI基础概念,带你搞清楚。https://www.digitaling.com/articles/934226.html
19.人工智能学习心得(通用27篇)(3)掌握了盲目搜索和启发式搜索的基本原理和算法,特别是宽度优先搜索、深度优先搜索、等代价搜索、启发式搜索、有序搜索、ax算法等。了解博弈树搜索、遗传算法和模拟退火算法的基本方法。 (4)掌握了消解原理、规则演绎系统和产生式系统的技术、了解不确定性推理、非单调推理的概念。 https://www.yjbys.com/xindetihui/fanwen/3342600.html