深度解析DeepFlow如何采集大模型服务的业务指标鸿蒙开发者社区

为高质量支撑2024年客服大模型商用,中国移动构建了客服大模型“混合云”生产环境,确保大模型应用安全稳定运行、智算资源高效利用。面对当前跨云调用拓扑的复杂性,以及运维保障与业务运营中服务质量观测指标的缺失问题,多团队共同合作基于eBPF与Wasm技术构建客服大模型生产运行态可观测能力。

在基于基础大模型构建的客服大模型中,虽然这些基础模型在自然语言处理方面表现出强大的计算能力,但其训练、微调和推理的细节仍难以完全理解和控制。尤其是在行业应用中,这些模型在响应性能、准确性和数据安全性方面常常表现为“黑盒”。因此,亟需开发针对大型语言模型的可观测性解决方案,以实现模型的可感知、可维护、可评估和可信任,从而提升平台能力和服务质量。

当前,大模型的应用面临一些挑战。在业务稳定性方面,为避免对流量的影响,业务团队严格禁止安装APM探针。此外,由于不同团队负责多个大模型,统一拓扑和指标的协调难度较大。因此,在构建可观测性解决方案时,必须做到对业务的零侵扰。近年中国移动磐基PaaS平台已经携手DeepFlow借助eBPF技术实现了全栈且无侵扰的应用可观测性。磐基PaaS平台将eBPF数据与现有的可观测数据整合,提供了开箱即用的应用可观测性,全栈无盲点的调用链追踪等能力。

客服应用架构图

客服大模型上线磐基eBPF可观测性能力后,客服大模型立即具备了开箱即用的可观测性功能。这使得其能够快速获取全面的系统监控视图,实时追踪和分析复杂的调用链路,有效提升问题诊断和解决效率。同时,无需额外的代码插入,便可自动生成应用和网络性能指标,轻松实现资源优化和性能提升。

服务全景拓扑

应用/网络指标

应用/网络详情

全栈调用链追踪

大模型指标分类说明

通用指标说明备注吞吐量发送与接收字节的总和(Byte/s)现有指标TCP重传比例(TCP客户端重传+TCP服务端重传)/包数现有指标TCP建连-失败比例建连-失败次数/关闭连接数现有指标TCP建连时延采集周期内所有TCP建连时延的平均值现有指标TCP活跃连接数采集周期内活跃的连接数现有指标

通用指标说明备注请求速率平均每秒请求总数(req/s)现有指标累计服务端异常比例服务端异常/响应现有指标响应时延采集周期内所有应用时延的平均值现有指标

客户大模型流量解读

HTTP分块传输编码允许服务器将响应拆分为多个部分发送给客户端,而无需预先知道内容的总大小。

客户大模型与基础大模型之间的交互过程由请求和响应两部分组成。首先,客户大模型发起请求,基础大模型返回初始响应,该响应仅包含头部信息,无任何业务数据。随后,基础大模型逐步返回包含Token的响应。当所有Token传输完成时,发送一个标识完成的响应,称为Finish响应。基于交互过程则可确认业务指标的计算方式,如下:

数据交互图

以vllm/**/**/cm/as**st接口发起请求,报文详情如下:

报文详情

Wasm插件核心代码

这段Go程序实现了一个Wasm插件,专注于统计大模型HTTP流式请求的性能指标。它能够解析HTTP流请求和响应,以收集首Token延迟(TTFT)和每个输出Token的延迟(TPOT)。这种设计使得程序员可以高效地监控和优化大模型的性能表现。

Grafana指标展示效果

可视化展示

参考资料

eBPF零侵扰可观测性Meetup·上海站开始报名啦!本次活动主题为《大模型全生命周期管理与AI应用的全栈可观测性》,精彩议程大咖云集,欢迎扫描二维码锁定席位~

THE END
1.深国图取得一种基于云计算和边缘计算的语音识别系统设备及介质专...金融界 2024 年 11 月 13 日消息,国家知识产权局信息显示,深圳市深国图信息技术有限公司取得一项名为“一种基于云计算和边缘计算的语音识别系统、设备及介质”的专利,授权公告号 CN 113380253 B,申请日期为 2021 年 6 月。 本文源自:金融界 作者:情报员...https://www.163.com/dy/article/JGSJVFQV0519QIKK.html
2.什么是ocr识别云商店"什么是ocr识别"的相关产品有哪些?价格是多少?云市场小编为您整理了"什么是ocr识别" 相关商品,包含商品介绍、价格、服务商等信息。如有问题,您可通过拨打950808或在云商店官网提交工单联系我们,希望以下"什么是ocr识别" 商品能为您提供有效的解决方案https://marketplace.huaweicloud.com/series/1de7755447074ece81ab3abb17ea3aa2-1-S
3.文字图片OCR识别软件北京译图智讯专注于OCR识别技术,提供文字提取、图片识别等服务,主要产品有包括:ocr发票识别软件,增值税发票识别,银行流水识别,银行卡卡号识别,营业执照识别,身份证识别等.http://www.etoplive.com/
4.OCR文字识别图片提取文字合合信息,提供OCR文字识别、证件识别、银行卡识别、票据识别、表格识别、文档识别等海量识别模块,支持sdk,公有云,私有化部署等自由部署方式,满足场景需求https://b.intsig.com/ocr
1....并部署到华为昇腾NPU的详细步骤npu910bppocrPaddleOCR是飞桨推出的一套丰富的OCR工具库开源项目,支持文字检测、文字方向检测、多语种文本识别、手写体文本识别等多种OCR相关前沿算法,并提供了丰富的轻量级预训练模型和模型优化技术,可以快速部署和使用OCR功能。 https://github.com/PaddlePaddle/PaddleOCR https://blog.csdn.net/qq_54958500/article/details/143500816
2.欧美最顶尖的5家云厂商,都在押注什么?澎湃号·湃客澎湃新闻在2025财年第一财季,微软提交了一份精彩的成绩单。其中,包括Azure公共云、Windows服务器、语音识别软件Nuance和GitHub的智能云业务部门三季度营收240.92亿美元,同比增长20%,展示了微软在云计算领域的卓越实力,成为驱动微软增长的主要引擎。 Azure之所以能够迅速成长,除了依靠强大的技术支持外,还得益于公司长期以来业务布局...https://www.thepaper.cn/newsDetail_forward_29311900
3.云迁移离线采集工具采集工具文档中心云资源离线调研工具供客户采集源端平台的资源使用,目前支持对阿里云、华为云和 AWS 国际站的源端资源扫描。 如果云资源地域在境外,将扫描工具下载到境外节点进行扫描,可以减少因为网络问题造成的云厂商 API 调用失败。 准备工作 扫描工具工作需要指定云资源所在的云厂商名称, 资源所在地域 Region 和访问云资源的密钥对(...https://cloud.tencent.com/document/product/659/112539
4.公有云OCR识别服务平台公有云OCR识别服务平台 云平台OCR证件识别介绍: 文通翔云OCR云证件识别服务平台是OCR识别技术与互联网技术、云计算技术相结合的在线OCR识别服务产品,致力于成为移动互联时代OCR识别云服务的专业提供商。 基于松耦合、高复用性、易于维护的原则,我们建设了翔云OCR云识别服务平台,以统一的网络访问接口方式,对外部应用系统提...https://www.eolink.com/news/post/41190.html
5.云脉ocr云识别软件介绍来了!OCR的应用嘲有哪些?这时候就不得不借助OCR文字识别工具拉。不过如果内容不是纯中文内容的话,普通OCR文字识别是搞不定的,推荐使用【超级公式】的PDF公式识别功能; 云脉ocr云识别软件在进行ocr识别的时候具有非常大的优势,大家有兴趣可以对这款软件进行全方位的了解,上述的文字希望对大家了解云脉ocr云识别软件有所帮助。https://www.foxitsoftware.cn/scanner/jiaocheng/553.html
6.私有云ocr识别技术方案私有云ocr识别技术方案 简述:随着互联网的快速发展,人工智能发展也来越快,OCR识别就是识别图片上的文字,纸质文档识别等等,被广泛应用到技术领域,OCR的功能有很多,比如,发票识别,身份证识别,户口本识别等等,我们提供api接口,离线SDK,私有化部署,等整体解决方案。百度OCR的功能和优势 1.高精度识别:实现99%以上的高...https://www.tuidc.com/helpinfo/39620.html
7.具有OCR和AI的AzureAI视觉MicrosoftAzure阅读面部识别透明度说明 有关Azure AI 视觉的常见问题解答 全部展开|全部折叠 哪些地方提供 Azure AI 视觉? 什么是适用于 Azure AI 视觉的 SLA? 你们是存储我的图像或视频,还是将其用于产品改进? 空间分析是否会检测人脸和人的身份? Azure AI 视觉如何分析物理空间中的人? https://azure.microsoft.com/zh-cn/services/cognitive-services/face/
8.百度智能云文字识别OCR文字识别软件免费在线试用怎么样提供稳定易用的在线API、离线SDK、软件部署包多种服务形式,最高可享每天50000次免费调用,依托百度优秀的深度学习算法和海量优质数据,并针对特殊情况进行专项优化,关键字段识别准确率高达99%。 · 远程身份认证 结合OCR和人脸识别技术,实现对用户身份证件信息的自动识别和录入,同时通过人脸核身解决方案进行人脸识别和活体检...https://www.36dianping.com/space/4470401030