java稳定性建设实践个人文章

所在组织结构:团队成员40人左右,业务特点:有大量老服务、流量波动大(峰值集中在中午和傍晚)、流量不可预测。

稳定性小组的组成:

职责:

稳定性保障小组这个名称其实不是特别准确,后续又承接了很多其他的横向推动的任务,主要包括三大块:

整体流程图:

超过3PD的需求需要写方案文档同步到小组群,超过10pd的需求需要小组内评审。

禁止提交master分支【强制】

分支规范【强制】

团队之前没有静态代码检查,存量代码中存在大量的待解决问题,卡控应先卡控增量代码,然后逐步提升全量卡控比例;

大部分代码没有单测,且很多跑不通过的单测。治理过程:(a).修复跑不过的单测;(b).流水线检查单测必须跑通过;(c).引入单测规范;(d).卡控增量代码覆盖率、单测必须有assert;(e).卡控全量覆盖率

每次发布、配置变更、数据变更都需要使用上线变更平台发起申请单,并通过二层审批

a.上下游机器配置平衡

b.负载均衡

c.机器利用率:治理资源利用率太多的应用,及时扩容

d.弹性伸缩容接入(基于K8S)【核心服务强制】

检查机制:基础数据通过大盘报表查看,各平台零散数据通过爬虫爬数据,再输出报表

a.服务提供者治理:C端必须有接口限流

b.依赖资源治理:C端核心依赖必须有熔断、降级【强制】

c.风险治理:公司基建,风控推动等

d.报警治理:P0+P1报警,每个问题都必须跟进,如无必要报警,调整报警策略【强制】

检查机制:规范+周会同步

a.压测【强制】

公司工具:Trace链路追踪、Mock工具、影子表工具等

稳定性小组做的事:

b.故障演练【强制】工具:故障演练平台

梳理稳定性问题,包含以下几部分:

a.核心服务稳定性梳理:代码走查、风控接入等

b.线上线下行为不一致治理:代码里有大量ifelse不同环境走不同逻辑

c.资损专项治理:接口幂等、对账等

a.Metric:跨服务调用链路追踪

基础组件:上层中间件支持如RPC框架、HTTP客户端服务端、MQ、定时任务框架等。如果没有链路标识,则自动添加链路标识

b.日志

通过监听slf4j日志,上报到日志中心并通过ES+Kibana提供查询能力

c.指标

后端指标统计、大盘建设、报警(阈值报警+智能报警)、前端指标统计等。

常见的指标类型有:

a.监控

监控建设金字塔:

基础平台监控、中间件监控:公司基础组件自动上报

业务监控:需要后端业务RD手动打点上报

用户体验:需要前端手动打点上报

b.报警

基础平台、中间件、应用指标会自动配置报警,但是很多时候不合理,需要RD手动配置报警。

c.大盘

聚合多个指标,可以做一些简单的数值运算,形成1个大盘。

d.稳定性小组做的事:规范化(可报警、可看、可查)、自动化(减少人工成本)

指标可追溯:指标和日志Tag绑定:重要业务指标,都要有相应日志;且ES中Tag需是索引字段;

指标的治理:(解决的问题:单个指标是1个点,指标多了离散化严重)

节假日巡检

问题处理原则:先止损、再修复

自动部分

人工介入流程【强制】

SLA口径:统计团队所有服务所有接口的200返回判断是否正常,

问题:a.大部分服务使用错误码代替HTTP状态码、b.流量小但重要接口出现异常影响不了整体指标、c.长耗时接口被统计成正常

推动需求生命周期都走研发流程管理平台,比如ONES。

框架规范、模块划分规范、分层规范、编码规范等;

a.服务改造,不支持本地开发的原因:

b.工具

c.面临的挑战:

测试环境泳道治理:主要是主干泳道治理,如RD不能手动操作的主干泳道,主干泳道根据master分支更新自动发布等

线上仿真环境:

推动策略包含:

a.手段1-下机器

数据报表建设:按组织结构选择所有服务资源利用率报表,未达标报表

立目标:deadline,每周目标

数据播报:大群每天定时播报各组资源利用率

b.手段2-弹性伸缩

弹性伸缩规则:

服务弹性伸缩注意事项,不适合弹性伸缩的场景:

c.手段3-服务改造

推动的每件事情都会进行宣讲

规范考试

SOP考试

线上操作规范考试等

新人入职N个月内不允许上线

考试的通过后才自动开通线上发布权限

稳定性事情涉及的事项、团队、服务非常多,CaseByCase的治理,很容易没有重点且效果不好,要有方法论来全局规划、推动落地。

复杂的事情简单化,简单的事情标准化,标准的事情流程化,流程的事情自动化。

简化常用的方法:任务拆分,复用(比如:框架的复用、设计模式的复用等)

分两部分:操作流程(SOP)、团队规范、术语标准化、数据口径标准等;

落地有相应辅助工具,比如有了ORM框架规范,需要基本的代码生成工具;

完全避免人工操作,比如各种数据统计、任务进度报表等

治理之前:单测全凭RD自驱,单测不完善、单测跑不过、单测框架多、流水线没配置单测

a.简单化:任务拆分

b.标准化:规范+模版+数据口径

c.流程化:

d.自动化

需要承担大量非本职能的工作,不要自我设限:比如数据指标建设、大盘建设、自动脚本开发等。

为治理效果负责,不能只当传声筒,可以通过以下几方面保障事情推动:

向上管理很重要:

需要Leader支持的:

稳定性的事情QA、SRE、其他横向稳定性小组等保持了良好的沟通协作,保障事情顺利推动:

THE END
1.叉车自动化流水线技术方案(纯方案,22页).docx叉车自动化流水线Proposal Overview 方案概述设计依据客户提供的如下资料: 1)总成数模,文件名u; 2)总成尺寸图,文件名; 3)总成焊缝列表,文件名“11524成3027ENd0602.tif” ;Equipment List 设备清单机器人工作站1描述数量机器人咱动化设备 TOC \o 1-5 \h \z M-10iA弧焊机器人1 机器人控制柜FANUC R-30iA ...https://max.book118.com/html/2022/0524/6134044121004151.shtm
2....组装仓储流水线系统设计图纸下载设计方案图纸自动化生产线是在流水线的基础上发展起来的。它不仅要求线体上各种机械加工装置能自动地完成预定的各道工序及工艺过程,使产品成为合格的制品,而且要求在装卸工件、定位夹紧、工件在工序间的输送、工件的分拣甚至包装等都能自动地进行。使其按照规定的程序自动地进行工作。https://www.mfcad.com/tuzhi/bysj/6318/1143088.html
3.自动化生产流水线制作流程七、设计开发由工程部安排工程师进行机构设计,作出机器装配图、零件图(零件标注按国家标准)选出执行元器件、电控配件并列出加工零件清单和标准件请购单,动作说明书。 八、对自动化生产流水线方案二次审核 由技术人员组成审核组,对所设计出的图纸进行审核,审核内容包括: ...http://www.gsdzzx.com/xingyezixun/12-315.html
4.FluxCD方案设计与维护结合FluxCD 可以扩展为面向容器应用的GitOPS通用解决方案(包括普通容器应用,分布式容器应用) 结合Flagger与支持灰度的ingress 可以实现普通应用的流水线发布的设计,可以实现A/B,蓝绿,金丝雀发布,2022 MSP renew 中的App流水线demo 就是采用如下实现方式 image.png...https://www.jianshu.com/p/1268ad781126
1.工业自动化中的自动化流水线设计技术.pptx工业自动化中的自动化流水线设计技术目录CONTENTS自动化流水线概述自动化流水线设计技术自动化流水线关键技术自动化流水线面临的挑战与解决方案自动化流水线发展趋势与展望01自动化流水线概述CHAPTER自动化流水线是一种高效的生产组织方式,通过自动化设备、传感器、控制系统等实现生产过程的自动化、智能化和连续化。自动化...https://m.renrendoc.com/paper/316477656.html
2.自动化流水线设计方案及实施步骤自动化流水线设计方案及实施步骤 自动化流水线存在效力高、工作坚固、操作简单、便于实现主动化把持等上风,在很多的生产企业中起到举足轻重的作用。水平调整蹄角系列 由滑管、调整螺、弹簧、螺环、紧定箍、棘轮、紧定扳手、连杆等组成。使用时向下扳动紧定扳手,紧定箍松开并可在滑管上滑动,以调整托架的概略水平。http://www.czdingtao.com/news/570.html
3.自动化生产流水线设计方案及实施步骤自动化生产流水线具有效率高、工作可靠、操作简单、便于实现自动化控制等优势,在很多的生产企业中起到举足轻重的作用。那么自动化生产流水线的设计方案是怎样的呢?以及该实施步骤又是怎样的呢?以下小编就给大家来介绍这些过程。 1、确定流水线的生产节拍流水线的节拍就是顺序生产两件相同制品之间的时间间隔,可以表明流...http://www.xinweishengshi.com/page95?article_id=57
4.自动化流水线方案影响因素自动化流水线方案受以下因素影响: 1.应用场景和环境要求自动化流水线规划需要考虑其应用场景和环境的特殊要求,如温度、湿度、压力、噪声等影响设备使用寿命和性能的因素,以及对清洁卫生的特殊要求。 2.设备选型和配置:自动化流水线的方案设计需要考虑所选机械设备的性能要求、可靠性、维护和更新成本,同时需要优化工艺,...https://www.feng-teng.com/newsinfo/6542207.html
5.西门子PLC四站流水线机械手自动化控制系统设计方案(2).docx综上所述,机械手控制系统设计是一个集理论知识与实践操作于一体的复杂工程,涉及到电气工程、自动化技术、PLC编程等多个领域的知识,对于提升工业自动化水平具有重要意义。通过这样的设计,不仅能够解决实际生产中... 毕业论文基于PLC的车间生产流水线运输控制设计说明.docx ...https://download.csdn.net/download/G11176593/85894845
6.微生物全实验室自动化检测流水线解决方案微生物全实验室自动化检测流水线解决方案,功能:样品中微生物的分离,培养,鉴定和保藏用途:食品、药品、化妆品、农产品中微生物检测、环境中微生物检测、临床样品中微生物检测。特点:根据需求设计配置模块,性价比最高根据场地设计模块布局、使用最方便应https://www.bio-equip.com/show1equip.asp?equipid=4929727
7.国网北京电力研发充电桩自动化检测流水线为智能化检测提供技术方案 今年,国网北京电力开展充电桩自动化检测流水线项目成果转化,建设了检测流水线。流水线由自动化测试系统、智能存储系统、智能交互系统、检测管理系统构成。 自动化测试系统设计了5个测试工位,能与检测样品自动对接,并开展测试。智能存储系统、智能交互系统可实现充电桩样品的智能运载与存储,以及测...https://m.bjx.com.cn/mnews/20240620/1384178.shtml
8.自动化专业毕业设计实习报告(精选13篇)我的实习岗位是ccpbg事业群cnp组装 b04线完成品检查,在师傅和同事的帮助下,我顺利完成了各项生产、检测任务,通过不懈的努力和出色的表现,得到了领导和同事的一致认可。 二、 主体 2.1实习目的 2.11毕业实习是我们机械制造与自动化专业知识结构中不可缺少的组成部分,并作为一个独立的项目列入教学计划中的。通过本次实...https://www.ruiwen.com/shixibaogao/5150669.html
9.又一批优质岗位来袭,快来看看有没有你的“薪”动选项!1、根据客户要求,制定非标自动化设备、自动化流水线的方案; 2、对新项目进行方案评审,审核新项目的机械结构; 3、负责设计部标准化机构的建立和维护。 任职要求: 1、28-40岁,大专及以上学历,机械设计制造及其自动化专业,非标自动化行业2年以上机械设计工作经验; ...https://www.thepaper.cn/newsDetail_forward_8426613
10.一款小型工业4.0教学智能制造生产线无人工厂的设计方案小型工业4.0教学智能制造生产线无人工厂,是对工业现场大型设备进行提炼和浓缩的一款小型智能制造生产线实训设备,专门为职业院校、教育培训机构等而研制的,它适合机械制造及其自动化、机电一体化、电气工程及自动化、控制工程、测控技术、计算机控制、自动化控制等相关专业的教学和培训。融合了数控机床加工、光、电、气,包...http://foshan0479449.11467.com/news/678027.asp
11.自动化生产线自动化流水线设备厂家旭日东一直专注于新能源、信创、3C、机械重工、汽车家电等领域非标自动化设备的解决方案,集设计、制造、安装、售后于一体。公司承接系统工程主要包括:智能仓储、锂电化成分容、智能物流、自动化包装、自动化装配测试、机器人集成应用以及IOT、ERP、BPM、MES、WMS、WCS软件https://www.xrdsz.com/
12.传感器灌胶灌封流水线固化随道炉整体解决方案明康自动化为温控器(温度传感器)所设计的灌胶流水线方案,使用双组份AB胶水的自动灌胶,配合隧道炉加热固化,目前明康可为多种不同产品提供完整流水线方案 全国服务热线: 400-800-9351 详细信息 前言: 灌胶机生产线作为一种非标方案,每一家厂商对于流水线灌胶需求都不一样。我们详细罗列了某家客户,他们的产品需求...https://www.gzmingkang.cn/product/71.html
13.RFID射频识别技术在生产流水线管理解决方案随着工业自动化的不断发展和智能制造的普及,RFID技术在生产流水线管理中的应用越来越广泛。RFID技术(无线射频识别技术)是一种自动识别技术,通过射频信号实现对RFID标签内信息的非接触式读写。在生产流水线管理中,RFID技术可以实现对生产物品的实时监控和https://www.yr-info.com/m/view.php?aid=353
14.光伏组件自动化生产流水线康奋威600MW组件自动化生产流水线 康奋威提供光伏组件制造的整线解决方案和交钥匙工程服务 采用德系设计标准,线体配备EL检测、绝缘耐压、IV等检测系统,实现在线检测控制,保障生产组件品质;具备智能检测预警系统,保障生产过程可靠稳定;支持与MES系统无缝对接,实现生产过程可视化管理。 https://www.confirmware.com/product-category/solar-panel-production-line/
15.生产线全自动化生产线流水线,输送线设备江苏冠猴智能控制设备有限公司是一家专业设计、制造生产线、全自动化生产线流水线、输送线设备企业。我们为每个客户提供可定制的解决方案!http://guanhou.com/
16.自动化包装生产流水线后道包装流水线厂家SpeedPack思辟德包装设备是自动包装线、自动化包装流水线、纸箱自动包装线的研发、生产、销售和服务为一体的后段包装线生产厂家。主要产品:开箱机、封箱机、打包机、热切收缩机、缠绕机、装箱机、码垛机和自动包装输送流水线等包装机械设备。免费为客户提供包装流水线设计https://www.zidongbaozhuangxian.com/
17.喷涂机器人方案喷涂自动化解决方案!当然喷粉作业方法也有例外如下方的案例,采用的喷粉柜是独立的,喷粉的工件要求较高,移动流水线的状态下人工不好喷粉所以改造自动化也是在原有的基础上采用转台机器人方式喷粉,和喷漆第二个方式类似的作业方法! 在常用的喷涂机器人解决方案改造中也有一些特例,需要专业的机器人工厂,喷涂自动化领域经验丰富的企业来设计开...https://www.dghzjqr.com/xinwenzixun/1332.html