写点什么

Uber 持续部署优化:在大型 Monorepos 中自动化微服务

作者:Claudio Masolo

  • 2024-10-09
    北京
  • 本文字数:1383 字

    阅读完需:约 5 分钟

Uber 持续部署优化:在大型 Monorepos 中自动化微服务

在最近的一篇文章中,优步(Uber)分享了开发团队如何管理微服务的持续部署,以应对使用大型单一代码库(Monorepos)的挑战。


优步的微服务架构由数千个服务组成,需要一个可靠且高效的系统来部署更新、安全补丁和新特性。为了确保这一过程的安全性和及时性,优步采用了持续部署(CD),自动化部署到生产环境中。这对维护代码质量和最大限度地减少交付更改的延迟是至关重要的。然而,随着优步的代码库和服务需求的增长,现有的部署系统面临着与规模、标准化和安全性相关的挑战,尤其是在包含多个微服务的 Monorepos 中。


优步认识到需要一个更加精简且更加自动化的持续部署系统。2022 年,该公司开展了一个重新设计其 CD 流程的项目,旨在为部署微服务创建一个更加统一且更加自动化的解决方案。当时,优步在三个 Monorepos 上管理着大约 4500 个微服务,每周处理 5600 次提交和 7000 次部署。然而,这些服务中只有 7% 是使用 CD 自动部署的,许多部署需要人工干预。这种分散且高度灵活的系统导致了效率低下和安全风险,特别是由于有 100 多个独特的部署模板是没有公司范围内的标准的。


新设计的系统名为 Up CD,旨在提高自动化和安全性。它与优步的内部云平台和可观测性工具紧密集成,确保部署默认遵循标准化和可重复的流程。新系统优先考虑简单性和透明度,特别是在管理 Monorepos 方面。一个关键的改进是通过查看每次提交都会影响哪些服务来优化部署,而不是在每次代码更改时部署所有服务。这减少了不必要的构建,并使工程师更清楚地了解影响其服务的更改。


CD 系统架构

Up 为所有服务引入了统一的提交流,确保每个服务都会经过一系列的部署阶段,每个阶段都有自己的安全检查。检查条件包括时间延迟、部署窗口和服务报警,确保仅在安全的情况下才会触发部署。每个阶段都是独立运行的,在保持安全性的同时,可以灵活地定制部署流程。这种新方法减少了手动错误,并提供了更结构化的部署体验。


Up CD 成功的一个关键部分是其用户友好的界面,该界面使工程师能够直观地查看其服务的提交历史和部署状态。界面折叠了非必要的提交,使跟踪更改和识别潜在问题变得更加容易。工程师还可以看到部署状态的实时更新,使他们能够快速识别哪些提交已部署了,以及部署到了哪些环境中。


提交历史的折叠视图


自推出 Up CD 以来,优步在服务部署自动化方面有了大幅的提升。自动部署的服务比例在一年内从不到 10% 上升到近 70%。尽管部署的频率增加了,但每 1000 次代码更改的生产事故率下降了 50% 以上,这凸显了系统安全管理更频繁部署的能力。然而,部署更改的速度加快,特别是那些影响 monorepos 中共享代码的更改,这带来了新的风险。优步通过在服务层之间交错部署此类更改来解决这些问题,如果优先级较低的服务出现了问题,则停止部署。


使用 monorepos 具有挑战性,其他科技公司也开发了自己的内部工具来改进这一开发流程,比如 TikTok 发布了 Sparo 工具来优化大型 monorepos 的 git 操作性能。


总之,优步改进后的持续部署系统已经成功地实现了大规模的自动化和标准化部署,显著提高了部署微服务的安全性、效率和透明度。通过与现有工具紧密集成并优先考虑自动化,Up CD 使优步能够应对快速的增长,同时最大限度地减少生产事故。

作者介绍

Claudio Masolo 是一名云工程师。闲暇时,他喜欢跑步、阅读和玩老式电子游戏。


原文链接:

https://www.infoq.com/news/2024/09/uber-continuous-feployment/

2024-10-09 08:007045

评论

发布
暂无评论
发现更多内容

快手动效渲染引擎Crab,解锁“游戏化动效”开发新方式!

快手技术

Java 前端 动效

推理模型的“年终考试”,谁是国内目前最好的“o1”?

Alter

AI 大模型 推理模型 大模型应用

甲子光年智库发布《中国 AI 算力行业发展报告》

中昊芯英

gpu 算力 TPU #人工智能

为什么企业需要 IT 资产管理软件?

ServiceDesk_Plus

资产管理 IT资产管理

智慧酒店产业发展中的新突破——时序数据库TDengine与广东粤万润科技的深度合作

TDengine

数据库 tdengine

时序数据库TDengine 2024 年终总结:与时代共跑的马拉松,我们携手同行

TDengine

数据库 tdengine 时序数据库

【YashanDB知识库】YAS-00402 failed to connect socket, errno 111, error message "Connection refused"

YashanDB

数据库 yashandb

用户态文件系统在高性能文件存储中的探索实践

焱融科技

高性能存储 用户态文件系统

这两天在改BUG,下午就被通知在改进优化了...

Summer

Java 程序员 面试 架构师 大厂

消失的一个多月,我用 AI 做了三个项目,简直不要太爽!

Immerse

【YashanDB知识库】sys登录提示账户被锁,怎么处理?

YashanDB

数据库 yashandb

读懂华为开发者空间第一课,让云上开发如此简单

华为云开发者联盟

鸿蒙 软件开发 云主机 昇腾 CodeArts

🎉 夜莺监控突破一万 star,这是汗水,也是鞭策

巴辉特

夜莺监控 运维监控 IT监控 开源监控

亚马逊直播网络不好的影响及改善方法

Ogcloud

海外直播专线 直播专线 亚马逊直播 亚马逊直播网络 亚马逊直播专线

揭秘!如何将动效描述自动转化为动效代码

快手技术

Java 前端 动效

【YashanDB知识库】imp导入数据库时,报错YAS-08023

YashanDB

数据库 yashandb

【YashanDB知识库】listagg拼接结果发生溢

YashanDB

数据库 yashandb

【YashanDB知识库】python驱动查询gbk字符集崖山数据库CLOB字段,数据被驱动截断

YashanDB

数据库 yashandb

做TikTok直播为什么需要稳定安全的海外直播网络

Ogcloud

海外直播专线 tiktok直播 tiktok直播专线 海外直播网络 tiktok直播网络

实时告警与性能监控:通过时序数据库 TDengine、taosKeeper 和 TDinsight 实现无缝监控

TDengine

数据库 tdengine

Sense 对话语音 AI:自动电话呼叫加快招聘流程;灵初智能发布端到端强化学习具身模型,实现长程任务泛化

RTE开发者社区

履约系统:应用层、领域层、集成关系设计

不在线第一只蜗牛

Java 大数据 运维

得物基于AIGC生成测试用例的探索与实践

得物技术

AI 效率提升

Uber 持续部署优化:在大型 Monorepos 中自动化微服务_编程语言_InfoQ精选文章