Airbnb 软件工程实习生 Alexander Katz 最近撰写了一篇文章,介绍了他们的团队在Airbnb部署系统中所做的改进。Airbnb 的内部部署服务 Deployboard 每天为成千上万个服务进行数千个部署。但是,这个工具没有强制部署顺序,导致工程师在某些情况下可以将代码直接推送到生产环境中。
Katz 表示,Deployboard 负责部署构成 Airbnb 基础设施和产品的服务。这些服务中的每一个都有自己的一系列环境,允许分阶段将变更推到生产环境。Katz 还指出,“在 Airbnb,我们为工程师提供了极大的自由和灵活性,我们为此感到自豪。也就是说,任何一个工程师都可以轻松地进行任意环境的部署”。这种策略越来越多地被大型组织所采用,例如,Netflix 工程团队提供了“混合容器”平台和部署系统,鼓励采用最佳实践,但不阻止必要的改变。
Katz 解释说,他们的部署工具缺少一种保证机制,无法阻止工程师以错误的顺序部署变更。此外,服务部署流程相关的文档大都过时了。在最近的 QCon 演讲中,如何持续更新文档被认为是一项艰巨的挑战,比如来自 LinkedIn 的 Michael Kehoe 做了“构建生产就绪的应用程序”的演讲。由于 Airbnb 的工程师可以自由地部署服务,而且不保证它们一定会正常运行,所以 Katz 表示,解决这个问题将成为高度优先事项。
建议的解决方案是将服务的部署阶段分为强制目标和可选目标,并按顺序显示。还添加了评论,帮助用户了解每个阶段的目的。Katz 指出,专注于直观的设计是至关重要的,因为“几乎所有 Airbnb 工程师都会定期与 Deployboard 发生交互,这些交互通常都很短,更多的是一种达到目的的手段”。
Deployboard 最新的管道视图(感谢Airbnb提供图片)
Airbnb 将配置视为代码,这意味着 Katz 和他的团队要迈出的第一步是为定义部署管道的配置文件定义规范。Katz 指出,部署本身是由管道处理的,这意味着可以使用管道来更新自己的配置。Katz 说,“如果一个管道以某种方式获得了损坏的配置,就无法通过直接的方法来修复”。因此,如果发生这种情况,他们必须开发工具来拯救管道。
通过这些变更,可以由服务团队来定义和管理管道。由于管道定义本身就是代码,所以可以将管道变更的验证作为管道自身生命周期的一部分。Katz 指出,团队评估了针对这个问题的外部解决方案,并可能在不久的将来采用其中的一个。对于感兴趣的读者,InfoQ 之前已经介绍了很多潜在的解决方案,如Jenkins X、Spring Cloud Pipelines和Spinnaker以及Azure Pipelines。
查看英文原文:https://www.infoq.com/news/2019/02/airbnb-deployment-pipelines
评论