New Relic 的一位首席软件工程师在一篇博文中总结了New Relic 的工程师团队是如何使用DevOps 工具和实践DevOps 概念的。他在文章中总结了DevOps 角色的演进、所用到的工具,包括他们自研的产品,以及DevOps 文化带来的可见收益。
Nic Benders 目前是 New Relic 的首席架构师兼工程师 VP,他在 2012 年组建了第一支
SRE(Site Reliability Engineering)团队。这些工程师并不是被迫接受 DevOps 的哲学,相反他们是在意识到 DevOps 的好处后,主动接受了这种工作模式。尽管整个过程是自下而上的,但在开发和运维团队之间依然有一些传统的障碍需要克服。采用正确的工具和过程是另一个需要解决的难点。
首先,要设立对 DevOps 友好的角色。早期,团队尝试了 FSRE(Forward SRE),这是一个由 SRE 兼任的顾问角色。他们会被分配到不同的产品团队,有时会同时进入不止一个团队,保证团队工作的顺利进行。后来这个团队逐渐发展成 PRE(Product Reliability Engineer),不同于之前兼任的情况,他们就是团队的一员。PRE 作为团队的一员,会直接进行交流,而不是通过工单系统。最近,工程师团队发起了 Upscale 项目,让工程师们可以自由选择想要加入的团队。
Cassandra 和 Docker 给 New Relic 的 DevOps 团队带来了很大帮助。之前,数据被保存在 MySQL 中,由另一个团队管理。Cassandra 是用 Java 写的, 如果开发人员想要看它的源代码,可以直接进行调试。Docker 能让开发者基于不同的技术栈,使用统一的命令集,只要它们都用 Dockerfile 打包即可。当主要应用的架构向SOA 转型后,技术栈的数量就开始增加了。使用Docker 降低了开发和运维的障碍,因为他们可以使用相同的命令去操作部署单元。
New Relic 还使用了 2 个内部工具帮助其实现 Docker 化,分别是 Centurion 和 Shipright。Shipright 能帮助对 Docker 不熟悉的开发人员简单地从基础镜像和配置命令生成 Dockerfile;Centurion 能够简化 Docker 容器部署到特定环境的过程,还能保证部署环境在开发机器和生产机器的一致,并且是开源的。
一些New Relic 的工具是DevOps 团队自研的,比如 Insights 是一个类似于 Hygieia 的仪表盘,可以用一个视图展示从不同团队收集来的度量指标和事件数据。
采用 DevOps 给 New Relic 带来的收益包括:当团队间存在依赖关系时,消除了协作瓶颈;软件交付过程变得可视化;普及了文档化的文化,比如 runbooks 和 incident writeups。
查看英文原文: How New Relic Does DevOps
感谢薛命灯对本文的审校。
给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ , @丁晓昀),微信(微信号: InfoQChina )关注我们。
评论