速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Blue Matador 使用 Terraform 从自托管的 Kubernetes 迁移到 AWS EKS

  • 2019-06-20
  • 本文字数:1323 字

    阅读完需:约 4 分钟

Blue Matador 使用 Terraform 从自托管的 Kubernetes 迁移到 AWS EKS

Blue Matador 在比较了各种特性之后,将他们的 Kubernetes 基础设施从 AWS 实例上的kops托管集群迁移到了 AWS 的托管 Kubernetes 服务EKS。他们选择 EKS 是因为它有更好的安全模型、托管控制平面,而且可以降低他们特定用例的成本。在创建一个新的 Kubernetes 集群方面,kops 是赢家,而 EKS 在集群管理和安全性方面得分更高。InfoQ 联系了 Blue Matador 的软件工程师Keilan Jackson,进一步了解他们的经验。


EKS 的共享责任模型及其托管控制平面是迁移的主要原因。在 EKS 之前,Blue Matador 团队在 3 个 c4.large AWS 实例上运行他们自己的 Kubernetes 主节点。Kubernetes 的升级——包括 Bug 修复和安全补丁——都由团队负责。因为基础设施在 AWS 内部,所以 AWS 仍然提供了一个安全层,但是他们必须自己管理 Kubernetes 的特定安全问题。在私有网络、加密根卷和安全组控制等资源方面,Jackson 写道:“使用 kops 创建的 Kubernetes 集群的默认设置和 EKS 非常类似。”使用 EKS 设置一个新的集群需要做一些准备工作,但是,初始设置完成后,EKS 使集群管理更容易。


Blue Matador 主要使用Terraform来管理他们的 AWS 资源。Terraform 实现了跨云提供商的多种资源类型,但现实世界的使用情况揭示了其中的挑战。Jackson 谈到了他们面临的 EKS 特有的挑战:


我尽量利用社区构建的EKS模块。我遇到的主要问题是使用了 AWS 提供程序和 Terraform 的过期版本,然后将这个模块中的托管资源连接到我的外部托管资源,比如我们的主 ALB、RDS 实例等等。我建议从配置 EKS 的模块中输出一些 Terraform 变量,这样就可以在其他模块中引用它们,如下所示:

output “worker_role_arn” {

value = “${module.eks_cluster.worker_iam_role_arn}”

}


虽然 Terraform 可以很好地创建和管理 EKS 集群,但是后者依赖于相互关联的外围资源。Jackson 提供了详细的阐述:


除了运行 EKS 集群本身之外,EKS 还需要大量的资源。您必须配置工作节点、安全组、VPC 网络,并计划好在 EKS 提供新版本 Kubernetes 支持时进行更新。如果可能的话,一定要使用社区模块,因为它有助于正确连接这其中的许多基本资源,但是请记住,务必要按照您的安全需求仔细检查设置。例如,确保安全组只对需要它们的东西开放,确保工作节点不会获得公共 IP 地址,确保使用加密的 AMI 作为根设备。


在谈到集群规模时,Jackson 说,“集群的总大小还没有达到我们不得不在 kops 集群中使用超过 3 个主节点的程度,但重要的是,我们能够快速、轻松地扩展节点,并在 Kubernetes 新版本发布时更新到新版本。”


托管 Kubernetes 服务通常与他们平台的监控解决方案集成在一起。Jackson 解释了他们如何监控他们的集群:


我们主要依靠自己的产品 Blue Matador 实现 Kubernetes 集群报警。它会发现一些不健康的部署、关键节点事件、pod 内存耗尽等问题,并帮助我们监视集群的利用率。我们还使用 Datadog,但仅用于绘制几个自定义指标。我们关注 Amazon EKS 的 CloudWatch 容器洞察,但通常,CloudWatch 对 Kubernetes 而言不够活跃,因此,我不会依赖它来进行生产环境报警。


迁移还降低了团队的基础设施和监控成本。


查看英文原文Migrating From Self-Managed Kubernetes to AWS EKS Using Terraform at Blue Matador


2019-06-20 13:385554
用户头像

发布了 741 篇内容, 共 480.9 次阅读, 收获喜欢 1549 次。

关注

评论

发布
暂无评论
发现更多内容

jmeter 执行python脚本

陈磊@Criss

一文熟悉MySQL索引

书旅

MySQL 索引

第十周.命题作业

刘璐

第十周.总结

刘璐

作业一

Kiroro

22种超全用户触点采集,易观方舟SDK又更新了

易观大数据

吴桐:数字货币具有稳定的避险性吗

CECBC

区块链 数字货币 链政经济

如何有效防止sql注入

Java旅途

两数之和

书旅

数据结构 算法 数据结构与算法

架构师培训第10周练习

小蚂蚁

高中生写LOL外挂1年狂赚500万,落网前刚买下120万保时捷...

程序员生活志

编程 程序员 外挂

弹性计算的内部概念:弹性扩张、弹性收缩、弹性自愈

陈磊@Criss

Clover:解决Java8和Cobertura的问题以及解决方法

陈磊@Criss

5G从小就梦想着自己要迎娶:高速率、低时延、大容量三个老婆

华为云开发者联盟

5G IoT 通信 华为云 NB-IoT

Web前端性能优化,应该怎么做?

华为云开发者联盟

运维 大前端 HTTP js

原创 | 使用JPA实现DDD持久化-R:数据的世界

编程道与术

Java hibernate DDD JDBC jpa

Grafana和ES打造的Nginx的仪表盘

陈磊@Criss

一文读懂GaussDB(for Mongo)的计算存储分离架构

华为云开发者联盟

数据库 mongodb 数据 GaussDB 存储分离

环信助力OFashion迷橙开辟海外直播带货新通路

DT极客

架构师训练营第十周总结

Hanson

架构师0期Week10作业2

Nan Jiang

标新立异的日志归档:用更少的内存归档大规模测试日志

陈磊@Criss

什么是死信队列

Java旅途

RabbitMQ

作业二

Kiroro

欲速也可达:Battle接口测试训练系统的1分钟快速说明

陈磊@Criss

[翻译]分布式系统的模式-综述

流沙

架构 分布式系统

推荐Scrum书籍

Bob Jiang

Scrum 敏捷

架构师训练营第十周作业

Hanson

架构师0期Week10作业1

Nan Jiang

看DLI服务4核心如何提升云服务自动化运维

华为云开发者联盟

Serverless 运维 运维自动化 华为云 DLI

python判断文件和文件夹是否存在、创建文件夹

陈磊@Criss

Blue Matador 使用 Terraform 从自托管的 Kubernetes 迁移到 AWS EKS_软件工程_Hrishikesh Barua_InfoQ精选文章