有关Kubernetes监控的4大常见陷阱,注意避免!

2020 年 4 月 23 日

有关Kubernetes监控的4大常见陷阱,注意避免!

Kubernetes(K8S)现在似乎是管理和部署基于微服务和容器的应用程序的事实标准——其中缘由亦不难理解。Kubernetes 是最大的开源社区,它由云原生计算基金会(CNCF)支持,它是 DevOps 友好的,它提供了混合云的优势。有什么理由不爱它?


但在 TheNewStack 的最近一项调查中,69%的受访者表示,诚然 Kubernetes 是他们企业容器编排的首选,但部署和管理 Kubernetes 并非像在公园散步一样轻松惬意。尽管 Kubernetes 具有很高的灵活性,但仍存在操作工作流程的复杂性——许多涉及应用程序性能管理(APM),真的想要完全体会到 Kubernetes 承诺的好处,还需要在有效管理上下大功夫。


重新思考你的 Kubernetes 监控策略


在一个近期的 CNCF 调查中,38%的受访者表示监控是其企业采用 Kubernetes 过程中的最大挑战之一。若把受访者划分为部署规模更大的那批企业,这一数字甚至增长到了 46%。那么,现代 IT 领导者该如何简化 Kubernetes 监控,以提高效率,同时优化性能?


目前的 Kubernetes 监控方法存在的主要问题,从缺乏端到端的可视性,到迁移容易出错,不一而足。下文中我们将聊聊监控 Kubernetes 时可能遇到的四个常见挑战——以及如何解决这些挑战的建议。


挑战 1:缺乏端到端的可视性


Kubernetes 传统监控的最常见问题之一,是缺乏对客户接触点和分布式应用程序的端到端可视性。


因此,IT 团队对最终用户体验和应用程序性能如何影响业务 KPI 没有任何概念和感受,也因此无法知道要修复或改进的内容。


为了解决这个问题,使用基于正常性能的 Kubernetes 监控解决方案非常重要,并且可以利用机器学习的强大功能,从而在出现问题时智能地向 IT 团队发出警报。



挑战 2:告警风暴


虽然了解所有应用程序的问题似乎是一件好事,但是当多个问题同时出现时,它可能会迅速失控并成为障碍。毕竟,你真的希望每次有工作完成或新容器启动时,都收到一遍提醒吗?


如果没有优先级警报的能力,IT 团队通常必须对每个问题的根本原因做出响应和分类,这将直接带来非常糟糕的用户体验甚至是成本损失。


因此使用 Kubernetes 监控解决方案时最好能要识别和解决确切的潜在问题——深入到代码行、单个设备、Kubernetes 服务甚至单个容器级别。


挑战 3:故障排查的痛苦


应用程序停机的成本可能会高到令人咋舌——关键的应用程序故障每小时可能损失高达 100 万美元。时间就是金钱,IT 团队在检测问题的根本原因时不应该浪费时间。


问题是,今天的许多监控工具都缺乏在 Kubernetes 环境中执行自动化根本原因分析的能力,使故障排除成为一个耗时的噩梦,通常会导致高 MTTR 和长停机时间。


为避免这种情况,请通过比较迁移前后的用户体验,确保您的 Kubernetes 监控解决方案能够在应用程序依赖性和迁移成功验证两个方面都具有更高的可见性。



挑战 4:易出错的迁移过程


将传统应用程序迁移到 Kubernetes 很容易出错并且非常耗时。那些才将现有单体应用程序迁移到部署在 Kubernetes 上的微服务的公司,更易缺乏对 Kubernetes 环境的可见性,因此无法看到每个微服务或传统应用程序的实时交互。


这时可以考虑借助可通过单一管理平台提供一步安装和统一监控的解决方案,让 IT 团队可以充分利用其现有的技能、流程和工具。


在 Kubernetes 上提供完美的应用程序性能


越来越多的公司开始使用 Kubernetes 来改变公司在分布式多云环境中部署和运行应用程序的方式,且这 Kubernetes 的流行势头丝毫没有显示出放缓的迹象。但对于在 Kubernetes 上运行传统或基于微服务的应用程序的组织来说,监控的挑战依然显而易见。


因此,组织必须认真考虑 Kubernetes 监控方法的方方面面,以简化复杂的企业工作流程,提高成本效率并提高生产力。通过对整个 Kubernetes 堆栈和 Kubernetes 协调应用程序的端到端统一可视性,IT 团队可以提供完美的应用程序体验——并确保他们的 Kubernetes 投资能够带来更好的业务成果。


2020 年 4 月 23 日 17:2269

评论

发布
暂无评论
发现更多内容

Python程序性能分析和火焰图

ElvinYang

你的团队属于部落的哪个阶段?

Yanel 说敏捷产品

敏捷 敏捷开发 敏捷精髓

如何让团队产生“多米诺骨牌”效应?

Yanel 说敏捷产品

项目管理 敏捷 敏捷开发 敏捷精髓

ShedLock:一个轻量级的定时任务协调组件

kk

定时任务 shedlock

C语言输入和输出

C语言技术网-码农有道

C语言 输入 输出

C语言运算符

C语言技术网-码农有道

C语言 运算符

当前的经济形势,如何让自己免于风险?

鼎玉谷

目光聚集之处,金钱必将追随

Tom

学习 个人成长 思考 读书

如何高效阅读

ElvinYang

Try-Catch包裹的代码异常后,竟然导致了产线事务回滚!

码大叔

Java spring 事务

工具集系列 02|还在为海报设计、LOGO 设计发愁?这些在线工具值得收藏

一尘观世界

效率工具 设计 海报 课程封面 知识付费

你真的懂"看板文化"么?

Yanel 说敏捷产品

敏捷 敏捷开发 敏捷精髓

对话 CTO | 喜茶也有 CTO?听陈霈霖讲讲茶饮中的技术甜度

ONES 王颖奇

研发管理 CTO 零售

JavaScript 学习笔记——数据类型

zjlulsum

Java 学习 前端 类型推断 入门

接口限流算法有哪些,看完这篇又能和面试官互扯了~

不才陈某

Java 分布式 后端

DDD 实践手册(6. Bounded Context - 限界上下文)

Joshua

企业架构 设计模式 领域驱动设计 DDD 架构模式

Python网络编程socket 简易聊天窗

Flychen

C语言常量、变量和关键字

C语言技术网-码农有道

C语言 常量 变量 关键字

“随大流”的你是不会成功的

小天同学

个人成长 思考 写作平台 感悟 坚持

带你吃透原型设计

Yanel 说敏捷产品

产品 产品经理 产品设计 产品开发 产品推荐

危机过后,「表格文档协同」需要具备什么能力?

Geek_Willie

前端开发 开发者工具 Excel

【解析+示例】2种方法,通过SpreadJS在前端实现甘特图

Geek_Willie

前端开发 甘特图 SpreadJS 表格控件

NIO 看破也说破(三)—— 不同的IO模型

小眼睛聊技术

Java 学习 深度思考 程序员 架构

前端有未来吗?

欧雷

前端 前端开发

追光逐影:读《我们这一代》

北风

认识数据产品经理(二 数据产品经理的稀缺性)

马踏飞机747

大数据 互联网 数据分析 产品经理

工具集系列|值得收藏的几个免费在线学习国外网站

一尘观世界

学习 工具 网站 提升

对话 CTO | 听快看漫画 CTO 李润超讲重塑漫画产业的技术推动力

ONES 王颖奇

研发管理 CTO 动画 文化

Linux学习-2020.05.11

Flychen

从技术层面理解对于区块链技术的10.24集体学习讲话

MaxHu

区块链 智能合约 以太坊 加密货币 去中心化网络

每个人都应该知道的性能参数

ElvinYang

有关Kubernetes监控的4大常见陷阱,注意避免!-InfoQ