写点什么

谷歌 Stackdriver 对 Kubernetes 提供更好的监控支持

  • 2018-05-28
  • 本文字数:1158 字

    阅读完需:约 4 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

在最近举行的 KubeCon 大会上,谷歌宣布了用于 Kubernetes 的 Stackdriver 的 beta 版。关键特性包括监控的中心可视性,Kubernetes 编配容器的度量指标和日志可以与已有仪表盘中的度量指标一起展示,以及更好的 Prometheus 支持。

Stackdriver 是 Google Cloud Platform 的一款监控产品,可以从服务器和应用程序收集度量指标和日志。一些度量指标已经内置在平台中,而另一些指标则需要在被监控的服务器上安装代理。代理支持自定义,可通过 API 来推送自定义指标。Stackdriver 还可以构建自定义的仪表盘,选择想要查看的指标,并通过标签进行筛选。只要这个指标存在于 Stackdriver 系统中,就可以查看它。Kubernetes 监控使用了同样的机制。

用于 Kubernetes 的 Stackdriver 监控包括日志收集度量指标收集事件。来自个体容器的日志,系统组件(如docker 和kublelet)的日志,以及系统事件(如pod 调度),这些东西都被运行在Kubernetes 节点上的代理推送到Stackdriver。在Google Cloud 上运行的Kubernetes 集群默认启用了日志收集。监控也使用了相同的机制。收集到的监控数据可以与来自系统其他部分的度量指标进行比较查看。Stackdriver 的度量指标按照资源类型进行分组,例如VM 实例和负载均衡器,并且新特性引入了新的资源类型,如Kubernetes 节点和pod。监控可以利用现有的Stackdriver 组件,比如警报和事件。

有一些特性在声明发布之前就已存在,比如容器的stdout 和stderr 被发送到Stackdriver 日志组件,系统度量指标被推送到Stackdriver 监控组件。然而,也存在一些问题——例如,默认的日志解析模式无法检测到多行事件,如堆栈信息。没有在Google Cloud 上运行的Kubernetes 集群可以使用其他的监控选项,比如 Heapster Prometheus

关于与 Prometheus 的集成问题,Google Cloud 产品经理 J D Velasquez 表示:

我们将会扩展与 Prometheus 的集成,确保在 Kubernetes 监控可用之前,边车输出组件所需的所有钩子都准备就绪。

边车容器其实是一种辅助容器,与另一个容器运行在同一个pod 中。在配置Prometheus 和GKE 的文档中提到,每个Kubernetes pod 需要一个单独的服务,不过用来运行边车容器的代码已经可以在 Github 上找到,不过它限制了集群只能运行在 Google Compute Engine(GCE)或 GKE 上。

Velasquez 补充道,“Stackdriver Kubernetes 监控 beta 版现在可以在 Kubernetes Engine alpha 集群中进行测试,一旦 Kubernetes 1.10 发布,就可以在生产集群中使用。”Stackdriver 的数据可以导出到BigQuery、Google Cloud Storage 和Google PubSub 进行后续分析。

查看英文原文 Google’s Stackdriver Monitoring Announces Better Support for Kubernetes Deployments

2018-05-28 15:361845
用户头像

发布了 731 篇内容, 共 459.4 次阅读, 收获喜欢 2004 次。

关注

评论

发布
暂无评论
发现更多内容

最长回文子串 -- 三种解答

秦怀杂货店

数据结构 算法 最长回文子串

[ Golang 中的 DDD 实践] 值对象

baiyutang

golang 设计模式 领域驱动设计 DDD 10月月更

架构实战课程 模块6作业

Frank

字节跳动是如何落地微前端的

字节跳动终端技术

字节跳动 大前端 Web应用开发

KubeVela 1.1 发布,开启混合环境应用交付新里程碑

阿里巴巴云原生

阿里云 云原生 KubeVela

2021年10月4日Facebook史上最严重宕机复盘分析

郑州埃文科技

ip数据 网络波动 网动仪

高并发中的 限流、熔断、降级、预热、背压!

进击的王小二

高并发 java

物理服务器是什么意思?怎么构成?与云服务器有啥区别?

行云管家

云计算 服务器 云服务器 物理服务器

华为技术官珍藏版:SpringBoot全优笔记,面面俱到,实在太全面了

Java 架构 面试 微服务 后端

100台机器上海量IP如何查找出现频率 Top 100?

秦怀杂货店

IP 海量数据 top

云资源是什么意思?有什么特点?

行云管家

云计算 云服务 多云服务 云资源

企业运维监控管理系统我给推荐行云管家!

行云管家

云计算 运维 运维监控 云管平台

系统召回太慢?上 Milvus × PaddleRec 双剑合璧大法!

Zilliz

数据库 推荐算法 召回 向量检索

【Vuex 源码学习】第九篇 - Vuex 响应式数据和缓存的实现

Brave

源码 vuex 10月月更

Golang语言HTTP客户端实践

FunTester

golang 性能测试 HTTP 接口测试 FunTester

Pandas教程:数据处理基石-数据探索

Peter

Python pandas

新一代容器平台ACK Anywhere,来了

阿里巴巴云原生

阿里云 云原生 ACK Anywhere

细节理解!阿里内部Java高并发系统设计全彩手册曝光!霸榜GitHub

进击的王小二

Java 架构 高并发 Java性能调优

【Flutter 专题】34 图解自定义 View 之 Canvas (二)

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 10月月更

这些行业用ERP系统会有很大帮助

低代码小观

企业管理 ERP

【优化技术专题】「线程间的高性能消息框架」再次细节领略Disruptor的底层原理和优势分析

码界西柚

Disruptor 异步高性能 高并发处理 性能提升 10月月更

【LeetCode】无重复字符的最长子串Java题解

Albert

算法 LeetCode 10月月更

架构实战课程 模块5作业

Frank

强化学习RL AWS 自动驾驶DeepRacer ROS 架构 易筋 ARTS 打卡 Week 71

John(易筋)

ARTS 打卡计划

BPM软件是什么?BPM软件跟BPA有关联吗?

低代码小观

企业管理 业务流程管理 信息管理

爱奇艺数据质量监控的探索和实践

爱奇艺技术产品团队

监控 数据治理 pingback

9. python 入门教程快速复习,序列,数值类型,字符串方法,列表、集合、字典方法,文件操作,解析式

梦想橡皮擦

10月月更

私有云部署系列之动态获取IP(程序执行)

稻草鸟人

Python

Pandas教程:数据类型操作

Peter

Python pandas

Vue进阶(幺贰捌):Vue插槽:slot、slot-scope与指令v-slot应用讲解

No Silver Bullet

Vue 插槽 10月月更

直播回顾 | 云和恩墨范计杰:Oracle DBA的SQL编写技能提升宝典(含SQL资源)

墨天轮

oracle sql 函数

谷歌Stackdriver对Kubernetes提供更好的监控支持_DevOps & 平台工程_Hrishikesh Barua_InfoQ精选文章