发布了 27 篇内容
共 67693字, 被阅读 12670次
获得了 13 次赞同
获得了 1次喜欢, 获得了 12 次收藏
参与了 6 次互动
互动包含发布评论、点赞评论、参与投票等
基于 SLO 告警(Part 4):开源项目 pyrra 使用
系列文章第 3 篇我们讲到如何使用 sloth 进行 Prometheus 规则的自动生成和 SLO 统一观测,今天我们再来看另外一个类似的开源项目 -- pyrra。
基于 SLO 告警(Part 3):开源项目 sloth 使用
本文主要讲解如何围绕 sloth 进行 SLO 建设,使用它不仅可以高效的生成大量 Prometheus rules 配置文件,还可以通过开箱即用的统一看板对多个服务的 SLO 进行观测。
基于 SLO 告警(Part 2):为什么使用 MWMB 方法
本篇文章为《基于 SLO 告警》系列文章第 2 篇,主要讲解基于 SLO 告警一般使用方法以及为什么要使用多窗口多燃烧率 (MWMB) 的方式。
基于 SLO 告警(Part 1):基础概念
看过 Google 网站可靠性工作手册 一书的朋友都知道,该书在第一部分重点讲解了基于 SLO 的告警监控相关知识,可见基于 SLO 的监控告警已然成为一种趋势,那在实际工作中,我们该如何实施和落地 SLO 监控告警呢?
Mimir 速体验(Part 6): 规则评估和告警管理
前面我们已经讲解了 Mimir 数据抓取高可靠方案,今天我们再来讲讲如何使用 Mimir 实现 Prometheus 规则评估和告警管理的高可用。
Prometheus Native Histograms 实现原理及应用
最近 Prometheus 发布了 v2.40.0 版本,其中增加了 Native Histogram 的支持,这个功能的改动还是挺大的,从设计到开发完成历史 2 年多,下面我们就来一起看看它的实现原理和应用。
Grafana 最新开源项目 Phlare 速体验
2022/11/02 这天 Grafana 对外宣称开源其连续分析(continuous profiling) 解决方案 Phlare, 今天我们就来看看它的整体架构和主要使用。
基于 Grafana LGTM 可观测性平台的快速构建
可观测性目前属于云原生一个比较火的话题,它涉及的内容较多,不仅涉及多种遥测数据(信号),还涉及遥测数据各生命周期管理,本文主要讲解基于 Grafana LGTM 技术栈实现可观测性平台构建。
Mimir 速体验 (Part 5):原生 OTLP 数据写入
以前我们介绍过, Mimir 想成为大一统的时序数据库,对多种数据协议的写入原生支持(不再需要 Proxy)必不可少,它除了天然支持 Prometheus、OpenMetrics 外,终于在 v2.3.0 实现了对 OTLP 的支持,这离它宣传兼容主流协议又近了一步。
Mimir 速体验 (Part 4):数据抓取的高可靠
在 Mimir/Cortex 中,默认一份数据从 distributor 会写 3 份到不同 ingester 节点,这样做的目的是想通过多副本复制的方式实现数据存储的高可靠。在 Prometheus 生态中,不仅要实现数据存储的高可靠,还要实现数据抓取(Agent/Collector)的高可靠。
OpenTelemetry Go Metric SDK (Alpha) v0.32.0 发布
昨天 (2022/9/21) opentelemetry-go metric v0.32.0 发布,这个版本改动颇大,基本按照 trace 的风格重构了整个 Provider,其 SDK 易用性大大增强,个人感觉以后的版本接口会以此为基础,慢慢固化下来。
Prometheus 实战 (1):容器安装
本文主要讲解如何通过 Docker 容器安装 Prometheus,以及了解它的常用配置参数。