作为 2022 热点技术话题,我们判断,开发者有必要对可观测的全链路技术有完整的认知和理解,以确保在越来越复杂的微服务架构体系下,仍能保持较快的故障定位和修复速度。
本专题将首先对可观测问题做概要介绍,紧接着围绕分布式链路追踪、APM、RUM、NPM四大维度以及Trace、Metric、Log三大技术指标做分别解读。在长期更新中,我们还将从故障定位、故障发现、故障恢复和改进三大维度做专题分析。同时,我们也将收集来自知乎、伴鱼等业界一流团队的最佳实践,供你参考。
专题很荣幸的邀请到 OpenTelemetry 中国社区(微信公众号:OpenTelemetry,GitHub:https://github.com/open-telemetry/docs-cn)联合出品,并由社区发起人蒋志伟全程参与采访和共建,同时也感谢所有参与到专题建设的专家们,希望中国的可观测技术和生态能够快速发展完善。
可观测技术透视
什么是链路追踪?微服务引发了怎样的问题?在深入了解分布式链路追踪技术之前,我们需要先理解这项技术产生的背景,以及它能够帮我们解决哪些棘手的问题。
系统讲解链路传递基本概念,同时结合案例讲解链路传递的过程。
给架构师的 APM 综合选型分析
可观测数据采集事实标准:OpenTelemetry 的最佳实践
可观测数据采集事实标准:OpenTelemetry 的最佳实践
如何监控 PaaS 平台的运行状态、业务系统性能、客户环境的 K8s 集群
RUM 英文全称是 Real User Monitoring,它作用是捕获和分析用户与网站的所有交互细节,旨在提高网站的可用性、提升用户体验。提升网站体验的方式非常多,可以优化数据库、优化接口调用,那为什么要 RUM 呢?
结合大量实际案例,讲解可观测体系内的采样问题
整理过去自己项目和查阅了圈内一些朋友分享案例。一方面,通过案例给大家一些技术实现和选型的参考。另一方面,做可观测系统采样设计,从产品、业务、技术不同的维度去做一些思考。
一个完整的 Java Agent 探针实现过程。
Java 探针是 OpenTelemetry 的一个重要组成部分,用于在 Java 应用程序中收集跟踪和指标数据。本文将介绍 Java 探针的实现和二次开发。
来作为可观测平台的指标监控的核心组件。配置 Java 应用,暴露 JVM 指标信息指标的方案,可以根据读者的使用场景来选择。
过去两年多作者本人关于可观测性相关工作的反思与回顾。
最近,我在微信公众号和博客园分享了一篇关于 .NET 微服务系统迁移至.NET 6.0 的故事 的文章,引起了许多读者的关注。其中,许多人对基于 OpenTelemetry .NET 的观测指标和无侵入自动化探针颇感兴趣。事实上,我已计划抽出时间,与大家分享这方面的内容。