可观测
关注可观测领域的技术实践、工具发展和前沿趋势
中国移动客服大模型:实现全面可观测性的创新实践
为高质量支撑 2024 年客服大模型商用,中国移动构建了客服大模型“混合云”生产环境,确保大模型应用安全稳定运行、智算资源高效利用。面对当前跨云调用拓扑的复杂性,以及运维保障与业务运营中服务质量观测指标的缺失问题,多团队共同合作基于 eBPF 与 Wasm 技术构建客服大模型生产运行态可观测能力。
OpenTelemetry 剖析数据模型落地!Elastic 捐赠加速持续剖析标准化进程
本文提到 Elastic 向 OpenTelemetry 项目提供了基于 eBPF 的持续剖析代理,以加速该技术在 OpenTelemetry 生态系统中的标准化进程。
自动化测试工具 JetBrains Aqua IDE 正式发布
Aqua 正式发布,这是第一个用于测试自动化的 IDE。
Grafana 通过改善事件管理助力工程师快速解决问题
Grafana Labs 是领先的可观测性解决方案提供商,它宣布对其事件响应和管理平台进行了重大改进。
Bonree ONE 技术实践:如何用 5 台机器资源支撑起 2000 探针同时起跑?
日志、指标和调用链是可观测性取得成功的三要素,而这些的实现离不开数据采集,探针采集并上报数据,后端服务接收后对数据进行处理分析,从而达到可观测的目的。通常,服务器性能数据、服务相关数据、服务之间的调用等数据经由探针采集上报,经过 ETL 处理后,成为可观测性分析中的重要依据。
民生银行云原生业务的 eBPF 可观测性建设实践
本文讲述了民生银行的网络运维团队的工程师们在企业全面拥抱云原生的过程中,如何与云杉 DeepFlow 团队携手以 vTap 流量分发为起点,逐步改变传统网络运维思路,拥抱分布式流量采集方案,引入 eBPF 零侵扰应用追踪技术,并积极探索更多观测能力的发展历程。
寒冬不改凌云志,感恩携手共进退:基调听云高端客户答谢大会暨新品发布会圆满落幕
基调听云年终高端客户答谢会暨新品发布会
好分期云原生转型下的北极星监控体系
在互联网业务场景下,系统稳定性和可用性是至关重要的,任何故障都可能对业务产生严重影响。然而,在这样的环境中,由于业务规模庞大、系统复杂度高,当出现故障时,往往会面临排查问题效率慢的挑战。 传统的监控体系可能无法满足对复杂系统的全面监测和快速问题定位的需求,导致故障持续时间延长,影响业务运营。
为什么说 eBPF 是实现可观测性的关键技术?
本文依次论述 APM 无法实现真正可观测性的原因,分析为什么 eBPF 是可观测性的关键技术,介绍 DeepFlow 基于 eBPF 的三大核心功能,并进一步阐述如何向 eBPF 的观测数据中注入业务语义。在此之后,本文分享了 DeepFlow 用户的九大类真实使用案例,总结了用户在采用 eBPF 技术前的常见疑问。最后,本文进一步分析了 eBPF 对新技术迭代的重大意义。
腾讯云原生可观测性之路:探索、实践与踩坑
可观测系统发展历史以及未来的发展趋势。
阿里云资深技术专家周洋(中亭),确认担任 QCon 北京架构稳定性专题出品人
在当今的软件开发中,架构稳定性和可观测性都是非常重要的考虑因素。
新手入门:探索 eBPF 的可观测性与安全性工作流
本文分享了学习 eBPF 的经验,eBPF 是一种新的云原生技术,其目标是改善可观测性和安全性工作流。我们可能感觉它的入门门槛很高,通过 eBPF 工具来辅助生产环境调试的步骤会很多。
易龙出席 ArchSummit 深圳站,分享 vivo 大数据采集平台可观测实践话题
vivo 大数据采集接入平台架构和监控体系、vivo 大数据采集接入原来监控遇到的问题,以及在链路稳定性、链路数据质量和链路数据成本优化场景下基于可观测的技术方案和实践。
面向故障处理的可观测性体系建设
12 年老兵谈可观测性体系建设
杨亦胜确认出席 ArchSummit 深圳,将分享《华为云交易平台 Ops 可观测实践》话题
杨亦胜将于会上分享《华为云交易平台 Ops 可观测实践》话题,详细介绍华为云交易系统架构和监控体系及其面临的问题和挑战,分享华为云交易平台 Ops 可观测实践经验。
DeepFlow 在腾讯蓝鲸观测平台中的探索与实践
本文详细阐述了蓝鲸可观测性平台如何有效地融合了 OpenTelemetry 的标准化数据接入能力及 DeepFlow 的无插桩、全面覆盖的数据收集能力,进而解决游戏业务在观测数据采集、数据孤岛、以及云原生基础设施观测等领域所面临的难题。并展望了通过 DeepFlow , 构建适合腾讯游戏的专属观测场景。
顺丰科技技术总监李波确认出席 ArchSummit 深圳
李波将于会上分享《LLM 大语言模型对企业数字化转型升级的新思考与实践》话题,重点阐述 LLM 在企业数字化转型升级中的应用场景,每类场景的模型选择原则,以及如何理解并综合应用多种技术手段实现应用目标。
可观测的崭新进化:加速 CI/CD 管道的秘密武器
对于任何工作流而言,CI/CD 管道都是重要的补充。
可观测性也“卷”起来了!过去十年,我们在阿里云如何建设可观测体系? | 卓越技术团队访谈录
阿里云云原生可观测体系的建设背景与历程是什么样的?可观测体系建设的重难点是什么?如何从内部自研走向产品化?2023 年,企业和开发者应该如何理解可观测性?
讯飞星火大模型 V1.5 发布:开放式问答取得突破,多轮对话、逻辑和数学能力再升级
星火大模型升级 200 个场景助手,深入用户真实场景解决实际问题。
AIGC、LLM 火爆得毫不意外|QCon 广州参会者调研结果公布
5 月 26-27 日,QCon 全球软件开发大会在广州·粤海喜来登酒店成功举办。
架构师(2023 年 6 月)
本期推荐文章:一个价值 70 亿美元的教训!如何避免平台工程变成“大灾难”?喜马拉雅 KV 存储演进之路;花 8 年转型微服务却得不到回报,问题出在哪儿?
YTsaurus:EB 级存储和处理系统现已开源
ClickHouse 集成了 YTsaurus 存储系统。
阿里巴巴 GTS 资深技术专家朱超健确认担任 ArchSummit 深圳专题出品人并演讲
出品专题「可观测性与智能运维」。
技术团队很刻板?这些团队的日常可不这样!
技术人的日常也可以很有料!
多层网关已成过去,网关多合一成潮流,网关改造正当时|Higress 1.0 正式发布
Higress 1.0 正式发布,即官方推荐生产可用
云绑定应用:实现业务逻辑,减轻开发者负担
什么是云绑定应用?
混沌工程实验室稳保行动·深圳站活动成功举办
2023 年 5 月 27 日,中国信息通信研究院(以下简称“中国信通院”)混沌工程实验室主办,华为云计算有限公司、腾讯云计算 (北京) 有限责任公司协办、InfoQ 极客传媒支持的混沌工程实验室深圳站沙龙成功举办。
国产替代正当时:我们是如何迁移到国产操作系统的?
近日,InfoQ《极客有约》邀请到了政采云公司运维支撑负责人朱海峰老师,为大家分享政采云公司的国产操作系统迁移实战经验。