速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

去哪儿网监控报警平台的设计和演化

  • 2019-09-24
  • 本文字数:664 字

    阅读完需:约 2 分钟

去哪儿网监控报警平台的设计和演化

CNUTCon上海2018大会上,郑松宽讲师做了《去哪儿网监控报警平台的设计和演化》主题演讲,主要内容如下。


演讲简介


监控报警平台是大多数互联网公司最重要的基础设施之一,可以帮助开发工程师有效预警可能发生的故障,准确定位故障发生的原因和影响范围,及时发现代码中潜在的 BUG,提高应用系统的健壮性,等等。


Watcher 平台是基于多个开源的监控和报警项目来(graphite 和 icinga 等)开发的去哪儿网统一监控报警平台,目前承担了去哪儿网大部分的报警和监控。


本次分享主要讲述 Watcher 平台产生的背景和原因,架构的设计和演化,以及我们在开发和运维过程中遇到的问题及解决方案,分享过程我会主要侧重实战经验和最佳实践的讲述和总结。


主要内容:


  1. 为什么要做 Watcher 平台;

  2. 监控系统的设计和演化、问题和经验;

  3. 报警系统的设计和演化、问题和经验;

  4. 经验和最佳实践总结。


听众受益:


  1. 理解去哪儿监控报警平台(Watcher)的架构和实现;

  2. Watcher 基于多个开源项目开发,在开发成本和性能方面寻求到了一个平衡,这对中小型互联网公司监控报警系统的开发具有借鉴意义;

  3. 学习到 graphite 和 icinga 等开源项目的使用经验和最佳实践。


讲师介绍


郑松宽


去哪儿网 高级运维开发工程师


郑松宽,2013 年加入去哪儿网平台事业部运维保障中心,主要负责监控报警平台(Watcher)和应用运维自动化平台(Portal)的设计、开发和运维。5 年时间里经历了 2 个平台的多次演化过程,遇到过许多困难,踩到过大大小小的坑,找到了众多问题的解决方案,积累了宝贵的实战经验。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


2019-09-24 15:172015

评论

发布
暂无评论
发现更多内容

鸿蒙开发实例|对象关系映射数据库

TiAmo

华为 华为云 12月月更

用javascript分类刷leetcode3.动态规划(图文视频讲解)

js2030code

JavaScript LeetCode

数据库挖矿系列-优化器设计探索穿越之旅

阿里技术

数据库

基础设施 NFTScan 正式发布 Cronos 网络 NFT 浏览器

NFT Research

区块链 NFT 数据基础设施

如何基于 APISIX 迭代数字智联平台

API7.ai 技术团队

api 网关 Apache APISIX 用户案例

【计算讲谈社】第十四讲|从学科融合走出的数字人,是技术变革还是应用创新?

大咖说

阿里云 吴翰清 数字人 元宇宙游戏

cleanmymac2023体验版功能讲解

茶色酒

CleanMyMac CleanMyMac X2023

列存引擎 Tianmu 如何实现 Delete?| StoneDB 研发分享 #3

StoneDB

MySQL HTAP 数据库· StoneDB 12 月 PK 榜

花费半个月啃完这份滴滴Redis核心手抄本,我终于把面试官按在地上摩擦了

程序知音

Java 数据库 redis 后端技术

如何用纯css代码实现太极阴阳鱼动画效果

千锋IT教育

一个多开发虚拟环境的命令行工具——asdf

吴脑的键客

Python ruby

CodeArts如何保证客户代码和应用安全?

科技怪授

华为云

2022鸿蒙开发者大赛应用创新赛道收官,中国赛区21个优秀作品获奖

Geek_2d6073

前端工程师leetcode算法面试必备-二分搜索算法(中)

js2030code

JavaScript LeetCode

OpenMLDB 社区月报 | 2022年11月

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

龙蜥社区高性能存储技术 SIG 11 月运营回顾 | 龙蜥 SIG

OpenAnolis小助手

开源 高性能 存储 龙蜥社区 sig

从源码到架构实战,Spring Boot+Spring Cloud微服务开发笔记全分享

小小怪下士

Java spring 微服务 springboot SpringCloud

活动预告 | 2022 中国开源开发者(北京)峰会

第四范式开发者社区

人工智能 机器学习 数据库 特征

Meetup No.8 回顾 | OpenMLDB + MaxCompute:集成打通云上生态,高效构建 AI 应用

第四范式开发者社区

人工智能 数据库 开源 时序数据库 特征

前端工程师leetcode算法面试必备-二分搜索算法(下)

js2030code

JavaScript LeetCode

Apache APISIX 玩转 Tongsuo 国密插件

API7.ai 技术团队

加密 api 网关 Apache APISIX

专访 | 刘乔升:开源是人类智力劳动最好的组织形式

第四范式开发者社区

人工智能 机器学习 数据库 开源 时序数据库

Dimitra荣获Web3 & Blockchain企业精神奖,有望成Web3农业领导品牌

股市老人

澜舟2022年度产品发布,抢鲜看!

澜舟孟子开源社区

人工智能

什么是CodeArts?

科技怪授

华为云

CleanMyMacX2023免费版Mac清理软件

茶色酒

CleanMyMacX

【Meetup 明天见】OpenMLDB + MaxCompute:集成打通云上生态,高效构建 AI 应用

第四范式开发者社区

人工智能 机器学习 数据库 开源 特征

【MyBatis】mybatis中#{}与${}的区别

No8g攻城狮

MySQL mybatis sql

CleanMyMac试用版4.12.1下载教程

茶色酒

CleanMyMac X CleanMyMac X2023

柏睿数据融合数据联邦+AI 打造更快、更简单、性价比更高的数据智能分析处理平台

科技热闻

融合内存计算和分布式计算 数据智能分析处理平台RapidsDB更快、更简单、性价比更高

科技热闻

去哪儿网监控报警平台的设计和演化_CNUTCon_郑松宽_InfoQ精选文章