写点什么

去哪儿网监控报警平台的设计和演化

  • 2019-09-24
  • 本文字数:664 字

    阅读完需:约 2 分钟

去哪儿网监控报警平台的设计和演化

CNUTCon上海2018大会上,郑松宽讲师做了《去哪儿网监控报警平台的设计和演化》主题演讲,主要内容如下。


演讲简介


监控报警平台是大多数互联网公司最重要的基础设施之一,可以帮助开发工程师有效预警可能发生的故障,准确定位故障发生的原因和影响范围,及时发现代码中潜在的 BUG,提高应用系统的健壮性,等等。


Watcher 平台是基于多个开源的监控和报警项目来(graphite 和 icinga 等)开发的去哪儿网统一监控报警平台,目前承担了去哪儿网大部分的报警和监控。


本次分享主要讲述 Watcher 平台产生的背景和原因,架构的设计和演化,以及我们在开发和运维过程中遇到的问题及解决方案,分享过程我会主要侧重实战经验和最佳实践的讲述和总结。


主要内容:


  1. 为什么要做 Watcher 平台;

  2. 监控系统的设计和演化、问题和经验;

  3. 报警系统的设计和演化、问题和经验;

  4. 经验和最佳实践总结。


听众受益:


  1. 理解去哪儿监控报警平台(Watcher)的架构和实现;

  2. Watcher 基于多个开源项目开发,在开发成本和性能方面寻求到了一个平衡,这对中小型互联网公司监控报警系统的开发具有借鉴意义;

  3. 学习到 graphite 和 icinga 等开源项目的使用经验和最佳实践。


讲师介绍


郑松宽


去哪儿网 高级运维开发工程师


郑松宽,2013 年加入去哪儿网平台事业部运维保障中心,主要负责监控报警平台(Watcher)和应用运维自动化平台(Portal)的设计、开发和运维。5 年时间里经历了 2 个平台的多次演化过程,遇到过许多困难,踩到过大大小小的坑,找到了众多问题的解决方案,积累了宝贵的实战经验。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


2019-09-24 15:172070

评论

发布
暂无评论
发现更多内容

架构师训练营-第二周-作业

王权富贵

面向对象与面向对象的设计原则SOLID

imicode

设计

软件设计原则

Kun

极客大学架构师训练营

架构师训练营第 2 周 _ 课后作业

方舟勇士

课程作业

架构师训练营第 2 周 _ 学习总结

方舟勇士

课程总结

Week2 命题作业 — 架构师训练营

小叶

极客大学架构师训练营

架构师训练营 -week2- 作业

Geek_5a6ca3

架构师训练营第二周总结

平淡人生

总结 极客大学架构师训练营 作业

架构师训练营 Week2 - 软件设计原则

伊利是个圈

极客大学架构师训练营

Week2-总结

龙7

《架构师》第二周总结

第二周作业课后作业

iHai

极客大学架构师训练营

架构师训练营第二次作业

+╮(╯▽╰)╭/>……

架构师训练营第二周学习心得

潜默闻雨

依赖倒置原则与Cache类设计

走过路过飞过

【第二周】架构师训练营总结

星星

架构师训练营作业 第二周

iLeGeND

架构课第二周作业

嘻哈

总结

chenzt

架构师课程第二周总结

PQY

系统架构师第二周命题作业

吴建中

极客大学架构师训练营

架构师训练营 week2-学习总结

devfan

框架设计示例

imicode

设计

架构师训练营第二周总结

allen

架构师是怎样炼成的-2-2-软件设计原则

闷骚程序员

极客大学架构师训练营

练习 2-1

闷骚程序员

面向对象编程

wei

架构师训练营第二周总结

养乐多

第二周 学习总结

Safufu

第2周 课后总结

Coder

架构师训练营 -第二周作业

Benjamin

极客大学架构师训练营

去哪儿网监控报警平台的设计和演化_CNUTCon_郑松宽_InfoQ精选文章