报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

去哪儿网监控报警平台的设计和演化

  • 2019-09-24
  • 本文字数:664 字

    阅读完需:约 2 分钟

去哪儿网监控报警平台的设计和演化

CNUTCon上海2018大会上,郑松宽讲师做了《去哪儿网监控报警平台的设计和演化》主题演讲,主要内容如下。


演讲简介


监控报警平台是大多数互联网公司最重要的基础设施之一,可以帮助开发工程师有效预警可能发生的故障,准确定位故障发生的原因和影响范围,及时发现代码中潜在的 BUG,提高应用系统的健壮性,等等。


Watcher 平台是基于多个开源的监控和报警项目来(graphite 和 icinga 等)开发的去哪儿网统一监控报警平台,目前承担了去哪儿网大部分的报警和监控。


本次分享主要讲述 Watcher 平台产生的背景和原因,架构的设计和演化,以及我们在开发和运维过程中遇到的问题及解决方案,分享过程我会主要侧重实战经验和最佳实践的讲述和总结。


主要内容:


  1. 为什么要做 Watcher 平台;

  2. 监控系统的设计和演化、问题和经验;

  3. 报警系统的设计和演化、问题和经验;

  4. 经验和最佳实践总结。


听众受益:


  1. 理解去哪儿监控报警平台(Watcher)的架构和实现;

  2. Watcher 基于多个开源项目开发,在开发成本和性能方面寻求到了一个平衡,这对中小型互联网公司监控报警系统的开发具有借鉴意义;

  3. 学习到 graphite 和 icinga 等开源项目的使用经验和最佳实践。


讲师介绍


郑松宽


去哪儿网 高级运维开发工程师


郑松宽,2013 年加入去哪儿网平台事业部运维保障中心,主要负责监控报警平台(Watcher)和应用运维自动化平台(Portal)的设计、开发和运维。5 年时间里经历了 2 个平台的多次演化过程,遇到过许多困难,踩到过大大小小的坑,找到了众多问题的解决方案,积累了宝贵的实战经验。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


2019-09-24 15:172115

评论

发布
暂无评论
发现更多内容

Go- 方法-1

HelloBug

方法 Go 语言

Ubuntu Server 20.04 搭建安装Harbor

玏佾

Docker k8s Harbor

打一把游戏看一场病:当VR成为“数字新药”

脑极体

Confluence 数据中心版本接近生命周期了

HoneyMoose

【VueRouter 源码学习】第一篇 - 环境搭建与路由模式介绍

Brave

源码 vue-router 9月日更

GitHub阅读量最高的文章竟是图解Java,不愧是Alibaba内部资料

Java~~~

Java 架构 面试 JVM 基础

Java + opencv 实现性别识别

张音乐

Java OpenCV 9月日更 性别识别

区块链落地进行时:专利猛增,构建工业互联网信任价值

CECBC

人能靠自驱来学习吗?

石云升

学习 9月日更

09. 深度学习携手大数据引领第三AI热潮--何为深度学习?

Databri_AI

人工智能

Linux之ssh-add命令

入门小站

Linux

一文读懂 OceanBase 数据库的启动恢复代码解析

OceanBase 数据库

数据库 分布式事务 oceanbase OceanBase 开源

“吾道一以贯之”:华为Petal One的新格局

脑极体

网络攻防学习笔记 Day125

穿过生命散发芬芳

9月日更 互联网安全

【网络安全】漏洞复现有多少种方式?

网络安全学海

php 网络安全 信息安全 WEB安全 安全漏洞

LeetCode刷题704-简单-二分查找

ベ布小禅

9月日更

德勤:区块链成为现实,采用逐渐增多

CECBC

如何大规模交付高质量、高一致性的RESTful API及配套产物

刘宇

API OpenAPI REST API

GraphQl Calculator计算指令@distinct:使用表达式对列表进行去重

杜艮魁

数据中台 graphql

谈 C++17 里的 Singleton 模式

hedzr

c++ 算法 设计模式 Singleton

🚄【Redis干货领域】从底层彻底吃透RDB原理(基础篇)

码界西柚

redis RDB 快照 rdb分析 9月日更

IntelliJ IDEA 中如何将 POM 中的版本号快速提出为属性

HoneyMoose

Go- 方法-2

HelloBug

方法 Go 语言

未来10年,C++5个非常有前景的就业方向

hanaper

在线JSON转Go Struct工具

入门小站

工具

RedHat 8 如何检查端口是否联通

HoneyMoose

Promise.all() 原理解析及使用指南

devpoint

Promise 异步任务 9月日更

物联网实时监管 区块链云端留痕 公章何时何地何人用过一清二楚

CECBC

微信朋友圈高性能架构设计

毛先生

Go- 结构体

HelloBug

Go 语言 结构体

🚄【Redis干货领域】从底层彻底吃透AOF原理(基础篇)

码界西柚

redis aof Redis 协议 9月日更

去哪儿网监控报警平台的设计和演化_CNUTCon_郑松宽_InfoQ精选文章