速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

当国内大厂谈论监控的时候,他们在谈论什么

  • 2018-11-08
  • 本文字数:743 字

    阅读完需:约 2 分钟

当国内大厂谈论监控的时候,他们在谈论什么

运维同学最重要的使命就是保证线上业务的稳定运行,但是业务不出问题是不可能的,任你怎么拜服务器都没用。所以出了故障就要及时发现及时处理,监控就成了运维工作中非常重要的环节,有人甚至说监控对于运维来说,犹如眼睛对人来说一样重要。


一个完备的监控系统需要具备的是数据采集、扩展性、告警管理、高可用、历史数据存储与展示、权限管理等几个方面,每个单元可以选择的工具又非常多,正所谓 ends justify means,只要能保证业务稳定,监控工作怎么做大家可以各显身手:


  • 中小型公司业务量和人手都有限,多用开源监控工具。开源工具比较通用,能满足大多数的监控需求,实在不行还可以在它们的基础之上进行改进,国外比较受欢迎的开源监控工具/系统有:Zabbix,CACTI,Nagios 等,随着云原生理念的流行,Prometheus, Zipkin 也得到了越来越多的关注。国内也有开源的监控系统:小米开源的号称互联网企业级监控系统 Open-Falcon,现在已经被 200 多家企业采用;还有大众点评开源的实时应用监控平台 CAT,也比较好用;

  • 对于很多大厂来说,业务量规模庞大且复杂,仅使用开源的监控工具和系统无法满足自己的需求,大家都愿意自研监控系统,比如阿里巴巴的鹰眼,去哪儿网的 Watcher 等等。


所以说具体问题还是要具体分析,适合自己的才是最好的。如何才能找到适合自己的监控系统?要从源头解决这个问题,还是要先了解自己的系统,弄清楚监控的思路是什么,监控的难点在哪里,有哪些坑可以避免。


现在我们聚集了一些国内一线大厂,让你可以了解到国内顶级企业的监控实践:他们在自研监控系统的过程中有哪些考虑,是什么样的设计思路?



11 月 16 日-11 月 17 日,InfoQ 举办的CNUTCon全球运维技术大会,上海,你不可错过的运维技术盛会。咨询大会信息请联系 Joy 小姐姐,电话:13269078023 (微信同号)。



2018-11-08 14:253481
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 53.3 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

史海峰:成为技术领导者 从技术到管理的必经之路丨声网开发者创业讲堂 • 第 5 期

声网

技术管理 人工智能’

从0开始,用Go语言搭建一个简单的后端业务系统

闫同学

后端 go语言 11月月更

企业级业务架构设计:方法论与实践 学习笔记

程序员架构进阶

业务架构 TOGAF 11月日更 Zachman

简述机器学习库

穿过生命散发芬芳

机器学习 11月月更

StarRocks 技术内幕 | Join 查询优化

StarRocks

数据库

React组件之间的通信方式总结(上)

beifeng1996

React

从2开始,在Go语言后端业务系统中引入缓存

闫同学

Go 设计 后端 11月月更

极速体验docker容器健康

程序员欣宸

容器化 docekr 11月月更

如何在知乎平台上做营销推广:推荐几种引流方式

石头IT视角

js异步编程面试题你能答上来几道

loveX001

JavaScript

前端必会面试题总结

loveX001

JavaScript

React组件之间的通信方式总结(下)

beifeng1996

React

专访微盟CTO黄骏伟:WOS将为去中心化商业提供一整套数字基建

B Impact

📢利用Vite插件助力证书安装

小鑫同学

前端 插件 11月月更

Linux中 dir 命令还能这样玩!

wljslmz

Linux 11月月更

这样回答前端面试题才能拿到offer

loveX001

JavaScript

年前端react面试打怪升级之路

beifeng1996

React

我上了个假“中台”!

雨果

数据中台

设计模式之美-面向对象、设计原则、设计模式、编程规范、重构的关系

GalaxyCreater

设计模式

MySQL能力全开放,OceanBase 社区版 4.0 正式上线

OceanBase 数据库

圆满落幕!回顾 eBPF 技术的发展与挑战

OpenAnolis小助手

Linux 云原生 ebpf 云栖大会 龙蜥社区

跟着卷卷龙一起学Camera--信号采样01

卷卷龙

ISP camera 11月月更

promise执行顺序面试题令我头秃,你能作对几道

loveX001

JavaScript

百度前端react面试题总结

beifeng1996

React

一次基于Fastjson的JNDI注入

网络安全学海

网络安全 安全 信息安全 渗透测试 漏洞挖掘

从1开始,扩展Go语言后端业务系统的RPC功能

闫同学

后端 go语言 11月月更

跟着卷卷龙一起学Camera--MIPI 03

卷卷龙

ISP camera 11月月更

React源码分析4-深度理解diff算法

goClient1992

React

互联网安全体制的挑战与机遇

阿泽🧸

互联网安全 11月月更

跟着卷卷龙一起学Camera--信号采样02

卷卷龙

ISP camera 11月月更

Ansible 部署的时候提示错误 SSH password instead

HoneyMoose

当国内大厂谈论监控的时候,他们在谈论什么_软件工程_张婵_InfoQ精选文章