写点什么

当国内大厂谈论监控的时候,他们在谈论什么

  • 2018-11-08
  • 本文字数:743 字

    阅读完需:约 2 分钟

当国内大厂谈论监控的时候,他们在谈论什么

运维同学最重要的使命就是保证线上业务的稳定运行,但是业务不出问题是不可能的,任你怎么拜服务器都没用。所以出了故障就要及时发现及时处理,监控就成了运维工作中非常重要的环节,有人甚至说监控对于运维来说,犹如眼睛对人来说一样重要。


一个完备的监控系统需要具备的是数据采集、扩展性、告警管理、高可用、历史数据存储与展示、权限管理等几个方面,每个单元可以选择的工具又非常多,正所谓 ends justify means,只要能保证业务稳定,监控工作怎么做大家可以各显身手:


  • 中小型公司业务量和人手都有限,多用开源监控工具。开源工具比较通用,能满足大多数的监控需求,实在不行还可以在它们的基础之上进行改进,国外比较受欢迎的开源监控工具/系统有:Zabbix,CACTI,Nagios 等,随着云原生理念的流行,Prometheus, Zipkin 也得到了越来越多的关注。国内也有开源的监控系统:小米开源的号称互联网企业级监控系统 Open-Falcon,现在已经被 200 多家企业采用;还有大众点评开源的实时应用监控平台 CAT,也比较好用;

  • 对于很多大厂来说,业务量规模庞大且复杂,仅使用开源的监控工具和系统无法满足自己的需求,大家都愿意自研监控系统,比如阿里巴巴的鹰眼,去哪儿网的 Watcher 等等。


所以说具体问题还是要具体分析,适合自己的才是最好的。如何才能找到适合自己的监控系统?要从源头解决这个问题,还是要先了解自己的系统,弄清楚监控的思路是什么,监控的难点在哪里,有哪些坑可以避免。


现在我们聚集了一些国内一线大厂,让你可以了解到国内顶级企业的监控实践:他们在自研监控系统的过程中有哪些考虑,是什么样的设计思路?



11 月 16 日-11 月 17 日,InfoQ 举办的CNUTCon全球运维技术大会,上海,你不可错过的运维技术盛会。咨询大会信息请联系 Joy 小姐姐,电话:13269078023 (微信同号)。



2018-11-08 14:253528
用户头像
张婵 InfoQ 技术编辑

发布了 87 篇内容, 共 53.9 次阅读, 收获喜欢 218 次。

关注

评论

发布
暂无评论
发现更多内容

七种方式教你在SpringBoot初始化时搞点事情

L

Java

JavaScript学习(九)

空城机

JavaScript 大前端 6月日更

云小课 | 华为云KYON:网段零修改上云,简单又好用

华为云开发者联盟

KYON企业级云网络 私网NAT网关 弹性负载均衡ELB 虚拟私有云VPC L2CG VPVEP

经典永流传,华为云媒体 AI 让老电影焕发新生

华为云开发者联盟

AI 云原生 音视频 电影修复 华为云媒体

一分钟懂5G

俞凡

5G

AI云市场的繁盛之夏:AI花开果熟,百度抢先品尝第一口甜

脑极体

5分钟速读之Rust权威指南(三十)多线程

wzx

rust

Vue源码学习 | 从源码中学习Javascript技巧

devpoint

JavaScript Vue 6月日更

JSON 数据格式该怎么使用

网络安全学海

json 网络安全 安全 信息漏洞 渗透测试

Kubernetes手记(22)- K8S包管理器

雪雷

6月日更

zookeeper客户端zkclient和curator的api

赵镇

zookeeper

极光开发者周刊【No.0625】

极光JIGUANG

矩阵分解推荐算法(十八)

Databri_AI

推荐算法 矩阵运算

在线html链接提取工具

入门小站

工具

[译] R8 优化: Switch 场景下的枚举

Antway

6月日更

公司给的期权有没有价值?

石云升

期权 职场经验 6月日更

快手严厉整治违规商业内容:必须构建平台良性生态链

石头IT视角

THOR:MindSpore 自研高阶优化器源码分析和实践应用

华为云开发者联盟

网络 mindspore THOR 高阶优化器 THOR算法

四份深入源码层面笔记,学完后让你彻底精通Spring Cloud!

Java架构追梦

Java 架构 面试 微服务 SpringCloud

带你认识Flink容错机制的两大方面:作业执行和守护进程

华为云开发者联盟

flink 守护进程 容错 作业执行 Flink 容错机制

阿里内部不外传的50万字Java面试手册,首次开放,一天遭狂转10w次

Java架构师迁哥

Scrum | 你需要知道这些

Python研究所

项目管理 Scrum 敏捷

华为云官网前端的技术演进与低代码实践

华为云开发者联盟

大前端 低代码 可视化 页面 华为云官网

华为自研PB级分布式时序数据库揭秘第一期:初识GaussDB(for Influx)

华为云数据库小助手

数据库 GaussDB(for Influx) 华为云数据库

🏆「作者推荐」【JVM原理探索】字节码指令集调用执行流程分析(语法分析篇)

洛神灬殇

JVM Class字节码 6月日更 字节码指令

高性能计算在人工智能(AI)智药中的应用

北鲲云

【熬夜整理近百份大厂面经】2022校招提前批面经总结分享(腾讯、字节、阿里、百度、京东等招聘信息+必考点+简历书写)

学无止境的阿奔

c++ 程序员 面试 后端 秋招

mysql的存储引擎知多少

卢卡多多

KV存储引擎 MySQL 数据库 6月日更

Linux之touch命令

入门小站

Linux

“动态规划”这词太吓人,其实可以叫“状态缓存”

华为云开发者联盟

Java 动态规划 超时 dp数组 状态缓存

极光统一消息系统UMS新版上线!多维数据统计分析助推运营增长

极光JIGUANG

当国内大厂谈论监控的时候,他们在谈论什么_软件工程_张婵_InfoQ精选文章