写点什么

对 Nagios 适用性的争论

2014 年 3 月 03 日

在最近一次的伦敦DevOps 集会上, Andy Sykes 引发了一场是否应该使用更好的解决方案来替代 Nagios 争论(Nagios 是提供监控和告警服务的知名应用)。

Andy 承认,Nagios 拥有简单的插件模型,并且从概念上说具有简单性和可靠性。但是其缺点更为显著。他认为,Nagios 难以扩展,因为它不支持任何类型的集群。而且配置起来也比较麻烦,会涉及到大量服务器与客户端之间的复制。此外,另一个痛点则是缺乏一套简化系统整合与自定义仪表盘创建过程的 API。在这个弹性和云的时代里,需要将新客户端告知主机,也将被视作一项重大缺陷。

针对 Nagios 的不足之处,Andy 给出了一些应对建议。他推荐采用 Sensu 应对监控问题,使用 Graphite 满足图形绘制需求,以及将 Flapjack 用于告警服务。不过对于探测异常和用户界面方面,Andy 认为目前还没有什么合适的产品。

对此, Laurie Denness 则持有不同意见,并阐述了为何Etsy 将继续使用Nagios。针对Andy 提出的每条观点,Laurie 都进行了辩驳。

Laurie 表示,对 Etsy 来说,“我们的主数据中心有 1 万项检查。一般而言每隔 2 到 3 分钟,就进行一组 30 秒的检查”。对此,必须进行一些优化调整。团队启用了 Nagios 的 use_large_installation_tweaks 标志以降低延迟,并且在惠普和戴尔服务器上禁用了扩展设置——因为 Nagios 似乎与这些设备使用的电源管理算法并不十分兼容。当 Etsy 开始使用两个数据中心时,他们选择在每个数据中心里安置一个 Nagios 实例,并使用 Nagdash 将状态和报告聚合在一起。

在配置方面,Laurie 宣称:

如果你花费时间来挑选 Nagios 配置文件,那么或许你无论如何都会喜欢它,并且正在大规模重写旧有的配置;要么或许走在了错误的路上。将之自动化是很容易的事情。

Etsy 同时也在使用 nagios-api ——这个第三方项目面向 Nagios,提供了类 REST 的 JSON 接口以将其自动化。

针对 Andy 眼中 Nagios 目前的不足之处,Laurie 给出了更为广泛的阐述。他认为,Unix 哲学适用于使用 Nagios 的工作:“以许多小型部件和应用为基础,它们都负责应对特定的小规模问题,而用户使用管线将它们关联为一体。”事实上,Nagios 拥有强大的生态系统,在 Laurie 看来这是一项强有力的优势。

在谈到 Laurie 的见解时, Theo Schlossnagle 延续了“Nagios 尚有不足”的思路:

对运营方面来说,我们需要的是读取系统遥测信息,并针对其行为提供深入的洞见。这是一个宽泛的任务,必须对收集到的数据进行分析。然而,Nagios 以及其他类似设计的五花八门的产品,都不支持这种做法。

查看英文原文: Discussion on Nagios Fitness for Purpose

2014 年 3 月 03 日 06:373973
用户头像

发布了 256 篇内容, 共 50.5 次阅读, 收获喜欢 4 次。

关注

评论

发布
暂无评论
发现更多内容

放下纠结,你就远离了拖延症

泰稳@极客邦科技

创业 个人成长 企业管理

架构师课程第七周总结

dongge

深入理解 JS 中的变量提升

墨子苏

Java 前端

Combine中@Published浅析

kingnight_pig

swift Combine Publisher

读梁宁产品30讲随笔(1)

Jackchang234987

产品 产品思维

架构师训练营 - 命题作业 第 7 周

叶鹏

神国统治者 | 中国古神话

chaozh

人民自己创造的节日 | 经济

chaozh

每个现代人都应该知道的包豪斯| 艺术

chaozh

创建有效DevOps测试策略的5大技巧

禅道项目管理

DevOps 测试 云安全

性能压力测试

dongge

MongoDB 事务,复制和分片的关系

华为云开发者社区

数据库 mongodb 事务 快照 华为云

创世 | 中国古神话

chaozh

神话

第7周性能优化

深入浅出开源监控系统Prometheus(上)

vivo互联网技术

监控 Prometheus

后疫情生产力时代智能自动化打造以人为中心的企业

人称T客

腾讯的背水一战还是奋力一搏? | 互联网

chaozh

Phobos新变种藏身系统激活工具再掀勒索风暴,360安全大脑强力“截杀”

360安全卫士

数据产品经理必备技能大纲

Jackchang234987

产品 产品经理 数据

百度大脑领先活体检测+合成图鉴别,1步调用让人脸“照片活化”无从遁形

百度大脑

人工智能 AI 人脸识别 百度大脑

女娲造物与补天 | 中国古神话

chaozh

如何挑选编程笔记本 | 数码产品

chaozh

Presto性能调优的五大技巧

华为云开发者社区

大数据 数据 内存 存储 华为云

深入理解 JS 参数传递

墨子苏

Java 前端

一文读懂数据库中的乐观锁和悲观锁和MVCC

X先生

数据库 乐观锁 悲观锁 并发控制

官宣了,英特尔并非断供浪潮而是属于内部供应链调整

Geek_116789

深入 Java Web 技术内幕(二)浅析DNS域名解析过程

itlemon

DNS 域名解析

Spring Cloud微服务技术栈:搭建高可用Eureka Server、服务注册与发现

itlemon

Spring Cloud

极客时间架构师训练营week7作业

好名字

极客大学架构师训练营 作业

数据结构

彭阿三

面试:围绕一个SpringBoot问我了30个问题!

Java小咖秀

spring 面试 面试题 springboot SpringBoot 2

演讲经验交流会|ArchSummit 上海站

演讲经验交流会|ArchSummit 上海站

对Nagios适用性的争论-InfoQ