写点什么

公有云运维福利 | 开源监控小工具:Open-Falcon 插件 cloud-mon

  • 2019-04-03
  • 本文字数:1081 字

    阅读完需:约 4 分钟

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者 code 的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的 NAT 网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下 LB 的流量情况呀?我们现在 S3 的增长趋势是什么样子的呀?


方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装 Agent、Zabbix、Open-Falcon 等。这些东西怎么监控呢?而且公有云有很多:什么 AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?


额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。


小米内部都是用 Open-Falcon 做监控。Open-Falcon 的 GitHub 地址:


https://github.com/open-falcon



Open-Falcon 是基于 Go 开发的一款快速上手、高可用的监控系统,支持自定义 Dashboard 报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。


Open-Falcon 是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给 TA 了。方案已定,写个 Open-Falcon 插件。

架构设计

说了这么久,先上架构图:



需要支持的云


(1)AWS


(2)阿里云


(3)金山云


监控的资源范围


(1)ELB


(2)EIP


(3)NAT 网关


(4)专线


每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。


具体指标信息和含义请自行参照官网:


金山云:https://docs.ksyun.com/documents/42


阿里云:https://help.aliyun.com/product/28572.html?spm=a2c4g.750001.list.212.49707b13EZbdDR


AWS:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html


代码思路


  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;

  • 获取相应资源的所有列表;

  • 获取列表的相关监控信息;

  • 生成 Open-Falcon 识别的格式数据,推送到 Open-Falcon。

使用指北

该工具已经作为 Open-Falcon 的插件开源,开源地址:


https://github.com/open-falcon/cloud-mon


具体实现代码以及参考文档可以去 github 查看。


首先把代码 clone 下来,按照你们的实际情况配置文件,就可以使用啦。


配置文件实例:



cloud 下面是一个 list,可以写的很长很长,想配什么配什么。下面是各项参数说明:



至此,小工具分享完啦,希望帮助大家提高效率。


本文转载自公众号“小米运维” (ID: MI-SRE):https://mp.weixin.qq.com/s/IN6MjUesBkuk90tLfpadpA


2019-04-03 16:383313

评论

发布
暂无评论
发现更多内容

写在2020年五四青年节

耿老的竹林

个人成长

NIO看破也说破(一)—— Linux/IO基础

小眼睛聊技术

Linux 架构 后端 Netty nio

花更多的时间在自己的优势上

Neco.W

创业 自我管理 重新理解创业

人人都要有经营意识

Neco.W

创业 重新理解创业 公司管理

哲少荐书:这才是心理学

Jackey

心理学 读书

python中的GIL锁和互斥锁问题

半面人

Python

为什么厉害的人精力都那么好?

非著名程序员

程序员 程序人生 提升认知 精力管理

MySQL自增ID以及其他唯一ID方式分析

Bruce Duan

MySQL自增ID 唯一ID

如何成为一个高效的问题解决者?

汪锋

中台是为了复用?未必!浅谈产业中台建设的特点与误区

孤岛旭日

架构 中台 企业中台 企业架构 产业互联网

五十年前的一桩公案:数据库关系模型的流行史(上)

青菜年糕汤

数据库 分布式数据库 数据库规范 关系型数据库 数据库设计

leetcode8. 字符串转换整数 (atoi)

Damien

算法 数学

我在极客大学算法训练营的收获

熊斌

极客时间 极客大学

五十年前的一桩公案:数据库关系模型的流行史(下)

青菜年糕汤

数据库 分布式数据库 数据库规范 关系型数据库 数据库设计

笔记:《如何系统思考》之因果回路图

wiflish

思维方式

Java并发编程基础--线程

Java收录阁

Java 线程

实战营第一战:FizzBuzz

escray

学习 CSD 认证实战营

冥想与呼吸法之于情绪控制

树上

情绪 冥想 呼吸法 呼吸 自我

游戏夜读 | 工具游戏的辉煌

game1night

Java并发编程系列——分布式锁

孙苏勇

Java zookeeper 并发编程 多线程 分布式锁

Impala UDTF 功能实现

小鹏

大数据 hadoop cloudera 数据仓库

创投机会诞生在这四个核心变量中 | 2019年在某大学课堂做的一次讲演的实录

邓瑞恒Ryan

创业 管理 投资 行业资讯

基准测试神器JMH —— 详解36个官方例子

捉虫大师

Java 性能 JMH

聊天机器人为什么这么难?

青菜年糕汤

人工智能 自然语言处理 搜索引擎 chatbot 聊天机器人

Web3极客日报#134

谢锐 | Frozen

区块链 独立开发者 技术社区 Rebase Web3 Daily

Web3极客日报#135

谢锐 | Frozen

区块链 独立开发者 技术社区 Rebase Web3 Daily

Golang杂谈 - graceful shutdown为何离奇失效?

星语

后端 平滑重启 服务端 Go 语言

python oop 指南

志学Python

Python python 爬虫 oop

一文带你搞懂RPC核心原理

松花皮蛋me

微服务 RPC 远程调用

Redis学习笔记(安装)

编程随想曲

redis

leetcode141. 环形链表

Damien

算法 链表 LeetCode

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon_软件工程_小米运维_InfoQ精选文章