写点什么

公有云运维福利 | 开源监控小工具:Open-Falcon 插件 cloud-mon

  • 2019-04-03
  • 本文字数:1081 字

    阅读完需:约 4 分钟

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者 code 的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的 NAT 网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下 LB 的流量情况呀?我们现在 S3 的增长趋势是什么样子的呀?


方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装 Agent、Zabbix、Open-Falcon 等。这些东西怎么监控呢?而且公有云有很多:什么 AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?


额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。


小米内部都是用 Open-Falcon 做监控。Open-Falcon 的 GitHub 地址:


https://github.com/open-falcon



Open-Falcon 是基于 Go 开发的一款快速上手、高可用的监控系统,支持自定义 Dashboard 报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。


Open-Falcon 是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给 TA 了。方案已定,写个 Open-Falcon 插件。

架构设计

说了这么久,先上架构图:



需要支持的云


(1)AWS


(2)阿里云


(3)金山云


监控的资源范围


(1)ELB


(2)EIP


(3)NAT 网关


(4)专线


每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。


具体指标信息和含义请自行参照官网:


金山云:https://docs.ksyun.com/documents/42


阿里云:https://help.aliyun.com/product/28572.html?spm=a2c4g.750001.list.212.49707b13EZbdDR


AWS:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html


代码思路


  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;

  • 获取相应资源的所有列表;

  • 获取列表的相关监控信息;

  • 生成 Open-Falcon 识别的格式数据,推送到 Open-Falcon。

使用指北

该工具已经作为 Open-Falcon 的插件开源,开源地址:


https://github.com/open-falcon/cloud-mon


具体实现代码以及参考文档可以去 github 查看。


首先把代码 clone 下来,按照你们的实际情况配置文件,就可以使用啦。


配置文件实例:



cloud 下面是一个 list,可以写的很长很长,想配什么配什么。下面是各项参数说明:



至此,小工具分享完啦,希望帮助大家提高效率。


本文转载自公众号“小米运维” (ID: MI-SRE):https://mp.weixin.qq.com/s/IN6MjUesBkuk90tLfpadpA


2019-04-03 16:383295

评论

发布
暂无评论
发现更多内容

掌门教育自研APM实际分享

白玉兰开源

联想服务斩获两项智能运维大奖 助力企业业务创新与数字化转型

科技大数据

神经网络吴恩达, 解析极限编程--Kent Beck, Cynthia Andres John 易筋 ARTS 打卡 Week 53

John(易筋)

ARTS 打卡计划

爆赞:这份Github神仙面试笔记,不愧是上了标星120k+的Java面试手册

Java 编程 程序员 架构 面试

CentOS7 Linux服务器无法远程ssh登陆故障处理

Liyuanjie

Centos 7 linux运维 Linux内核

不为人知的网络编程(十三):深入操作系统,彻底搞懂127.0.0.1本机网络通信

JackJiang

TCP 网络编程 即时通讯 IM

面试官:你知道怎么求素数吗?

华为云开发者联盟

面试 开发者 开发 代码 素数

AI如何赋能软硬件产品创新?百度大脑开放日西安站解密

百度大脑

AI 百度大脑 开放日 EdgeBoard

拥抱开放的英特尔 让PC行业再次越过创新鸿沟

E科讯

20位大佬,勾勒出一个中国网络安全江湖

学神来啦

网络安全 信息安全 云技术

Ipfs矿机收益Ipfs矿机一天收益

比特币 区块链 IPFS

深度解读MRS IoTDB时序数据库的整体架构设计与实现

华为云开发者联盟

大数据 架构 时序数据库 FusionInsight MRS MRS IoTDB

🏆「作者推荐」【JVM原理探索】深入理解G1垃圾收集器的原理和运行机制

洛神灬殇

G1 JVM 6月日更 垃圾回收器

JAVA 面向对象 (十四)-- 关键字abstract、final

加百利

6月日更

Gopher China 2021,未来可期

非晓为骁

个人提升 架构师 Go 语言 GopherChina gopher

maven安装与核心概念全面

IT视界

maven

回忆录 | 那些你不能错过的CTF夏令营往届历程,2021精彩继续……

郑州埃文科技

深入解读 Flink SQL 1.13

Apache Flink

flink

Pandas高级教程之:category数据类型

程序那些事

Python 数据分析 pandas 程序那些事

以贝叶斯之名寻找规则模型 Falling Rule Lists

索信达控股

金融科技 模型 贝叶斯公式 用户模型 模型开发

Redis——NoSQL数据模型及分类

Java 程序员

腾讯云EMR基于YARN针对云原生容器化的优化与实践

腾讯云大数据

mapreduce

【技术】MediumKube- 快速部署容器云的开发环境

星环科技

云计算 容器 开发工具 开发环境

支持低代码开发和远程真机,DevEco Studio 2.2 Beta1来啦

科技汇

从零开始学习3D可视化之事件绑定

ThingJS数字孪生引擎

大前端 物联网 3D 3D可视化

什么是ReadWriteMany?

焱融科技

Docker 容器 云原生 高性能 Kubernetes从入门到精通

图解Git工作原理

Java 程序员 面试

可视化搭建的一些思考和实践

白玉兰开源

HarmonyOS学习路之开发篇——公共事件与通知(一)

爱吃土豆丝的打工人

Java HarmonyOS 鸿蒙操作系统

379页满满的精华!2021版“深入骨髓层”JDK源码小册已封神

Java架构追梦

Java 阿里巴巴 架构 面试 jdk源码

新思科技按需提供渗透测试服务 帮助MATESO识别业务重大漏洞,降低信息泄露风险

InfoQ_434670063458

渗透测试 新思科技 MATESO

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon_软件工程_小米运维_InfoQ精选文章