写点什么

公有云运维福利 | 开源监控小工具:Open-Falcon 插件 cloud-mon

  • 2019-04-03
  • 本文字数:1081 字

    阅读完需:约 4 分钟

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者 code 的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的 NAT 网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下 LB 的流量情况呀?我们现在 S3 的增长趋势是什么样子的呀?


方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装 Agent、Zabbix、Open-Falcon 等。这些东西怎么监控呢?而且公有云有很多:什么 AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?


额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。


小米内部都是用 Open-Falcon 做监控。Open-Falcon 的 GitHub 地址:


https://github.com/open-falcon



Open-Falcon 是基于 Go 开发的一款快速上手、高可用的监控系统,支持自定义 Dashboard 报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。


Open-Falcon 是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给 TA 了。方案已定,写个 Open-Falcon 插件。

架构设计

说了这么久,先上架构图:



需要支持的云


(1)AWS


(2)阿里云


(3)金山云


监控的资源范围


(1)ELB


(2)EIP


(3)NAT 网关


(4)专线


每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。


具体指标信息和含义请自行参照官网:


金山云:https://docs.ksyun.com/documents/42


阿里云:https://help.aliyun.com/product/28572.html?spm=a2c4g.750001.list.212.49707b13EZbdDR


AWS:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html


代码思路


  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;

  • 获取相应资源的所有列表;

  • 获取列表的相关监控信息;

  • 生成 Open-Falcon 识别的格式数据,推送到 Open-Falcon。

使用指北

该工具已经作为 Open-Falcon 的插件开源,开源地址:


https://github.com/open-falcon/cloud-mon


具体实现代码以及参考文档可以去 github 查看。


首先把代码 clone 下来,按照你们的实际情况配置文件,就可以使用啦。


配置文件实例:



cloud 下面是一个 list,可以写的很长很长,想配什么配什么。下面是各项参数说明:



至此,小工具分享完啦,希望帮助大家提高效率。


本文转载自公众号“小米运维” (ID: MI-SRE):https://mp.weixin.qq.com/s/IN6MjUesBkuk90tLfpadpA


2019-04-03 16:383344

评论

发布
暂无评论
发现更多内容

社区版 2024.8 | CloudQuery社区版取消可创建用户数限制!!

BinTools图尔兹

数据脱敏 数据库管控 数据库安全 CloudQuery

关于 TiDB 升级后结果不一致问题

TiDB 社区干货传送门

管理与运维 故障排查/诊断 新版本/特性解读 应用适配 6.x 实践

TiKV Raft 快照全流程丨TiKV 源码解读(二十二)

TiDB 社区干货传送门

顶尖选择:5个RPA主流产品性能评测

八爪鱼采集器︱RPA机器人

RPA 自动化 RPAxAI

SHOPLINE x TiDB丨集群成本降低 50%!跨境电商 SHOPLINE 交易、商品管理等核心业务的数据库升级之路

TiDB 社区干货传送门

TON链上的代币开发与小程序开发:模式与要求

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

Gate.io盘前交易:DOGS热潮下抢先交易的新策略

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

竞技世界 x TiDB丨注册用户超 5 亿,大规模数据及高并发场景下分布式数据库从 1 到 N 的演进

TiDB 社区干货传送门

一起单测引起的项目加载失败惨案

京东科技开发者

RPA行业发展前景:2023-2026年5大预测

八爪鱼采集器︱RPA机器人

RPA 自动化 RPAxAI

Titan 引擎:通过从 LSM-Tree 中分离大值,实现 6 倍的写入性能的提升

TiDB 社区干货传送门

TiDB 扩缩容原理及常见问题

TiDB 社区干货传送门

管理与运维 故障排查/诊断 扩/缩容 TiKV 底层架构 7.x 实践

Apache Paimon V0.9最新进展

Apache Flink

大数据 flink 实时计算 湖仓一体 paimon

“AI+Security”系列第2期(五):大模型自身安全

云起无垠

唐刘:当 SaaS 爱上 TiDB(一)- 行业挑战与 TiDB 的应对之道

TiDB 社区干货传送门

基于资源管控+TiCDC实现多业务融合容灾测试

TiDB 社区干货传送门

实践案例 7.x 实践

巧用商品详情数据,制定精准营销策略

Noah

缩容 TiKV 原理及常见问题

TiDB 社区干货传送门

集群管理 扩/缩容 7.x 实践

KubeCon China 2024全球大会在香港举行,京东云受邀参加探讨云原生、开源及 AI

京东科技开发者

敦煌智旅:Serverless 初探,运维提效 60%

阿里巴巴云原生

阿里云 Serverless 云原生

数业智能心大陆AI大模型,共情陪伴你的心理健康

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

分布式数据库系统环境的“无感”升级

TiDB 社区干货传送门

TiKV 副本搬迁原理及常见问题

TiDB 社区干货传送门

扩/缩容 7.x 实践

Elasticsearch 8 RAG 技术分享

阿里云大数据AI技术

人工智能 elasticsearch 数据仓库 数据分析

京东小程序折叠屏适配探索

京东科技开发者

优化财务运营管理,实现企业可持续进步

智达方通

企业管理 全面预算管理 财务管理

脉讯在线:核心TiDB 从 5.4 升级到 7.1 集群 CDC 性能翻倍

TiDB 社区干货传送门

实践案例 版本升级 性能测评

扩容过程中 PD 生成调度的原理及常见问题

TiDB 社区干货传送门

监控 故障排查/诊断 扩/缩容 7.x 实践

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon_软件工程_小米运维_InfoQ精选文章