写点什么

公有云运维福利 | 开源监控小工具:Open-Falcon 插件 cloud-mon

  • 2019-04-03
  • 本文字数:1081 字

    阅读完需:约 4 分钟

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon

背景

当你成为公有云的一名管理员,权限和安全之间的权衡便成为了始终萦绕在我们身边的一个话题。每天在我们专心解决问题,或者 code 的时候,一会儿有人来找你:能不能帮我们看看××× 机器所在的 NAT 网关带宽多大呀?目前使用量是什么情况呀?一会儿有人问:我们在做业务升级,帮我们关注下 LB 的流量情况呀?我们现在 S3 的增长趋势是什么样子的呀?


方案调研

崩溃一秒钟,这种没有“含金量”的事情,怎么能浪费我们的时间呢?毕竟程序员的使命是要拯救地球的,再不济也得做一个优秀的产品。可是,问题来了。机器的监控好做,可以装 Agent、Zabbix、Open-Falcon 等。这些东西怎么监控呢?而且公有云有很多:什么 AWS、Azure 、阿里云、金山云等,自己重新开发一个监控系统么?


额,这个工作量有点大。干活当然得选最简单,高效,又合理的方案啦,哈哈。


小米内部都是用 Open-Falcon 做监控。Open-Falcon 的 GitHub 地址:


https://github.com/open-falcon



Open-Falcon 是基于 Go 开发的一款快速上手、高可用的监控系统,支持自定义 Dashboard 报警,可以用来监控机器各方面指标,还可以自定义插件,上报数据,获取自己想要的信息。


Open-Falcon 是小米早期的开源工具,星星多,社区活跃,还支持插件。恩,显示、存储、画图表、保持数据有序,都交给 TA 了。方案已定,写个 Open-Falcon 插件。

架构设计

说了这么久,先上架构图:



需要支持的云


(1)AWS


(2)阿里云


(3)金山云


监控的资源范围


(1)ELB


(2)EIP


(3)NAT 网关


(4)专线


每个资源都取哪些监控指标呢?当然全部取啦!控制台有啥就取啥。


具体指标信息和含义请自行参照官网:


金山云:https://docs.ksyun.com/documents/42


阿里云:https://help.aliyun.com/product/28572.html?spm=a2c4g.750001.list.212.49707b13EZbdDR


AWS:https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CW_Support_For_AWS.html


代码思路


  • 通过读取配置文件,获取资源类型、监控指标、地区信息和账号信息;

  • 获取相应资源的所有列表;

  • 获取列表的相关监控信息;

  • 生成 Open-Falcon 识别的格式数据,推送到 Open-Falcon。

使用指北

该工具已经作为 Open-Falcon 的插件开源,开源地址:


https://github.com/open-falcon/cloud-mon


具体实现代码以及参考文档可以去 github 查看。


首先把代码 clone 下来,按照你们的实际情况配置文件,就可以使用啦。


配置文件实例:



cloud 下面是一个 list,可以写的很长很长,想配什么配什么。下面是各项参数说明:



至此,小工具分享完啦,希望帮助大家提高效率。


本文转载自公众号“小米运维” (ID: MI-SRE):https://mp.weixin.qq.com/s/IN6MjUesBkuk90tLfpadpA


2019-04-03 16:383262

评论

发布
暂无评论
发现更多内容

深度访谈 Vland CTO:像乐高一样搭建元宇宙

万事ONES

元宇宙 访谈

龙蜥LoongArch架构研发全揭秘,龙芯开辟龙腾计划技术合作新范式

OpenAnolis小助手

操作系统 龙蜥社区 龙腾计划 龙芯中科 LoongArch

2022 IoTDB Summit:Dr.Feinauer《Apache IoTDB 在德国汽车生产线多级数据同步中的应用实践》

Apache IoTDB

数据库·

Log4j on Cloud 如何在云上看日志

纳速云

elasticsearch Serverless 日志 log4j java

更安全更稳定,阿里云斩获多项云系统稳定安全运行优秀案例

阿里巴巴云原生

阿里云 云原生 安全

2022 IoTDB Summit:IoTDB PMC Chair 黄向东《Apache IoTDB 1.0 全新版本》

Apache IoTDB

数据库·

再次飙升GitHub榜首!这份“保姆级”的SpringBoot笔记,不服不行

做梦都在改BUG

Java spring 微服务 Spring Boot 框架

借助阿里云 AHPA,苏打智能轻松实现降本增效

阿里巴巴云原生

阿里云 容器 云原生 AHPA

一张自拍即可实现变老变年轻,带你感受时光流逝之美

极客飞兔

Python 人工智能 计算机视觉 图像处理 百度飞桨

基于 eBPF 的 Serverless 多语言应用监控能力建设

阿里巴巴云原生

阿里云 Serverless 云原生

如何提高大数据传输的安全性

镭速

2022 IoTDB Summit:国网信通谢可《Apache IoTDB 在国家电网的应用案例》

Apache IoTDB

数据库·

鲁班软件使用明道云优化项目管理的全过程

明道云

时序数据库 CeresDB 1.0 正式发布

TRaaS

IoT离线设备云端控制指令消息触达方案——实践类

阿里云AIoT

物联网 API 网络性能优化

玩转Angular系列:组件间各种通信方式详解

echeverra

angular

一文读懂PaddleSpeech中英混合语音识别技术

飞桨PaddlePaddle

语音识别 百度飞桨

阿里云云原生每月动态 | 聚焦实战,面向开发者的系列课程全新上线

阿里巴巴云原生

阿里云 云原生

Spring中Autowired注解到底怎么实现的

做梦都在改BUG

Java spring 框架

蚂蚁集团智能可观测平台 HoloInsight 正式开源

TRaaS

2022 IoTDB Summit:中国核电刘旭嘉《工业时序数据库 Apache IoTDB 在核电的应用实践》

Apache IoTDB

用户案例 数据库·

kafka-再均衡原理

领创集团Advance Intelligence Group

kafka 3.X apache 社区 再均衡协议

业务系统从阿里云物联网平台获取设备数据的3种方案——实践类

阿里云AIoT

数据库 物联网 存储 数据处理 消息中间件

mperf:移动/嵌入式平台算子性能调优利器

MegEngineBot

性能分析 移动端 高性能计算

解锁智能合约的力量:区块链入门教程

领创集团Advance Intelligence Group

区块链 智能合约 以太坊

《数据治理行业实践白皮书》正式发布,开辟数据治理新范式(附下载)

袋鼠云数栈

数据治理

打谱编曲软件GuitarPro8.0中文版下载

茶色酒

GuitarPro

最佳实践 | 基于腾讯云MRCP-Server打造简单智能外呼系统

牵着蜗牛去散步

人工智能 腾讯云 腾讯 语音识别 智能外呼系统

APISIX 是怎么保护用户的敏感数据不被泄露的?

API7.ai 技术团队

安全 api 网关 APISIX 敏感数据

Easyrecovery16汉化版电脑数据恢复软件

茶色酒

EasyRecovery16

从ChatGPT到MOSS,《流浪地球2》是否会照进现实?

加入高科技仿生人

人工智能 AI 智能化 ChatGPT New Bing

公有云运维福利 | 开源监控小工具:Open-Falcon插件cloud-mon_软件工程_小米运维_InfoQ精选文章