QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

华为云门户的六维系统监控(一)

  • 2020-01-10
  • 本文字数:631 字

    阅读完需:约 2 分钟

华为云门户的六维系统监控(一)

一个产品从雏形到成熟,业务异常会时不时的出现在这个过程中。业务异常可能不可避免,即使成熟的产品也可能由于互联网的攻击而异常,如果能及时发现异常并快速处理,对业务/用户造成的影响就能降到最低。如果某次异常发生后一两个小时或者更长时间业务侧都没有发现,那这种情况就很可怕了。


  华为云门户,包括官网、云市场、云社区(论坛)、用户中心等关键业务,是华为云的门脸。面向互联网,随时可能被攻击,业务异常对用户感知、体验、华为云品牌都会构成严重的威胁。业务的监控和告警显得尤为重要,下面来看看我们门户在这方面做了哪些动作来确保异常能快速的被监控到并产生告警,覆盖了系统可用性和用户体验性两大方面。
复制代码



一、OpsMonitor


  • 介绍:OpsMonitor 是基于 Zabbix 开发的分布式运维监控系统,公有云统一监控平台。可将通用类主机资源使用情况上报到 IES 统一展示。检测到异常时立即告警。

  • 监控点:主机资源如 CPU、内存、磁盘空间、系统启动时长、用户密码过期检测、进程数量监控、* 网卡状态、网络流量、nginx 进程等。

  • 解决问题:服务器资源状态、进程等异常时业务侧无感知。

  • 检测频率:当前配置 5 分钟。

  • 告警阈值:可根据具体监控项进行配置,如 CPU 空闲率 30%。

  • 告警方式:邮件、短信。

  • 实战:2018 年 2 月 28 日 18:17 收到重要告警邮件,紧急连上服务器确认,告警属实,通过确认为后台管理服务器业务正常同步场景,同步完成后告警解除。



监控图:



本文转载自 Think 体验设计公众号。


原文链接:https://mp.weixin.qq.com/s/oZ-VCAXsboTx5cph4oAMVw


2020-01-10 11:51831

评论

发布
暂无评论
发现更多内容

哪些前端学习方法对小白比较有用?

小谷哥

OpenI启智社区2022年度优秀项目及开发者申报通知

OpenI启智社区

开源社区 优秀项目 优秀开发者 OpenI启智社区

5 步!用阿里云 Serverless 搭建高质量的图片压缩工具

阿里巴巴云原生

阿里云 Serverless 云原生

深入剖析nodejs中间件

coder2028

node.js

java学习后该怎么培养自主学习能力

小谷哥

5 分钟教你搭建「视频动作分类」系统

Zilliz

人工智能 计算机视觉 Towhee 视频动作分类

STL迭代器失效问题

Maybe_fl

微博评论高可用高性能计算架构设计

Jack

架构实战训练营9期

web前端培训上海学习好吗

小谷哥

豆瓣评分9.8!阿里内部的分布式架构手册让多少人突破了瓶颈?

程序知音

Java 分布式 java架构 java架构师 后端技术

极客时间运维进阶训练营第四周作业

好吃不贵

阿里内部高并发核心编程笔记:多线程、锁、JMM、JUC、设计模式

程序知音

高并发 java架构 后端技术 高并发架构

大数据培训学习后,就业不好就业

小谷哥

web前端培训学习需要注意什么

小谷哥

自助客户服务页面|从To B产品流量获取到客户服务体验上升

Baklib

深入理解Node.js的进程与子进程

coder2028

node.js

带你全面了解Gateway

好程序员IT教育

Spring Cloud Gateway SpringCloud Gateway

面向智慧城市的GIS框架

tjn

GIS 可视化 11月月更

Go语言—基本输入输出包的使用

良猿

Go golang 后端 11月月更

系统运维利器,百万服务器运维实战总结!一文了解最新版SysAK|龙蜥技术

OpenAnolis小助手

Linux 开源 运维 龙蜥社区 SysAK

鼎医信息加入PolarDB开源数据库社区

阿里云数据库开源

阿里云 polarDB PolarDB-X 阿里云数据库 PolarDB for PostgreSQL

惊艳华为PocketS发布会! 杰美特旗下高端品牌决色推出首款“月光宝壳”

科技热闻

pytorch实现空洞卷积+残差网络实验(torch实现

Studying_swz

深度学习 11月月更

JAVA concurrency -- AQS 源码详解

骑牛上青山

Java 源码

专为实时而生 — GreptimeDB 现已在 GitHub 正式开源

Greptime 格睿科技

开源 分布式 云原生 时序数据库 存算分离

「推荐收藏」提高组件库Level必做好这六件事

GFE

前端 组件库

量化交易炒币机器人开发合约策略

薇電13242772558

量化策略

Docker安装minio(CentOS7)

蜗牛也是牛

数据挖掘、机器学习、深度学习的区别

九章云极DataCanvas

数据挖掘 机器学习 深度学习

直播预告|全闪文件存储在 AI 大数据领域的前沿应用

焱融科技

云计算 分布式系统 高性能 文件存储 全闪存储

Milvus 编译环境演进

Zilliz

c++ Python Milvus cmake 编译环境

华为云门户的六维系统监控(一)_语言 & 开发_Think体验设计_InfoQ精选文章