飞天发布时刻:2024年 Forrester 公有云平台Wave™评估报告解读 了解详情
写点什么

高效智能故障处理中的系统工程

  • 2019-09-21
  • 本文字数:729 字

    阅读完需:约 2 分钟

高效智能故障处理中的系统工程

CNUTCon上海2018大会上,王亚雷讲师做了《高效智能故障处理中的系统工程》主题演讲,主要内容如下。


演讲简介


复杂 IT 系统中故障的高效发现和排除问题的解决是一个复杂的系统工程,不能仅仅依赖一个单一的功能或算法。我们在实践中总结出一套帮助 AIOps 能够在企业中落地的算法、功能和支撑平台。报警压缩能够帮助我们在众多的重复和无效报警中减少报警数量,发现重复报警中的最重要的报警条,这个类似使用根因分析发现众多指标中造成突变的根源指标。报警压缩存在一个重要的检验因素:即不能错误压缩而造成漏报,我们在实践中作出了很多努力防止这种情况。异常的自动发现帮助我们从固定阈值报警中解放出来,异常算法需要根据强周期和弱周期分开计算。在高效发现问题的基础上,通过指标的关联分析和日志、事件的关联,帮助操作人员定位故障,使用知识库推荐故障的根源和解决方案。


主要内容:


  1. 报警的类型、报警压缩的困难和目标;

  2. 压缩算法和实践;

  3. 异常发现;

  4. RCA 和知识库方案推荐。


听众受益:


  1. 如何做好落地的 AIOps 在故障分析中的实践,算法和平台工程;

  2. 探讨把算法落地的路径。


讲师介绍


王亚雷


云兴维智 CEO


清华本科,美国德州大学奥斯汀分校硕士。十多年从事互联网服务平台,分布式 计算和数据存储的开发和管理工作。先后任职微软总部、eBay 和 Twitter 总部, 拥有超过二十年的企业运维管理和研发工作经验。


2016 年回国创立云兴维智(北京)科技有限公司,并担任 CEO。公司提供面向企业云平台和在线应用的运维大数据平台服务,致力于多维度运维数据的收集、 整合、呈现、报警和智能分析,打通现有的运维数据孤岛, 运用人工智能解决企业运维运营的困境,帮助企业进行高效和精准的运维。












完整演讲 PPT 下载链接


https://cnutcon.infoq.cn/2018/shanghai/#schedule


2019-09-21 15:20958

评论

发布
暂无评论
发现更多内容

我写过的关于成长/面试/职场进阶的文章

王知无

如何理解领域驱动设计

escray

学习 极客时间 7月日更 如何落地业务建模

悟了!树,二叉树,哈夫曼树...

Ayue、

数据结构

第八次作业

Geek_9cf7b5

数据治理方法论和实践小百科全书

王知无

在线标准程序员计算器

入门小站

工具

字节跳动Go 网络库netpoll源码解析

xumc

字节跳动 Go 语言

如何写好一份技术简历

慕枫技术笔记

面试 后端 简历

一脚踢你进Go语言大门!入门者必看,万字长文,建议收藏!

微客鸟窝

Go 语言

架构训练营模块8作业

Neil43

架构训练营

索引

卢卡多多

索引 7月日更

Linux之tar命令

入门小站

Linux

浅谈大数据的过去、现在和未来

王知无

架构实战营模块八:课后作业

唐江

架构实战营

架构实战营 模块八作业

夏日

架构实战营

我们在学习Spark的时候,到底在学习什么?

王知无

2.1如何设计可拓展的架构

Lemon

架构

模块8作业 消息队列MySQL数据结构

TH

架构实战营

模块八 作业

CR

Spark入门介绍与基础案例(二)

Databri_AI

spark 概念

APISIX 网关--初识

陈靓-哲露

网关 APISIX

【HikariCP技术专题】核心源码分析(为什么那么快?)

码界西柚

源码分析 7月日更 数据源连接池 HikraCP

大数据方向另一个十年开启 |《硬刚系列》第一版完结

王知无

架构实战营模块8作业

Vic

架构实战营

从HTTP到HTTPS

喵叔

7月日更

模块8学习总结

TH

架构实战营

架构训练营模块八作业

Geek_e0c25c

架构训练营

作业表设计

大肚皮狒狒

深入学习WebSockets概念和实践

devpoint

socket websocket 7月日更

架构实战营 模块八作业

Dylan

架构实战营

What's JVM-垃圾收集器与内存分配策略

CodeWithBuff

Java JVM 垃圾回收机制

高效智能故障处理中的系统工程_CNUTCon_王亚雷_InfoQ精选文章