写点什么

AIOps 九大发展趋势

  • 2020-03-16
  • 本文字数:2747 字

    阅读完需:约 9 分钟

AIOps九大发展趋势

大家知道,运维是数字世界的的基础设施级别的技术。随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求就会越来越高。所以我们说,AIOps(智能运维)是运维技术发展必然的趋势。


AIOps 在国内正式提出来到现在的实际落地有两三年了,也取得了初步的落地效果。那么下一步到底怎么做?做什么?未来几年内能进一步达到什么样的效果?今天我就分享下我最近总结出来的 AIOps 发展九大趋势。


做趋势预测是有很大挑战和风险的,好在我之前在 AIOps 领域还有过成功的预测。



我在 2018 年 1 月曾给出一个 AIOps 宏观预测:我说 2018 年将是 AIOps 在中国落地的元年,而据我所知在 2018 年的确有小几十个 AIOps 项目开始落地,也就是说我的这个预测的确成为了现实。2019 年 1 月我说 2019 年是 AIOps 快速发展的一年,而实际上截止 2019 年 8 月份在国内有大几十个 AIOps 项目开始推进;与此同时,我们看到 2019 年初的时候人行以及各大银行也发文阐述支持 AIOps 方向。


我在 AIOps 具体技术上也有个算是成功的预测。2018 年中的时候我已经在公开演讲中讲 AIOps 平台化这个概念了;之后在 2018 年底,Gartner 的报告也基于与世界范围内的客户和厂商的访谈正式提出了 AIOps 平台化这一方向。


下面这幅图的左下部分是我的团队给出的 AIOps 平台架构,该图的右下部分是 2009 年我在 AT&T 工作时做的智能运维平台的架构,可以看出两幅图在概念上是非常相似的。所以,从这个例子大家可以看出,我能够先于 Gartner 提出 AIOps 平台的概念,不是因为真有什么能看到未来的“水晶球”,而是因为我之前在其它场景下做过类似工作,并且在 AIOps 方向不断努力推进。当我看到需求到了,相关条件成熟了,自然而然就能判断应该做 AIOps 平台了。所以,所谓的预测能力无非是经验的积累、不断观察、思考,最重要的是不断的亲手实践,就像林肯和图灵奖得主 Alan Kay(面向对象编程语言的发明者)所言,预测未来最好的方法就是亲手创造/发明这个未来。



下面我总结一下基于经验、访谈、观察、思考和实践得出的 AIOps 发展九大趋势,即行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估的标准化。



第一个趋势就是 AIOps 落地的多样化,这个结论是基于我通过多种渠道采集到的信息。我们自己有一个公众号“智能运维前沿”,马上要突破 10000 个用户了;我们还有一个超过千人 AIOps 群,已经成功举办了两届 AIOps 挑战赛,我一年中会到几十家各行各业机构去进行现场交流。从上述多种渠道采集到的信息清楚表明:现在开始落地 AIOps 的,除了互联网公司、银行以外,证券、保险,电力、运营商、工业制造、国家机关、自动驾驶公司也都在尝试 AIOps 落地。



第二个趋势是 AIOps 产业生态化。各个行业都在试图尝试落地 AIOps,给 AIOps 方向提供了一个很好的产业基础。“产、学、研、用”各方也都在积极跟进,形成了一个 AIOps 生态系统。在这个生态系统里,专业的人负责专业的事,有越来越多的学术机构从事 AIOps 原理研究;由机构用户负责提出实际需求,由有预研能力的厂商把 AIOps 原理上的突破变成实际落地效果;有负责数据采集、接入、存储等的厂商,还有负责集成、交付、维保等的厂商。也就是说,“学、研、产、用”几方专业分工,通力协作。AIOps 产业生态化在 AIOps 落地过程中是一个重要的里程碑,会大力推动 AIOps 的更快落地。



第三个趋势是 AIOps 数据多样化。数据中心的系统物理架构和软件架构都非常庞大复杂。因此我们必须采集、治理、融合多种运维数据源、从中提取对运维最有用的信息,帮助我们了解数据中心最新最全的运行状态, 从而为 AIOps 的众多场景服务。因此我们说 AIOps 数据多样化是必然趋势。



第四个趋势是 AIOps 场景多样化。下图罗列了一些我们与合作伙伴合作、交流时遇到的具体场景。我们分成几个大场景:即异常发现、事件发现、事件分析、系统画像、图谱丰富等。每一个大场景会包含很多的具体场景,比如“事件分析”大场景就包括“异常机器定位”、“交易链条定位”、“多维度异常定位”等多种类型的事件分析。也就是说,当用户认识到 AIOps 能实际帮助到运维的时候,会自发与生态系统中的伙伴共同找到越发多样化的 AIOps 场景。



第五个趋势是 AIOps 场景精细化。如下图所示,异常检测(也就是通过分析监控数据自动发现运维故障)就包含单指标异常检测、多指标异常检测、多维度异常检测、日志异常检测等等。而单指标异常检测在检测业务、机器、网络、数据库、存储系统、批处理的异常时,其场景和检测侧重点会有所不同,因此需要针对精细化的具体场景进行 AIOps 异常检测算法的适当调整或适配。



为了避免 AIOps 场景多样化和精细化导致的落地工作量增加,我们必须把各类场景用到的 AIOps 算法共性部分抽象提炼出来作为公用模块,为多个场景服务。如下图所示,从日志数据测量出的指标数据的异常检测,就可以复用单指标异常检测这一算法模块,并且这一算法模块已经服务化,即可以通过 API 直接调用。所以我们说的第六个趋势就是 AIOps 算法服务化,提升了效率,让整体服务得更好。



在 AIOps 场景多样化、场景精细化、算法服务化的前提下,第七个趋势,即 AIOps 技术平台化也就水到渠成了。AIOps 技术平台化打穿多个场景、多个数据源、多个算法。如下图所示,上面输入的是各种运维监控数据,输出的就是我们所需要的各种运维智能,中间是各种服务化的 AIOps 算法。不管具体的某个运维场景有什么样的特点,我们都可以通过整体平台进行自由组合和编排,从而高效落地该运维场景,避免传统方法的重复低效落地。



这也就引出了第八个趋势:AIOps 新算法落地加速化。以往一个新算法研制出来后,需要大量的工程工作配合才能让新算法产生实际效果。有了平台化之后,只需要通过编排把该新算法、新算法所需数据、已有工程工作“串”在一起,就能够快速落地。比如做了一个 0day 攻击检测算法 ZeroWall,我们在一家具体机构进行尝试的时候,一周内捕获 28 种 0day 攻击,每天捕获上万条 0day 攻击,每天误报数 0 到 6 个。如果按照以往方法,我们要花大量的时间去做 ZeroWall 的落地工作,而有了 AIOps 平台化, ZeroWall 的落地工作就快了很多。



在过去半年期间,各个行业的合作伙伴都提出了 AIOps 成熟度评估标准化的需求,而银保监会、证监会、人行、工信部相关领导也都表示会支持。这个事情我也已经着手联合各方开始做,预计一两年的时间才能做出一个切实可行的标准。



总结一下 AIOps 的九大趋势:行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估标准化。这九大趋势将助力 AIOps 在今后的几年起飞、爆发。


本文转载自成哥的世界公众号。


原文链接:https://mp.weixin.qq.com/s/N3TqbcJvl6YhGvnLNg89AA


2020-03-16 20:331903

评论

发布
暂无评论
发现更多内容

低代码实现探索(三十七)业务的流程,开发的框架

零道云-混合式低代码平台

打造优质的车联网体验,仍需注意数据安全保护

FinClip

盲盒风潮过后,中国收藏玩具市场该何去何从?

易观分析

盲盒 潮玩

N个技巧,编写更高效 Dockerfile|云效工程师指北

阿里云云效

阿里云 云原生 Dockerfile 部署与维护 构建工具

【直播回顾】OpenHarmony知识赋能第四期直播——标准系统HDF开发

OpenHarmony开发者

直播 HDF OpenHarmony

中国AI的下一站:从两会高地奔涌向产业河谷

脑极体

企业内PAAS建设的经验与教训

Crazy

中间件 PaaS 经验 云原生应用

TiDB 可观测性方案落地探索 | “我们这么菜评委不会生气吧”团队访谈

PingCAP

实用机器学习笔记二十五:超参数优化

打工人!

学习笔记 超参数调优 机器学习算法 3月月更

hexo+github搭建个人博客前期部署工作

静Yu

Hexo

大数据培训:Hadoop和MPP有什么区别

@零度

hadoop MPP 大数据开发

Go HTTP Server 基于OpenTelemetry 使用Jaeger - 代码实操

非晓为骁

Go Docker Trace Jaeger OpenTelemetry

企业知识管理的目标是什么?

小炮

移动域全链路可观测架构和关键技术

阿里巴巴终端技术

架构 App 移动端 体验优化

喜讯!openGauss社区入选2021年 “科创中国”榜单

如何使用OKR管理团队?

优秀

APICloud平台使用融云模块实现音视频通话实践经验总结分享

YonBuilder低代码开发平台

前端开发 APP开发 APICloud 融云 跨端开发

【51单片机】室友用一把王者时间,学会了去使用数码管

謓泽

3月月更

Jaeger docker部署实操

非晓为骁

Docker Jaeger Go 语言 http client

OceanBase 社区版 运维管控平台 OCP 功能解读

OceanBase 数据库

OCP oceanbase OceanBase 开源 OceanBase 社区版

ICASSP 2022 | 前沿音视频成果分享:基于可变形卷积的压缩视频质量增强网络

阿里云CloudImagine

阿里云 计算机视觉 音视频 视频编码 视频云

JavaScript深入理解之闭包

锋享前端

java培训:SpringBoot高频面试考点分享

@零度

JAVA开发 springboot

数字化时代下,智能运维全栈监控解决方案及案例盘点

云智慧AIOps社区

运维 解决方案 场景应用 自动化运维 运维安全

如何进行数据挖掘?

郑州埃文科技

数据挖掘 数据库

WebRTC 简单入门

ZEGO即构

WebRTC 动手实践 音视频开发 即构科技

云计算及国内主流云厂商概述

穿过生命散发芬芳

3月月更

【IT运维】多台海外主机运维用什么工具好?

行云管家

服务器 IT运维 服务器运维 海外主机

向工程腐化开炮 | Java代码治理

阿里巴巴终端技术

Java android JVM 代码治理

Gitlab-ci 替代 webhook 触发Jenkins job

网易云信

gitlab

如何从头到脚彻底解决一个MySQL Bug?华为云数据库高级专家带你看

华为云数据库小助手

bug GaussDB 华为云数据库 GaussDB(for MySQL)

AIOps九大发展趋势_语言 & 开发_成哥的世界_InfoQ精选文章