写点什么

AIOps 未来已来,博睿数据有哪些实践经验?

  • 2022-06-13
  • 本文字数:2656 字

    阅读完需:约 9 分钟

AIOps未来已来,博睿数据有哪些实践经验?

运维方式逐渐走向智能化


根据 IT 桔子的不完全统计,2021 年,IT 运维行业相关融资事件共有 24 起,融资金额约 54.7 亿元。


据艾瑞咨询的数据显示,2021 年中国 IT 服务突破万亿大关,其中 IT 运维市场规模达到 2941.2 亿元。预计 2023 年将达到 3236.4 亿元,2020-2023 年的年复合增长率为 11.7%。就智能运维赛道而言,全球智能运维的市场规模年复合成长率预计为 30.6%,2027 年达到 400 亿美元的规模。


毋庸置疑,IT 运维正在成为继 SaaS 之外又一个被送上风口的赛道。在这个巨大的角斗场中,资本、企业、技术正在塑造行业发展的新逻辑。


在过去的数十年间,运维发展经历了数个阶段。从早期的手工运维到标准化运维、自动化运维,再到 DevOps、AIOps,追溯整个历程不难发现,运维方式随着技术的不断发展,逐渐迈向智能化。


从 2016 年AIOps(智能运维)概念被提出,到 2017、2018 年全球市场出现商业化产品,在国内市场,2020 年是 AIOps 的元年。根据第三方评估机构预测,到 2022 年,40%的大中型企业将部署 AIOps 平台。不难猜测,智能运维将在很长一段时间成为 IT 运维的重点赛道。

AIOps 需要长期演进,不断创新发展


虽然 AI 技术给运维工作带来的价值显而易见,但需要明确的是 AIOps 不是一个一蹴而就的实践,而是一个长期演进的过程,需要不断创新发展。


就当前国内智能运维的环境而言,博睿数据首席架构师李骅宸认为 AIOps 还存在以下几方面的挑战:


  • 普适性:在不同的客户业务场景中,如何减少定制化和实施成本,又能更好的解决业务问题。

  • 可解释:AI 的结果如何自解释,如何验证。

  • 效率:高度自动化地减少人工干预。

  • 资源:在私有化或 POC 时,极致的技术应用到资源和性能优化中,以最小资源成就最大价值。

  • 稳定:AI 算法高度智能化和自动化。


要在智能运维方面持续发力,首先,要打破数据孤岛,做 DNA 数据的最大化融合,建立数据资产的统一管理仓库,产生联邦数据的次生价值


2021 年,博睿数据提出了“服务可达的数据链 DNA”技术理念,D 代表 DEM(数字体验管理),N 代表 NPM(网络性能管理),A 代表 APM(应用性能管理),从而打通从代码到用户访问的全过程,进一步释放企业 IT 运维监控管理所有分支领域 DEM、APM、ITIM、NPM 和智能运维管理的能力。以数据链 DNA 概念为例,AIOps 是 DNA 中重要的一环,可助力 APM 产品和数据实现端到端打通,让 DNA 更加自动化和智能化。同时,DNA 数据链也给 AI 提供场景和数据土壤,让 AI 通过信息整合、特征关联真正的跑出优质算法模型。


其次,要加强数据分析和数据挖掘,扩展 AI 产品能力,夯实算法基础能力,让 AI 支持轻量级的模块化和产品化。在算法可解释性和评价体系方面建立一套标准,引入不同的数据集进行数据加工分析,用真实故障注入的方式来不断锤炼 AIOps 能力,在商业化输出时能够以近乎开箱即用、极低适配成本的方式实现价值的最大化输出。


更为重要的是,AIOps 本就是基于已有的运维数据,并通过机器学习的方式来进一步解决自动化运维没办法解决的问题。企业实现 AIOps 的前提是建立起全面获取 IT 数据的能力,这里的数据主要包括但不限于日志、指标和事件等。将这些数据输送给 AIOps 平台,为 AIOps 提供数据资产,以进行整合的更高级别的分析和洞察。如果没有这些大数据的支持,AIOps 则是无源之水。所以对于企业来说,大数据采集工作至关重要。


总体而言,中国市场足够大,数据也足够丰富,而在国家战略和政策的支持下,传统制造业正向智能创造逐步发展,发展的过程中必然会涉及大量数据处理,而这也是 AI 技术的强项,当前在运维领域,AI 技术的应用还是刚刚起步,慢慢成熟,在未来的 3-5 年内,AI 技术会广泛应用到运维场景中,向自助式服务方向发展。

博睿数据的 AIOps 实践经验


2020 年,博睿数据开始重兵投入智能运维赛道。就博睿数据而言,博睿数据的 AIOps 的核心是“数据+AI+产品+场景”四合一的综合解决方案。在一体化运维、告警管理、故障定位、应急快恢等高频运维场景中帮助用户更高效、更准确的达成业务目标。


其特性主要有 5 个方面:


  1. 门槛低:博睿数据的 AI 接入简单,开箱即用,算法支持可视化和自解释;

  2. 性能高:同等性能条件下资源消耗较少,1 台 4C8G 机器可处理每分钟 6.6 万指标量,3 台 8C16G 机器可处理每分钟 48 万指标量;

  3. 数据全:APM 深耕多年,数据多而全,比如 Trace 核心基础能力,博睿数据支持多语言、多框架,也能和日志深度关联。这对 AIOps 做多模态数据联邦分析和挖掘有优势;

  4. 范围广:算法通用性强,适应范围广泛,针对不同行业进行了模型优化;

  5. 分析强:可观测数据、流程工单数据、配置管理数据汇总到数据中台,提供流批一体的在离线数据查询聚合能力,为任意指标、实体的关联分析提供独到见解支撑。


目前,博睿数据基于自研的大数据实时处理和分析平台 Zeus 做数据挖掘,在异常检测、趋势预测、告警收敛、事件分析等应用场景方面已实现产品化落地。


具体来说,异常检测,主要应用于运维数据的无监督异常发现环节,不需要运维人员手工设置阈值即可做到异常的自主发现,大幅节省了人力投入;


趋势预测,主要应用于业务特性运维数据的预测场景,比如容量预测、访问量预测、硬件缺陷预测等等,对于运维人员的预算编制、业务规划和提前介入处置起到很大的参考作用;


告警收敛,主要应用于统一告警平台的事件管理场景,运维人员不再需要面对大量的无效告警,只需要关注收敛后的少量故障,应急处置的效率和精准度有了大幅提升;


事件分析,主要应用于一体化运维平台的问题管理场景,AI 将指标、Trace、事件的异常信息汇聚到问题,从问题查找根因,从根因联动通知、自动化等处置步骤,问题分析的效率和精准度得到大幅改善。



目前,博睿数据算法中台 SwiftAI 已赋能到新一代 APM 的 Server 产品、新一代的智能运维大数据平台 DataView、“双模一体”智能应急中心 OneAlert 等,与博睿数据统一联邦数据中台 Zeus 相辅相成,不断落地智能异常检测、趋势预测、智能告警、事件分析等场景,助力云原生时代服务可达。


2022 年 5 月 20 日,博睿数据正式推出了一体化智能可观测平台ONE,该平台旨在建立一体化、智能化、面向业务与用户体验的统一运维平台,助力企业提高数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。同时,这也是业界第一个将所有运维监控需求“All in ONE”的统一平台。博睿数据的 AI 能力,比如告警收敛、根因分析、多维分析、影响分析等,也将在 ONE 平台的观测洞察、应急管理等模块中逐步落地。 


谈及博睿数据 AIOps 未来的发展,博睿数据 AIOps 首席专家贺安辉表示:“未来,博睿数据在 AIOps 方面将在根因定位、影响分析、NLP、算法实验室四个方面发力。”同时,未来博睿数据也将继续发展多模态数据联邦“底座”和 AI 算法的广度和深度,支持全程服务可观测。

2022-06-13 11:273512

评论

发布
暂无评论
发现更多内容

软件开发全套资料整理下载(投标支撑,立项,研发,测试,实施维护,安全监测,服务巡检,结项,验收支撑)

代码人,代码魂

数据赋能业务,神州数码HR数字画像荣获2023HRoot人力资源管理卓越实践奖

科技热闻

Linux centos 安装nodejs完整教程 详细到不能再详细了

javaNice

Java Linux nodejs

HarmonyOS应用开发

不在线第一只蜗牛

华为 架构 系统 HarmonyOS

杭州悦数出席 2023 云栖大会计算巢专场,分享云上最佳实践

最新动态

头脑风暴利器!10款超实用的思维导图软件,助你脑洞大开!

彭宏豪95

思维导图 头脑风暴 在线白板 办公软件 思维导图软件

如何 Get 字节跳动同款云原生大数据平台

字节跳动云原生计算

大数据 云原生

第三方数据测评对比五大品牌HTTP代理!哪家代理最纯净稳定

Geek_bf375d

软件测试/测试开发丨接口自动化学习笔记——请求方法构造

测试人

软件测试 接口测试

冬天的第一份惊喜,是小艺给的!

最新动态

【云栖2023】林伟:大数据AI一体化的解读

阿里云大数据AI技术

大数据 AI

加密货币交易软件开发:树立行业新标准

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

前端常用的开发工具有哪些?

互联网工科生

前端框架 前端开发工具 JNPF

程序员这个职业未来会消失吗?

高端章鱼哥

编程 程序员 AI编程

重庆上百位老师和学生,正在使用这个国产操作系统

OpenCloudOS

Linux 操作系统

软件测试/测试开发丨接口自动化学习笔记——响应体断言

测试人

软件测试 接口测试

立冬礼物已送达,小艺陪你开启“暖冬”模式

最新动态

全方位监控基础设施,坚实守护您的业务稳定!

观测云

监控 基础设施 网络

实例详解构建数仓中的行列转换

华为云开发者联盟

数据库 后端 华为云 华为云GaussDB 华为云开发者联盟

风口过后,该重新关注软件内在质量了

neverwinter

程序员 互联网 软件工程 软件质量 软件研发

AutoCAD 2024 中文版 附 完整图文安装激活教程 支持M1

彩云

mac软件下载 AutoCAD 2024

COSCon'23|Sermant亮相2023第八届中国开源年会,共赢数智时代

华为云开源

开源项目 微服务治理 sermant

浅议特权账号防护措施

尚思卓越

网络安全 数据安全 特权账号管理

如何使用 GTX750 或 1050 显卡安装 CUDA11+

北桥苏

PyTorch cuda cudnn

Macos视频下载工具:Downie 4 支持M1

彩云

视频下载 downie 4

少林寺方丈释永信造访 Meta 总部;OpenAI 正在摧毁创业公司?丨 RTE 开发者日报 Vol.80

声网

Linux centos 安装docker

javaNice

Java Docker Linux

实例讲解数据库的数据去重

不在线第一只蜗牛

数据库 架构 系统架构 系统

AIOps未来已来,博睿数据有哪些实践经验?_软件工程_博睿数据_InfoQ精选文章