写点什么

BAT 都有哪些 AIOps 的经典案例?

  • 2018-09-29
  • 本文字数:1852 字

    阅读完需:约 6 分钟

首先,我们一起划重点:不提供干货的案例,都不能算好案例。

AIOps 的概念从 2016 年被提出以来,热度一直在增加,都是混运维这个圈的,我相信你听过或看过不少关于 AIOps 的报道。所以,是时候提供一些落地案例,增加一下你对 AIOps 的信心了。

11 月 16-17 日,CNUTCon 全球运维技术大会将在上海举行,我们邀请了 BAT 的专家来分享他们在 AIOps 领域的实践经验,知道你爱听“踩坑”教训和“排雷”经验,请相信,你想要的,我们都有!小编也是用尽毕生力气摁住了 Molly 和 Joy 的小手手,为大家争取来一次“剧透”的机会,提前带大家探究下他们要讲的内容!

聊起百度,想必大家的记忆都是从“百度一下”开始的,但很显然,百度并不想被大家定义为一个“搜索引擎”,于是他们涉足了各种领域,有了“百度文库”“百度知道”“百度学术”“百度地图”“百度网盘”“百度外卖”等产品。

互联网产品迭代速度非常之快,因此,百度每年都有数以万计的程序变更。但变化都伴随着风险,据统计超过 50% 的服务故障来源于发布。为了减少变更发布故障带来的损失,更好地管理海量规模的发布变更过程,百度智能变更(BID)产品应运而生。BID 提供了包含自动化部署、分级发布和变更检查的完整解决方案。

我们请来了百度智能云事业部的高级研发工程师陈云,为你重点讲述百度变更发布检查从人工到智能进阶。

「她说」

随着模块监控逐渐完善,很多模块都有数以十万计的监控数据,依靠配置规则或人工来检查发布效果是不可完成的任务。为了应对海量指标检查的需求,我们利用 AIOps 相关技术,设计出了一套可根据历史变更及对照组情况自动判断指标状态的智能检测算法。该算法不需要人工配置参数,通过自动训练参数并准确地判断异常,并且具备较好的普适性。最后,我们将展示智能发布检查在百度的具体实践效果。

本次演讲的主要内容如下:

  1. 故障来源及分布;
  2. 分级发布机制;
  3. 智能发布检查算法(异常定义、算法流程、基于 T 检验的指标变化度量、基于历史变更的异常变化检测、基于对照组的异常变化检测);
  4. 百度变更发布智能检查实践。

你能从中学到:

  1. 学习尽可能限制变更过程中异常影响范围的机制;
  2. 理解变更检查在变更过程中的重要地位和作用;
  3. 学习如果利用 AIOps 相关技术对变更过程中指标状态进行智能判断的方法。

提到阿里巴巴,你最先想到的是哪个词呢?移动支付?还是双十一?阿里系在产品种类上,也不甘落后。听说今年优酷直播世界杯,也是阿里云的小伙伴们在保驾护航。世界杯看得怎么样?是不是很清晰,又不卡顿呢?

我们请来了阿里云的视频云运维专家不畏,为你分享:智能的大脑——谈阿里视频云智能调度系统的演进。

「他说」

调度系统作为 CDN 的核心模块,对业务的质量、成本和稳定性等各方面起决定性作用。随着业务类型的快速变化,从传统的图片等小文件,到点播流媒体、直播、动态加速,调度系统也随之在不停的迭代更新以更加适应业务形态的调度模型,在业务和系统快速变化之下的稳定性、效率、智能运营是摆在运维面前的难题。希望这次可以深入浅出地介绍多次负责护航阿里“双十一”和 2018 俄罗斯世界杯的视频云智能调度系统,以及智能化运维在业务发展中的演进及其背后的思考。

本次演讲的主要内容如下:

  1. 阿里云视频云调度系统的演进之路;
  2. 在调度演进中的智能化运维思考和实践;
  3. 调度系统全盘智能化之下的运维价值。

你能从中学到:

  1. 阿里视频云调度系统在业务变化下是如何演进实践的;
  2. 在系统快速变化下的智能化运维思考模式。

去年王者荣耀,今年一起吃鸡。这是不是很多人在手游界的常态。小编虽然是个女孩子,但也经常混迹于“王者峡谷”。但我也是今天第一次去思考,游戏里的故障,腾讯是怎么定位的呢?

我们邀请到了腾讯技术运营部的高级工程师刘伟,为你深入浅出地介绍:智能运维助力游戏故障定位。

「他说」

随着游戏业务监控建设不断完善,海量业务故障时产生成百上千条告警,如何智能进行告警收敛、定位故障根源、实时统计业务影响是现阶段游戏运营面临的一个难题。本次分享以覆盖上百款游戏的智能故障定位平台出发,介绍腾讯游戏在智能异常检测、故障关联分析、故障知识图谱等方面的技术探索。

本次演讲内容如下:

  1. 利用动态阈值方法进行 KPI 曲线异常检测;
  2. 基于自然语音处理的实时舆情检测; 
  3. 故障定位领域关联分析及知识图谱技术。

你能从中学到:

  1. 学习智能监控全流程系统架构设计;
  2. 学习腾讯游戏在故障定位领域探索的经验;
  3. 掌握海量数据下动态阈值监控方法、实时舆情检测模型;
  4. 掌握构建专业知识图谱方法及知识图谱在故障领域应用。
2018-09-29 19:472314

评论

发布
暂无评论
发现更多内容

IoTDB 端边云同步:SQL 一键搞定 5 大常见场景

Apache IoTDB

数业智能心大陆告诉你如何培养孩子的批判性思维?

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

拥抱数智化,JNPF低代码平台如何推动企业转型升级

快乐非自愿限量之名

低代码 数智化

数智转型,看JNPF如何成为企业的必备工具

不在线第一只蜗牛

低代码 数智化

2024 天池云原生编程挑战赛决赛名单公布,9 月 20 日开启终极答辩

阿里巴巴云原生

阿里云 云原生

蚂蚁数科发布智能数据开发与治理平台DataFab 加速数据要素价值释放

Lily

这应该是全网最详细的Vue3.5版本解读

快乐非自愿限量之名

JavaScript Vue 前端

数业智能心大陆:揭秘如何利用AI做心理疗愈

心大陆多智能体

智能体 AI大模型 心理健康 数字心理

他们正在体验用友BIP超级版AI新利器

用友BIP

API 网关 OpenID Connect 实战:单点登录(SSO)如此简单

阿里巴巴云原生

阿里云 云原生 Higress

三分钟全面了解低代码,两小时实现应用系统搭建

EquatorCoco

低代码 系统搭建

中国传媒业人工智能应用发展图谱2024

易观分析

人工智能’

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里巴巴云原生

阿里云 云原生 通义灵码

IPQ5332: Power Efficiency with 320 MHz Channel Width

wallyslilly

IPQ5332

双良集团:打造智能制造数字化管控平台,实现精细化管理

用友BIP

LLM应用实战: 产业治理多标签分类

不在线第一只蜗牛

LLM

电商数据抓取新技能:京东商品详情API返回值分析

技术冰糖葫芦

api 网关 API Explorer API 策略 pinduoduo API

易观分析:2024年第2季度中国电商直播市场交易规模达10604亿元 退货问题折射行业转型急迫性

易观分析

电商直播

AI+制造:助力制造企业转型升级

用友BIP

奖项再+1!通义灵码智能编码助手通过可信 AI 智能编码工具评估,获当前最高等级

阿里云云效

阿里云 云原生 通义灵码

数据可视化伙伴:天谋科技与图扑物联完成兼容性互认证

Apache IoTDB

自增主键去哪了?---一次开发过程中的思考

京东零售技术

后端 自增主键

揭秘丨主数据管理的创新蜕变

用友BIP

2024 天池云原生编程挑战赛决赛名单公布,9 月 20 日开启终极答辩

阿里云云效

阿里云 云原生

功能发布-自定义SQL查询

ClkLog

sql 开源 自定义标签

【YashanDB知识库】修改字段长度后,jdbc驱动接口报YAS-04007 Message:result set metadata changed异常

YashanDB

yashandb 崖山数据库

奇绩创坛 2025 春季创业营开始报名

奇绩创坛

奇绩创坛 奇绩创坛创业营

资源有限?如何低成本开发体育直播平台,吸引用户并持续互动!

软件开发-梦幻运营部

【YashanDB知识库】表数据量不多,lob数据段有大量空间,插入数据报错

YashanDB

yashandb 崖山数据库

面壁智能小钢炮重磅升级 MiniCPM3-4B 开源;字节跳动 Loopy,音频驱动的 AI 视频生成技术丨 RTE 开发者日报

声网

BAT都有哪些AIOps的经典案例?_DevOps & 平台工程_辛未・李_InfoQ精选文章