写点什么

DataOps - 数据驱动的智能运维

2019 年 8 月 29 日

DataOps - 数据驱动的智能运维

阿里巴巴大数据运维团队经过几年运维数据中台的建设,在数据化运维(DataOps)方向的前沿问题上积累了很多实践经验。本次分享将结合具体实践案例,阐述如何通过数据实体服务,基于机器学习、运筹优化、自然语言处理和统计分析构造的智能分析服务,以及运维中间件服务,解决运维领域面临的稳定性、成本、效率三大基本问题。阿里巴巴高级算法工程师张颖莹即将在 QCon 全球软件开发大会(上海站)2019分享《DataOps - 数据驱动的智能运维


具体包括:


(1)基于异常检测和日志聚类结果构建图模型进行根因推断,并利用自愈体系形成集群诊断完整闭环以保障稳定性;


(2)通过构建大规模整数规划模型优化应用在集群间的排布,通过短期精准预测对公共云用户资源进行动态分配,从宏观微观两个角度阐述成本的优化方法;


(3)利用报错日志打造智能答疑来提升运维人员效率,利用机器学习模型提升用户数据同步任务的效率,并结合案例介绍效率与成本之间权衡的思想。通过本次演讲,相信无论是运维人员还是算法工程师,都可以从阿里在智能运维领域积累的宝贵经验中获得启发,深入理解 AI 算法如何基于数据中台能力在真实的运维场景中落地。


内容大纲

1、阿里巴巴大数据运维背景


2、智能运维保障稳定性实践


2.1 基于黄金指标的异常发现


2.2 基于自然语言处理的日志挖掘


2.3 基于图模型的根因推断


2.4 利用感知/决策/执行形成集群诊断闭环


3、智能运维优化成本实践


3.1 宏观——跨集群应用排布优化


3.2 微观——公共云资源动态分配


4、智能运维提升效率实践


4.1 运维人员提效——基于报错日志的智能答疑


4.2 用户提效——数据同步任务速率优化


4.3 效率与成本的权衡——跨集群复制的策略选择


5、数据中台建设思路


5.1 数据实体服务


5.2 智能分析服务


5.3 运维中间件服务


听众收益

1、了解阿里巴巴大数据运维场景下的智能运维完整思路与丰富实践案例,为企业级智能运维提供借鉴;


2、如何基于异常检测、日志聚类、根因分析等通用能力,利用自愈体系打造完整的集群诊断闭环;


3、如何从宏微观两个角度进行成本优化;


4、如何帮助用户和运维人员提升效率;


5、数据中台建设的经验和总结。


嘉宾介绍


张颖莹,花名丛戎。 阿里巴巴高级算法工程师。毕业于上海财经大学,研究领域包括运筹优化、数据挖掘和统计分析,研究成果发表于 SSCI 和国内核心期刊并被引用多次。2016 年加入阿里巴巴大数据基础工程技术团队,致力于数据化智能运维的探索和实践。曾主导或参与了阿里巴巴公共云计算资源分配优化、通用计算平台大规模集群的应用排布优化等项目,帮助团队在多个智能运维场景落地。目前的方向是运维领域的异常检测、日志聚类和根因分析等通用分析能力构筑以及特定场景的运筹优化。


更多智能运维的相关分享请访问 QCon 上海 2019 官网。


2019 年 8 月 29 日 12:152265

评论

发布
暂无评论
发现更多内容

MySQL性能优化(七):MySQL执行计划,真的很重要,来一起学习吧

xcbeyond

MySQL MySQL性能优化 执行计划

课程总结

Thrine

指数 | 2020年6月北京BGP机房网络质量评测报告

博睿数据

评测 博睿宏远 指数

HashMap学习总结

大刘

hashmap hash

路过,凌晨2点的南京

小天同学

总结 思考 个人感悟 夜归人

博睿宏远获颁“2020开发与技术企业服务奖”

博睿数据

运维自动化 开发工具 博睿宏远

MySQL 连接查询超全详解

X先生

MySQL 数据库

SaaS是「包治百病」的良药吗?

ToB行业头条

天元MegEngine深度学习框架贡献者计划全面启动!

flashrunrun

人工智能 学习 AI 开源项目

你与30W奖金只差一个 Apache Flink 极客挑战赛的报名

Apache Flink

flink

第6周总结

andy

架构师训练营第六周作业

一剑

开源数据交换(client)

李孟

Java 大数据 flink spark 数据交换

互联网大厂根本没有题库!了解这些却能让你掌握“隐形题库”

互联网架构师小马

程序员 面试 面试题 Java 面试 找工作

CAP Theorem

dongge

MySQL 三万字精华总结 + 面试100 问,和面试官扯皮绰绰有余(收藏系列)

海星

Java MySQL 面试

如何在 3 个小时内完成一周的工作

escray

没错,用三方 Github 做授权登录就是这么简单!(OAuth2.0实战)

程序员内点事

Java GitHub oauth2.0

第6周作业

andy

MySQL性能优化(六):常见优化SQL的技巧

xcbeyond

MySQL MySQL性能优化 SQL优化 优化技巧

案例解析丨金蝶K/3 Wise接入华为云RDS数据库SQL Server

华为云开发者社区

MySQL 数据库 Serverless 数据 华为云

JDK1.8新特性(一):JDK1.8究竟有哪些新特性呢

xcbeyond

jdk8 新特性

数据结构学习心得

程李文华

分布式存储系统doris

Thrine

java 后端博客系统文章系统——No5

猿灯塔

Java

第6周课后练习-请简述CAP原理

Dawn

极客大学架构师训练营

未来的智慧城市:未来的城市生活愿景

网站,小程序,APP开发定制

再强调一遍, 我为什么不建议大家接外包干私活?

非著名程序员

程序员 外包 提升认知 程序员成长 接私活

Spring循环依赖及解决方式

张sir

Java spring 循环依赖

现在微服务这么火,你还不了解吗?阿里P8推荐的微服务学习指南

互联网架构师小马

Docker 微服务 Spring Cloud Spring Boot dubbo

详解区块链应用市场与落地应用现状

CECBC区块链专委会

演讲经验交流会|ArchSummit 上海站

演讲经验交流会|ArchSummit 上海站

DataOps - 数据驱动的智能运维-InfoQ