写点什么

LLM 和多 Agent 在运维领域的落地经验|QCon

邓艳琴

  • 2024-02-23
    北京
  • 本文字数:2567 字

    阅读完需:约 8 分钟

大小:1.30M时长:07:33
LLM 和多 Agent 在运维领域的落地经验|QCon

在数字化时代,企业和组织的 IT 系统变得越来越复杂,运维工作也变得越来越繁琐和困难。为了解决这些问题,AIOps 智能运维技术应运而生,而大模型的出现,为 AIOps 更强大的计算、决策与自学能力,极大地提升了 IT 运营的自动化和效率。在大模型的加持下,新时代的智能运维方案具有以下优点:

  • 学习与适应:大模型能从数据中学习并适应环境变化,及时识别并调整模型以应对 IT 运营数据中的微妙变动。

  • 预测性分析:通过对历史数据的深度分析,大模型能够预测未来 IT 运营趋势,提前预警潜在系统故障。

  • 自然语言处理:大模型能够理解人类语言,实现自然高效的互动,如解读用户对系统性能问题的反馈,并推测可能原因。

  • 自动决策:面对复杂的 IT 问题时,大模型能够综合考量多个变量,计算最佳解决方案并实时执行,实现问题自动解决。

  • 端到端自动化:大模型可实现从问题发现到解决方案确定再到实施的全流程自动化,从而提升生产力并减少人工干预需求。

  • 异常检测:通过深入分析历史趋势和性能指标,大模型能敏锐捕捉到不易被人类察觉的异常现象。


华为在 LLM 和 Multi-agent 在运维领域的实验探索有了不错的经验,即将与 4 月 11-13 日举办的 QCon 全球软件开发大会暨智能软件开发生态展邀请到华为集团 IT 平台服务部算法科学家张曦博士前来分享。她是犹他州立大学统计学博士,研究方向为 AI for Data、AI for BI、AIOps,时间序列分析等;具有丰富的人工智能在企业场景落地应用的成功经验,应用场景覆盖营、销、服、供、采、制、研发等多领域,支撑华为集团 600+ 业务应用 +AI,带领团队成功攻克 5+ 企业技术难题,并主导发布多个 AI 服务。


她将从智能运维面临的挑战和痛点出发,介绍在企业运维领域应用 AIGC 的实践案例,提出以 LLM 为中心,基于多 Agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。



该方案亮点突出,可实现多 Agent 协同完成运维主流程,异常检测->根因定位->故障分析->修复建议,且框架与算法不依赖具体特定应用场景,结合大模型实现较强的泛化能力


并且,如果你也对运维领域如何有效抑制大模型幻觉,提升问题处理的准确率,如何将传统运维积累和沉淀的海量知识快速激活,结合大模型相关能力有效解决运维问题等相关话题感兴趣,欢迎听取张曦博士的分享。


围绕着“效能”,本届大会策划了多个相关分论坛,邀请了多位业界知名大咖前来交流。


柯旻,「智能运维大模型」分论坛出品人,字节跳动基础架构 SRE 负责人,负责整体字节跳动基础架构全球相关基础组件产品的稳定性、成本优化、运维产品开发、智能运维等相关工作。


王宁,「智能运维大模型」分论坛演讲嘉宾,北京大学统计硕士,字节跳动基础架构 SRE 数据化方向技术专家,关注稳定性,成本与效率。在智能运维 aiops 和机器学习领域有多年工作经验,包括异常检测,根因定位,大语言模型等。在去年的 Aiops 智能运维挑战赛 2023 上,以“SRE-Copliot:基于大语言模型的智能运维架构”方案获得冠军,在本次会议中,他将介绍最新的实践经验。


陈鑫(神秀),「下一代生产力工具」分论坛出品人 &演讲嘉宾,阿里云云效、通义灵码产品技术负责人,致力于企业研发效率、产品质量、DevOps 方向研究和探索。2011 年加入阿里,带领过大数据测试团队、测试工具研发团队、研发平台团队。对研发协同、测试、交付、运维领域都有很深的见解。目前正在带领团队向云原生、极致效率、智能化等领域进行持续演进。


吴玮琦,「下一代生产力工具」分论坛演讲嘉宾,百度工程效能部高级研发工程师 负责智能代码助手 Comate 客户端、云开发平台 iCoding 等代码服务研发工作,参与文心一言代码相关能力数据建设。他将分享的题目是《智能研发经验及 Comate 开放平台》。


茹炳晟,「效能工程新时代」分论坛出品人,腾讯 Tech Lead,腾讯研究院特约研究员,中国计算机学会 (CCF)TF 研发效能 SIG 主席,中国通信标准化协会 TC608 云计算标准和开源推进委员会云上软件工程工作组副组长,“软件研发效能度量规范“标准核心编写专家,中国商业联合会互联网应用技术委员会智库专家,多本技术畅销书作者,著作有《测试工程师全栈技术进阶与实践》《软件研发效能提升之美》《多模态大模型技术原理与实战》《高效自动化测试平台: 设计与开发实战》《软件研发效能提升实践》和《软件研发效能权威指南》等,译作有《持续架构实践》和《现代软件工程》等。公众号“茹炳晟聊软件研发”主理人。


张宇辰,「效能工程新时代」分论坛演讲嘉宾,毕业于上海交通大学,毕业后一直在互联网研发领域工作。曾经在网易有道任职,自 2012 年开始在猿辅导,担任过前端工程师、服务端工程师、业务研发经理、基础架构负责人等多种不同职能角色。对于前后端软件开发、技术管理有着丰富经验。他将分享《If It Hurts, Do It More Often ——Motiff 的主干开发实践》。


唐辉,「效能工程新时代」分论坛演讲嘉宾,百度资深工程师,2017 年加入百度,2019 年带领 10+ 同学从 0 到 1 建设云上百度,完成统一账户权限、统一 Console、预算管理、透明账单等混合云能力建设,达成公司三年上云的战略目标。2023 年随着大模型的发展,开始负责 DevOps 产品的智能化建设,目前百度内周渗透用户超过 60%。此外,在微前端、性能优化、体验优化、To B 多版本管理等方向有深入探索和落地。他将分享《大模型赋能 DevOps,研发全环节提速》。


朱宏宝,「效能工程新时代」分论坛演讲嘉宾,字节跳动客户端测试技术专家,十余年软件测试与技术管理工作经验,有服务端、移动端业务测试,近几年主要从事效能平台工具开发,负责过多个公司级效能平台从 0-1 建设。曾就职于贝壳找房、滴滴出行、京东等公司。目前就职于字节跳动,负责移动端智能化测试建设。他将分享《字节移动端智能化测试实践》。


【活动推荐】

 为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。


会议现已进入 8 折早鸟购票阶段,错失 7 折特惠的朋友们,可以联系票务经理 17310043226 。点击此处了解大会更多详情,期待与各位开发者现场交流。

2024-02-23 17:558989

评论 1 条评论

发布
用户头像
在讨论LLM和多Agent在运维领域的实践时, 我们很容易忽视了一点:技术的进步和运用并非一蹴而就。从历史的角度来看,人工智能的发展正像莱布尼茨概念记号的提出,初始不被理解,却为后来逻辑编程奠定基石。运维领域利用AI来提高效率和预测性维护,本是技术发展过程中自然而然的进步。而大模型的运用更是提出了新的解决方案。如同任何技术革新,其真正价值和潜能往往需要时间来验证并优化。
2024-02-27 10:50 · 北京
回复
没有更多了
发现更多内容

学习哪门编程语言好,我来回答

实力程序员

Rust从0到1-Cargo-自定义命令

rust cargo 自定义命令 Custom Commands

关于深度学习编译器,这些知识你需要了解一下

华为云开发者联盟

深度学习 tensorflow 编译器 算子开发 深度学习编译器

写代码是意识流?

卢卡多多

代码规范 意识 7月日更

斗宠大陆APP开发|斗宠大陆软件系统开发

5分钟带你了解微前端(内含大量代码示例)

LigaAI

大前端 qiankun

开发小技巧之:unicode的排序和正则匹配

程序那些事

Unicode 排序 程序那些事

Redisson 分布式锁源码 04:可重入锁释放

程序员小航

Java redis 分布式锁 redisson redisson 分布式锁

IPFS公司有哪些?IPFS 哪家公司好?

多链星球APP开发|多链星球系统软件开发

BVD比特视频APP系统开发搭建

2022前端面试必备题+答案

buchila11

Google 宣布 Android APK 退位对鸿蒙意味着什么?|【话题讨论】

老猿Python

android 鸿蒙 Google AAB格式

电脑误删文件如何恢复?两个方法解决你的困扰

淋雨

EasyRecovery 文件恢复 硬盘数据恢复

骆驼币挖矿软件开发|骆驼币挖矿APP系统开发

在线HTTP请求/响应头转JSON工具

入门小站

工具

Apache Flink 入门知识超全概括!

云祁

大数据 flink 7月日更

【Flutter 专题】95 图解 Dart 单线程实现异步处理之 Task Queue

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 7月日更

阿凡达挖矿软件开发|阿凡达挖矿APP系统开发

徒步运动系统开发|徒步运动软件APP开发

java算法易筋经:常见java-API使用技巧

华为云开发者联盟

Java List 数组 队列 java-API

带你用VUE实现上传图片效果

华为云开发者联盟

CSS html Vue js 标签

包租婆软件开发|包租婆系统APP开发

微服务错误码设计实践

循环智能

微服务 gRPC 异常处理 错误码 接口设计

Rust从0到1-Cargo-Workspaces

rust cargo workspaces

架构实战营 - 模块1 - 微信架构及学生管理系统毕设架构

雪中亮

架构实战营 #架构实战营

BTCs挖矿软件开发|BTCs挖矿系统APP开发

程序员跳槽指南

孙叫兽

程序员 跳槽 攻略

【LeetCode】点菜展示表Java题解

Albert

算法 LeetCode 7月日更

敏捷项目管理会不会代替传统项目管理?

万事ONES

项目管理 ONES 敏捷管理

架构实战营 作业 模块一

脉醉

#架构实战营

LLM 和多 Agent 在运维领域的落地经验|QCon_研发效能_InfoQ精选文章