QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

微软研究院开源 AIOpsLab:一个 AI 驱动的云运维框架

作者:Robert Krzaczyński

  • 2025-02-03
    北京
  • 本文字数:889 字

    阅读完需:约 3 分钟

微软研究院开源 AIOpsLab:一个 AI 驱动的云运维框架

微软研究院推出 AIOpsLab 开源框架,旨在推进云运维中 AI 智能体的开发和评估。该工具提供了一个标准化且可扩展的平台,应对复杂的云环境中所面临的故障诊断、事件缓解和系统可靠性等方面的挑战。


随着微服务和无服务器架构在企业 IT 中成为标准,其复杂性带来了新的运维挑战。停机可能会影响关键业务运营,这凸显了维护系统可用性工具的重要性。许多现有的解决方案依赖专有服务或临时的手段,可能缺乏灵活性和一致性。AIOpsLab 提供了一个标准化的框架来评估和增强不同云环境中的 AIOps 智能体,有效解决了这些问题。


AIOpsLab 引入了几个关键组件来实现其目标。该框架的核心是 Agent-Cloud Interface(ACI),它通过一个协调器将 AI 智能体与应用服务分离。这个协调器负责定义任务、验证操作,并与 API 交互执行问题解决策略。任务还通过动态工作负载和故障生成器得到进一步增强,能够模拟资源耗尽、级联故障等真实运维场景。



来源:微软博客


这一接口概念引发了社区的广泛关注。雀巢解决方案架构师 Marco Casula 分享了他的看法:


这是一个有趣的想法。我们也提倡使用一个协调层来处理用户和机器人之间的状态。同样,我十分赞同为所有智能体预定义接口的想法,这使得管理基础设施版本变得容易得多(我们称之为 GenAI 虚拟智能体规范)。我会进一步深入研究。我很想知道他们是如何处理领域外(out-of-domain)、主题外(out-of-topic)和所需操作等问题的。


AIOpsLab 支持包括事件检测、根本原因分析和缓解在内的一系列运维任务,既是一个基准测试工具,也是一个训练环境。研究人员可以利用它在可复现的条件下评估 AIOps 智能体的性能,同时利用其模块化设计将框架扩展到新的应用场景中。


AIOpsLab 还整合了 React、Autogen 和 TaskWeaver 等流行的智能体框架,让广泛的开发者社区更易于访问。其故障注入功能能够详细测试系统间的依赖关系,提高云服务的弹性。


此外,AIOpsLab 遵循微软的安全标准和负责任的 AI 原则。未来计划与生成式 AI 团队合作,将 AIOpsLab 纳入评估前沿模型的基准体系。


AIOpsLab 已在 GitHub 上开源,基于 MIT 许可。


原文链接


https://www.infoq.com/news/2025/01/microsoft-reasearch-aiopslab/


2025-02-03 14:0014629

评论

发布
暂无评论

用户红利终结,应用分发如何实现“全链路加速增长”?

最新动态

Spring-Mybatis整合

@下一站

程序设计 mybatis 12月日更 12月月更 springboot整合

绿色高效办公,华为云桌面不可或缺

爱科技的水月

设计企业如何降低设备成本?来试试华为云桌面吧!

爱科技的水月

软件设计中最关键的“开闭原则”,究竟指什么呢?

JAVA旭阳

架构 后端

Dubbo架构设计与源码解析(三)责任链模式

京东科技开发者

dubbo 过滤器 filter 责任链 provider

企业云上安全办公,就用华为云桌面

爱科技的水月

3ds Max云渲染平台哪个好?

Renderbus瑞云渲染农场

云渲染 3dsMax云渲染平台哪个好

贾斯特里尼&布鲁克斯葡萄酒,绿色酿酒传承百年

联营汇聚

提升游戏玩家体验,华为云CDN加速了解一下

秃头也爱科技

华为云大数据BI,赋能数字化企业加速发展

秃头也爱科技

Android基础入门教程

芯动大师

android Android开发

色彩精准、数据安全,华为云上的超高清设计师云工作站给你新体验

爱科技的水月

使用HTTP工作的Web服务器

穿过生命散发芬芳

web服务器 12月月更

想在“互联网信息高速公路”顺畅通行,华为云CDN来助力

秃头也爱科技

跨平台应用开发进阶(四十二)vue与nvue页面设计方案探究

No Silver Bullet

uni-app Vue 12月月更 nvue

Team Lead 的日常工作

QE_LAB

敏捷团队

库存积压营销差?不妨尝试华为云大数据BI

科技说

贾斯特里尼&布鲁克斯葡萄酒,贵族品质值得选择

联营汇聚

2022年了,苹果还不能长截图,华为的指关节截屏了解一下~

极客天地

2022-12-22:给定一个数字n,代表数组的长度, 给定一个数字m,代表数组每个位置都可以在1~m之间选择数字, 所有长度为n的数组中,最长递增子序列长度为3的数组,叫做达标数组。 返回达标数组的

福大大架构师每日一题

算法 rust 福大大

法国名酒贾斯特里尼&布鲁克斯,俘获皇室贵族的葡萄酒

联营汇聚

JavaScript基础:在Jupyter Notebook中操练

无人之路

JavaScript Jupyter Notebook

极速畅享网络体验,华为云CDN加速一通到底

秃头也爱科技

华为云大数据BI,助力企业挖掘信息数据潜在价值

科技说

实测 | 海纳百川,华为OceanStor Pacific分布式存储为多元算力应用带来更优选择

脑极体

跨平台应用开发进阶(三十八)uni-app前端监控方案:基调听云APP探究

No Silver Bullet

uni-app 前端监控 12月月更 基调听云APP

JavaScript进阶(十三)JavaScript 空值合并运算符、可选链操作符、空值赋值运算符讲解

No Silver Bullet

JavaScript 12月月更 空值合并运算符 可选链操作符 空值赋值运算符讲解

【Go实现】实践GoF的23种设计模式:命令模式

元闰子

Go 设计模式 命令模式

阿里灵杰:与开发者一起推动AI创新落地

阿里云大数据AI技术

人工智能 阿里云 开发者 AI技术

微软研究院开源 AIOpsLab:一个 AI 驱动的云运维框架_框架_InfoQ精选文章