QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

微软推出 Magentic-One,一个通用的多智能体代理系统

作者:Daniel Dominguez

  • 2024-12-24
    北京
  • 本文字数:1286 字

    阅读完需:约 4 分钟

微软推出 Magentic-One,一个通用的多智能体代理系统

微软宣布推出 Magentic-One,这是一个新的通用多智能体代理系统,旨在处理涉及 Web 和基于文件环境的开放式任务。该系统旨在协助处理跨不同领域的复杂、多步骤任务,以提高软件开发、数据分析和网页导航等活动的效率。


Magentic-One 采用由协调器(Orchestrator)智能体代理领导的多智能体代理架构,协调四个专门的智能体代理:WebSurfer,处理基于浏览器的任务,如导航网站和与在线内容交互;FileSurfer,管理与文件相关的操作,包括读取文档和导航目录;Coder,编写和分析代码以创建解决方案;以及 ComputerTerminal,运行代码并执行系统级操作。


该系统采用模块化设计原则,使智能体代理能够独立运行并适应新任务,而无需对系统进行重大的更改。Magentic-One 基于 Microsoft AutoGen(一个用于开发多智能体代理系统的开源框架)构建,与模型无关,并且与包括 GPT-4o 在内的不同大语言模型(LLM)兼容。


Magentic-One 使用 AutoGenBench(一种用于智能体代理系统评估的工具)在 GAIA、AssistantBench 和 WebArena 等基准上进行了测试。结果显示,与其他最先进的解决方案相比,该系统的准确性具有相当的竞争力,证明了该系统管理复杂工作流程方面的能力。


微软强调了与智能体代理系统相关的潜在风险,例如意外操作和系统滥用。在开发过程中,发现了诸如重复登录失败和尝试寻求外部人工协助等情况。为了降低此类风险,该系统包括了安全部署指南、红队演习和人工监督建议。


Magentic-One 的发布引发了人工智能社区的兴趣。大语言模型(LLM)专家 Elvis Saravia 在 X 上评论道:


虽然现在还为时尚早,但这种建立通用智能体代理系统的新趋势值得关注。此外,其他当前基于 LLM 的应用程序,如 RAG,也将受益于这种建立在多个专用智能体代理之上的系统。


而用户 Alexian_Theory 在 reddit 上分享道:


网页浏览的方法很有趣。它会对正在运行的无头浏览器进行快照,将图像传递给支持视觉的 LLM,然后决定下一步应该如何进行以完成任务。


Magentic-One 及其评估工具 AutoGenBench 的代码现已作为开源资源提供。微软鼓励与研究人员和开发人员合作,改进智能体代理人工智能系统,重点关注安全性、操作的可逆性,并最大限度地降低实际应用中的风险。相关的技术细节和实现资源,请参阅官方文档和 GitHub 存储库。


多智能体代理编排系统的开发正成为整个人工智能行业的核心焦点。几家大型的公司都在通过自己的方法来编排专业的智能体代理,为这一趋势做出贡献。AWS 推出了 Multi-Agent Orchestrator,IBM 正在开发 Bee Agent,OpenAI 开发了 Swarm。这些系统中的每一个都旨在编排多个智能体代理,以有效地解决复杂的多步骤任务,这表明人们越来越重视模块化和协作式人工智能架构。

作者介绍


Daniel Dominguez 是 AWS 合作伙伴网络公司 SamXLabs 的执行合伙人。他在初创公司和财富 500 强公司的软件产品开发方面拥有超过 12 年的经验。Daniel 拥有华盛顿大学的机器学习专业学位。他热衷于利用人工智能和云计算来创建创新的解决方案。作为机器学习领域的 AWS 社区建设者,Daniel 致力于分享知识并推动软件产品的创新。


查看原文链接:

https://www.infoq.com/news/2024/11/microsoft-magentic-one/

2024-12-24 09:175701

评论 1 条评论

发布
用户头像
这是infoq.com上11月份的一篇文章
2024-12-24 09:43 · 北京
回复
没有更多了
发现更多内容

冲突管理最佳实践

俞凡

管理 最佳实践 沟通

【行云流水线】满足你对工作流编排的一切幻想~skr

京东科技开发者

什么是爬虫,为什么爬虫会导致服务器负载跑满

德迅云安全杨德俊

DePIN:去中心化基础设施的新篇章

TechubNews

区块链 web3 DePIN

使用RFC跳过权限校验的方法

不在线第一只蜗牛

用户 abap 业务流程

安全可信|这朵政务云通过中央网信办云计算服务安全评估增强级认证!

天翼云开发者社区

云计算 安全 云服务

IPQ8072 and IPQ8074: The difference between enterprise-grade and consumer-grade routers

wallysSK

上升到人生法则的贝叶斯理论

小齐写代码

微信多开 WechatTweak for Mac(微信多开、消息防撤回工具)v3.8.6中文集成版

iMac小白

三掌柜的2023年国产AI体验之路

三掌柜

年终总结 2023 2023年 年度

D-Night桌研社北京首店12月30日正式开业,学生和新客特价2.5折起

科技热闻

1688商品列表数据接口(1688.item_search)丨1688API接口

tbapi

1688API接口 1688商品数据接口 1688商品列表数据接口 关键词搜索1688商品数据

国产化系统中遇到的视频花屏、卡顿以及延迟问题的记录与总结 | 主赛道

从数据洞察到市场变革:我们的 Web3 愿景

Footprint Analytics

区块链 #Web3

作为铭文跨链赛道龙头,SoBit 有何突出之处?

西柚子

利用全面预算管理,构建企业数智化管理体系

智达方通

数智化转型 全面预算管理

玩转云端| 多云时代,数据管理就该这么“库”!

天翼云开发者社区

数据库 云计算

TcpDump

虚实的星空

HTTP tcpdump

HyperDock for mac(Dock优化工具安装) v1.8.0.10永久激活版

mac

苹果mac Windows软件 HyperDock Dock优化软件

英特尔的2023:以强大执行力推进产品、技术创新

E科讯

以全面预算管理推进现代销售计划的建立

智达方通

全面预算管理 销售计划

安全可信丨业内领先!天翼云公有云管理平台通过密评!

天翼云开发者社区

云计算 公有云 云平台

Navicat Premium 15 for Mac(数据库开发工具)v15.0.36中文激活版

iMac小白

强大的跟踪和动画软件:Boris FX Mocha Pro 2023破解下载

胖墩儿不胖y

Mac软件 动画软件 Mac好用的软件推荐

基于图神经网络的动态物化视图管理

KaiwuDB

KaiwuDB 物化视图管理

Acrobat Pro DC 2023 for mac(专业PDF编辑软件)中文直装版

iMac小白

赛迪顾问发布最新中国大数据市场报告,腾讯云稳居领导者行列

腾讯云大数据

大数据

为什么美国服务器是业务国际化的首选?深入探讨其关键优势

一只扑棱蛾子

美国服务器

微软推出 Magentic-One,一个通用的多智能体代理系统_微软_InfoQ精选文章