写点什么

微软推出 Magentic-One,一个通用的多智能体代理系统

作者:Daniel Dominguez

  • 2024-12-24
    北京
  • 本文字数:1286 字

    阅读完需:约 4 分钟

微软推出 Magentic-One,一个通用的多智能体代理系统

微软宣布推出 Magentic-One,这是一个新的通用多智能体代理系统,旨在处理涉及 Web 和基于文件环境的开放式任务。该系统旨在协助处理跨不同领域的复杂、多步骤任务,以提高软件开发、数据分析和网页导航等活动的效率。


Magentic-One 采用由协调器(Orchestrator)智能体代理领导的多智能体代理架构,协调四个专门的智能体代理:WebSurfer,处理基于浏览器的任务,如导航网站和与在线内容交互;FileSurfer,管理与文件相关的操作,包括读取文档和导航目录;Coder,编写和分析代码以创建解决方案;以及 ComputerTerminal,运行代码并执行系统级操作。


该系统采用模块化设计原则,使智能体代理能够独立运行并适应新任务,而无需对系统进行重大的更改。Magentic-One 基于 Microsoft AutoGen(一个用于开发多智能体代理系统的开源框架)构建,与模型无关,并且与包括 GPT-4o 在内的不同大语言模型(LLM)兼容。


Magentic-One 使用 AutoGenBench(一种用于智能体代理系统评估的工具)在 GAIA、AssistantBench 和 WebArena 等基准上进行了测试。结果显示,与其他最先进的解决方案相比,该系统的准确性具有相当的竞争力,证明了该系统管理复杂工作流程方面的能力。


微软强调了与智能体代理系统相关的潜在风险,例如意外操作和系统滥用。在开发过程中,发现了诸如重复登录失败和尝试寻求外部人工协助等情况。为了降低此类风险,该系统包括了安全部署指南、红队演习和人工监督建议。


Magentic-One 的发布引发了人工智能社区的兴趣。大语言模型(LLM)专家 Elvis Saravia 在 X 上评论道:


虽然现在还为时尚早,但这种建立通用智能体代理系统的新趋势值得关注。此外,其他当前基于 LLM 的应用程序,如 RAG,也将受益于这种建立在多个专用智能体代理之上的系统。


而用户 Alexian_Theory 在 reddit 上分享道:


网页浏览的方法很有趣。它会对正在运行的无头浏览器进行快照,将图像传递给支持视觉的 LLM,然后决定下一步应该如何进行以完成任务。


Magentic-One 及其评估工具 AutoGenBench 的代码现已作为开源资源提供。微软鼓励与研究人员和开发人员合作,改进智能体代理人工智能系统,重点关注安全性、操作的可逆性,并最大限度地降低实际应用中的风险。相关的技术细节和实现资源,请参阅官方文档和 GitHub 存储库。


多智能体代理编排系统的开发正成为整个人工智能行业的核心焦点。几家大型的公司都在通过自己的方法来编排专业的智能体代理,为这一趋势做出贡献。AWS 推出了 Multi-Agent Orchestrator,IBM 正在开发 Bee Agent,OpenAI 开发了 Swarm。这些系统中的每一个都旨在编排多个智能体代理,以有效地解决复杂的多步骤任务,这表明人们越来越重视模块化和协作式人工智能架构。

作者介绍


Daniel Dominguez 是 AWS 合作伙伴网络公司 SamXLabs 的执行合伙人。他在初创公司和财富 500 强公司的软件产品开发方面拥有超过 12 年的经验。Daniel 拥有华盛顿大学的机器学习专业学位。他热衷于利用人工智能和云计算来创建创新的解决方案。作为机器学习领域的 AWS 社区建设者,Daniel 致力于分享知识并推动软件产品的创新。


查看原文链接:

https://www.infoq.com/news/2024/11/microsoft-magentic-one/

2024-12-24 09:175947

评论 1 条评论

发布
用户头像
这是infoq.com上11月份的一篇文章
2024-12-24 09:43 · 北京
回复
没有更多了
发现更多内容

Java面试项目推荐,15个项目吃透两个offer拿到手软

冉然学Java

offer java; 技术栈 MAll java项目实战分享

国产数据库的红利还能“吃”多久?

墨天轮

数据库 国产数据库

华为云分布式缓存服务Redis开通及使用规划教程【华为云至简致远】

科技云未来

redis'

基于DevCloud进行黑白棋实时对战游戏开发实践【华为云至简致远】

科技怪咖

Beetl使用记录

Geek_163f36

华为云服务之弹性云服务器ECS的深度使用和云端实践【华为云至简致远】

科技云未来

弹性云服务器ECS

湖北钠斯网络数字藏品交易系统

开源直播系统源码

NFT 数字藏品

JavaScript 里三个点 ...,可不是省略号啊···

华为云开发者联盟

JavaScript 前端 运算符 函数

前端培训机构课程怎么样

小谷哥

开源一夏 | Spring事务传播机制

六月的雨在InfoQ

开源 Spring事务 8月月更

LED显示屏在会议室如何应用

Dylan

LED显示屏 led显示屏厂家

【有奖征文 第13期】至简致远,“云”响世界,大胆秀出你的华为云技术主张,高额激励等你拿

科技怪咖

阿里巴巴最新分享Spring Cloud核心笔记,全程实例讲解,通俗易懂

Java工程师

Java spring spring-cloud

有了这个开源工具后,我五点就下班了!

IT学习日记

EasyExcel 签约计划第三季 seaweedfs文件系统 java excel导出导入 java csv导出导入

2022年中国全民健身发展白皮书

易观分析

行业分析 健身

EMQ畅谈IoT数据基础软件开源版图,引领本土开源走向全球

EMQ映云科技

开源 物联网 IoT emq 8月月更

「Gitee篇」如何用Git平台账号登录建木CI

Jianmu

git 开源 DevOps 低代码 gitee

面向云时代的龙蜥操作系统 是 CentOS 替代的最佳选择

OpenAnolis小助手

龙蜥操作系统 开放原子全球开源峰会 OpenAnolis 分论坛 CentOS 停服 CentOS 迁移最佳选择

一文读懂字节跳动“埋点验证平台”

字节跳动数据平台

字节跳动 数据治理 埋点治理 数据研发 埋点验证

秋招冲刺版!奉上[Java一线大厂高岗面试题解析合集]

冉然学Java

面试 面试题 大厂 java; 秋招

携手数字创新 共筑国产生态 7月份AntDB与5款产品完成互认证

亚信AntDB数据库

AntDB 国产数据库 AISWare AIDB

原来如此!谷歌架构师10年呕心沥血汇成的《23种设计模式》,这才是正解

冉然学Java

架构 23种设计模式 java; 编程、

*打卡—>什么是云数据库&&沙箱实验如何用python和数据库来爬虫?【华为云至简致远】

科技云未来

云数据库

科创人·优锘科技COO孙岗:错误问题找不到正确答案,求索万物可视的大美未来

科创人

如何选择ui设计机构

小谷哥

干货:从零设计高并发架构

C++后台开发

高并发 架构师 C/C++后台开发 C/C++开发 高并发架构

带你玩转“超大杯”ECS特性及实验踩坑【华为云至简致远】

科技怪咖

写给 Java 程序员的前端 Promise 教程

CRMEB

腾讯云产品可观测最佳实践 (Function)

观测云

一起来学华为云数据库,RDS实践【华为云至简致远】

科技云未来

云数据库

10分钟快速入门RDS【华为云至简致远】

科技云未来

RDS

微软推出 Magentic-One,一个通用的多智能体代理系统_微软_InfoQ精选文章