写点什么

构建未来智能体,微软宋恺涛揭秘 JARVIS 系统及其在 AI 领域的应用前景

宋恺涛

  • 2024-08-14
    北京
  • 本文字数:2215 字

    阅读完需:约 7 分钟

构建未来智能体,微软宋恺涛揭秘 JARVIS 系统及其在AI领域的应用前景

AI Agent 是一种先进的智能实体,它由人工智能技术驱动,能够自主感知环境、做出决策,并执行相应的动作。这些智能代理具备自主性,能够独立运行而无需人类直接干预;它们具有强大的感知能力,通过传感器或输入模块来捕捉周围环境的信息。基于这些信息和预定义的目标,AI Agent 能够进行合理的决策,并采取行动以实现这些目标。此外,它们还拥有记忆、规划和使用工具的能力,这使得它们能够适应复杂环境并完成复杂的任务。


在 8 月 18 日 -19 日 AICon 上海站,我们策划了【AI Agent 技术突破与应用】论坛,并且也荣幸邀请到了微软亚洲研究院高级研究员宋恺涛,他将发表《The Future is Here, A Deep Dive into Autonomous Agent》的演讲,通过他的分享你可以到了解构建智能体中需要考虑的组件,以及了解当下的智能体构建存在的问题。



本文为宋恺涛会前采访文。宋恺涛提到 JARVIS 系统是一个基于大型语言模型的智能调度工具,它能够与多个专家 AI 模型合作,处理各种复杂任务。尽管它还处于早期阶段,但已经在多模态处理和工具使用方面展现出潜力。面对扩展功能时的挑战,JARVIS 采用分层结构来优化模型调度。未来,JARVIS 将继续发展,目标是构建更强大的单体和多智能体系统,并可能建立一个智能体应用库。


以下为采访正文:

InfoQ:能否简单说明 JARVIS 系统的基本功能和工作原理?


宋恺涛:JARVIS 系统的核心,是以大模型为基础,将其作为一个管理的神经中枢,通过引入任务规划,选择机制等模块来实现对各种细分的专家模型的调度。这里面我们会选择像 Hugging Face 这样的机器学习社区来提供专家模型。相比于现在的智能体,首先 JARVIS 是一个非常早期的工作,属于一个早期的智能体架构。现在的工作,可能更加完善,包括现在会引入多智能体机制还有更加细微的提示词设计以及记忆机制等等。但可以这么说,JARVIS 应该是一个初步展现智能体雏形的工作。

InfoQ:JARVIS 系统中的 LLM 如何与多个 AI 专家模型进行协作?


宋恺涛:J 这个也是我们当时对大模型的一种观察。从 2022 年底 ChatGPT 诞生以来,我们也在观察大模型本身的语言能力到底有多强,如果其语言能力足够强的话,就应该能够像人类一样去掌握语言的能力。因此,如果我们能够提供 LLM,这些 AI 专家模型如何使用,那么,大模型就应当具备去调度,协作和使用它的能力。因此,我们将 AI 模型的描述作为 prompt 提供给 LLM,来告诉大模型,在什么任务情况下需要使用到它。同事还要求其能够做任务分解,判断各个任务之间依赖性。使其剧本对 AI 专家模型的协作调度能力。

InfoQ:这种协作模型的具体流程是怎么样?


宋恺涛: 具体而言,我们首先利用大预言模型进行任务规划的能力,最用户的需求进行任务分析和子任务分解,来得到子任务序列以及子任务之间的相互依赖。然后,基于我们得到的任务序列,我们会采用一种模型选择机制,来选择最适合的模型解决对应的子任务。最终我们会执行和调度这些模型来生成最终的模型输出。

InfoQ:不同 AI 模型之间的协同工作机制如何影响整体系统的性能


宋恺涛: 我觉得核心难度会有这么几点:1)如果我们希望系统的功能越强大,就可能需要我们调度更多的模型。这样一来,如果这些模型是用 prompt 的形式来构建的话,就会对 context 的长度带来很多的消耗;2)如何正确地规划各个任务序列,也是一个非常大的挑战。如果预测了错误的任务序列,那么也会对系统的后续生成产生影响,如何及时地修正和改进会非常正要。

InfoQ:JARVIS 在哪些领域或者场景得到应用


宋恺涛: 其实作为调度工具为代表的智能体,他在很多需要丰富智能体功能的地方上都会需要到。以开源机器学习社区(Hugging Face,国内比如 Modelscope)为代表,那么我们可以通过构建对不同模型的调度,产生一个能够处理语言,语音,图像,视觉等不同模态的智能体。除此以外,包括使用像天气预报,数学计算等一系列工具的方式,都能够构建更强的智能体。因此,当我们需要扩展语言模型的任务范围时,JARVIS 这样的智能体就会有很大的应用场景。

InfoQ:在这些应用场景中,JARVIS 系统遇到过哪些问题,又是如何解决这些问题的


宋恺涛: 其实这些问题和我们上述的机制时有关,那就是当我们想要构建更强大的智能体时,就不得不引入更多的专家模型或者说叫工具。而当我们需要 Scale Up 这些工具时,就会对模型产生很大的负担。所以如何调度海量工具,会是一个非常大的调整。从目前来说,我们会采用分层结构的,也就是将工具表示成树形结构来进行分配调度。

InfoQ:您觉得智能体未来的发展方向会是什么?


宋恺涛: 我觉得有这么几点:1)如何构建强大的单体智能体;2)在单体智能体的基础上,构建多智能体;3)能否针对智能体,去构建其对应的社区库,就像 App Store 一样。这些都很关键。

InfoQ:是否方便为我们介绍下您即将分享的 Agent 落地和 JARVIS 的关系?


宋恺涛: 其实整体来时,我还是会围绕 JARVIS / HuggingGPT 为主来展开。我可能也会目前智能体的扩展研究,来讨论,包括从 efficiency,self-improvement,评估这些角度来展开讨论,如何更好更鲁棒地构建可信任可靠的智能体。

嘉宾介绍:


宋恺涛,微软亚洲研究院高级研究员,博士毕业于南京理工大学。其研究方向为自然语言处理,大语言模型,AI 智能体。其发表了超过 40 篇国际学术会议论文和期刊,包括 NeurIPS,ICML,ICLR,ICCV,ACL,EMNLP,KDD,AAAI,IJCAI 等,同时担任多个学术会议和期刊的审稿人。其代表作包括 HuggingGPT 等智能体研究以及 MASS,MPNet 等基础模型训练。


2024-08-14 19:007115

评论

发布
暂无评论
发现更多内容

对于移动开发,人工智能的到来意味着什么?

故胤道长

人工智能 机器学习 ios开发 Android开发

数据库周刊62丨央企2021年数据库成交公告,国产占90%;流数据库HStreamDB开源;MySQL主从双写导致数据丢失;Oracle 19c升级最佳实践;PG日常工作分享;MySQL MGR运维指南;SQL语法手册……

墨天轮

MySQL 数据库 sql postgre

【Doris Weekly】2020.03.08~2021.03.21

ApacheDoris

【Doris Weekly】

java好还是嵌入式好?做IT开发该如何选择

cdhqyj

Java 编程 发展 开发 嵌入式

基于感染原理判断图的连通性算法

大奎

图算法 子图 连通性

精选2021互联网大厂Java核心面试题库(金三银四面试必备)

比伯

Java 编程 架构 面试 程序人生

安卓最全面试考点与面试技巧,大厂直通车!

欢喜学安卓

android 程序员 面试 移动开发

智能家居操作系统谁最强?海尔智家独有“智家大脑”行业最领先

DT极客

墨天轮精选:数据库问答集萃第一期-2021

墨天轮

MySQL 数据库 sql dba

力扣(LeetCode)刷题,简单题(第15期)

不脱发的程序猿

LeetCode 编程之路 28天写作 算法面经 3月日更

【活动回顾】5G时代的直播,将带来哪些低延迟体验

ZEGO即构

数据产品经理实战-由BI到业务洞察

第519区

大数据 数据产品 数据分析体系

一套亿级用户的IM架构技术干货(下篇):可靠性、有序性、弱网优化等

JackJiang

【遇见Doris】基于Apache Doris的小米增长分析平台实践

ApacheDoris

Flink架构体系

大数据技术指南

大数据 flink 28天写作 3月日更

最全面试考点与面试技巧,面试必问

欢喜学安卓

android 程序员 面试 移动开发

最全模型效果评估报告上线,百度EasyDL助力模型效果快速优化

百度大脑

飞桨 EasyDL

致远互联低代码平台让项目管理“秒变”数字化

爱极客侠

揭秘盒马鲜生,如何打破收益增长天花板!

博文视点Broadview

问题排查 | 客户端突如其来的“白屏”等待

蚂蚁集团移动开发平台 mPaaS

html5 移动开发 mPaaS 离线包

【疑难杂症】关于Github私有库问题

Sher10ck

GitHub pycharm

EGG公链强势来袭!去中心化社交革命先驱EFTalk

币圈那点事

终于有阿里高工把SpringBoot+SpringCloud+Docker+MQ整合在一起了

Java架构追梦

Java 架构 微服务 springboot SpringCloud

启动延时缩短 50%-80%,函数计算发布镜像加速功能

阿里巴巴云原生

Docker 容器 开发者 云原生 存储

入选Gartner全球AI报告,阿里云解读AI工程化的三大基础能力

阿里云大数据AI技术

机器学习 AI Gartner

如何优化管理,打造高效的技术团队?

有只小耳朵

团队管理 技术管理 数字化转型

Cobar SQL审计的设计与实现

捉虫大师

Disruptor Skywalking cobar 数据库中间件

Spark常见的故障排除

五分钟学大数据

大数据 spark 28天写作 3月日更

Fluid 0.5 版本发布:开启数据集缓存在线弹性扩缩容之路

阿里巴巴云原生

容器 云原生 k8s 分布式数据库 调度

力扣(LeetCode)刷题,简单题(第16期)

不脱发的程序猿

面试 LeetCode 28天写作 算法面经 3月日更

加入即可服务1.83亿个家!海尔智家让开发者面向亿万家庭

DT极客

构建未来智能体,微软宋恺涛揭秘 JARVIS 系统及其在AI领域的应用前景_AI&大模型_InfoQ精选文章