写点什么

智谱 AutoGLM 部门负责人刘潇确认出席 QCon 北京,分享大模型自主智能体发展

  • 2025-03-21
    北京
  • 本文字数:1513 字

    阅读完需:约 5 分钟

智谱 AutoGLM 部门负责人刘潇确认出席 QCon 北京,分享大模型自主智能体发展

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,大会以 “智能融合,引领未来” 为主题,将汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。


智谱 AutoGLM 部门负责人刘潇已确认出席,并发表题为《大模型自主智能体的发展:以 Phone Use 和 Computer Use 智能体为例》的主题演讲。大语言模型不仅展现了强大的语言理解和生成能力,也展现了一定的推理能力和作为自主智能体的潜力。刘潇在本次演讲中将介绍从 GPT-3 开始,大语言自主智能体的概念和发展的 3 个阶段,重点介绍第 3 阶段,即当前正在发展中的基于 GUI 和推理模型的大模型自主智能体。


相比此前的对话智能体和基于 Workflow 的智能体,自主智能体将实现通用的智能代理能力,走出场景特化的局限性。本次演讲将重点介绍 Phone Use 和 Computer Use 自主智能体的发展情况,比较这些方案的优劣,以及在实际例子上的表现,并且探讨接下来的大模型自主智能体发展的方向。



刘潇在智谱担任研究员,主要研究方向为基础模型和基础智能体的算法和应用,以第一作者或共一发表人工智能方向 A 类论文达 10 篇,主要工作包括预训练模型提示学习中 P-Tuning 系列工作,开源的千亿双语语言模型 GLM-130B,ChatGLM 系列模型,和 Phone Use & Browser Use 自主大模型基础智能体 AutoGLM。曾获 WWW 2022 最佳论文提名奖,个人谷歌学术引用一万余次。本次会议中,他的详细演讲内容如下:


演讲大纲:

1. 引言

  • 大语言模型的崛起与能力背景

  • 自主智能体的定义与重要性

2. 大语言自主智能体的发展历程

  • 大模型智能体的第一/二阶段:


  • 基于非自主工具调用的大模型智能体

  • 基于系统提示和 Workflow 工具调用的大模型智能体(GPTs)

  • 系统提示与 Workflow 工具调用的原理

  • 实际应用案例与效果展示

  • 基于 GUI 和推理模型的大模型自主智能体(发展中)

  • 最新进展与技术亮点

  • GUI 和推理模型的集成方式

  • 当前阶段的挑战与解决方案

  • 初步应用与前景展望

3. 方案比较与实际表现

  • 三种方案的优劣对比

  • 在不同场景下的实际表现分析

  • 用户反馈与评价

4. 大模型自主智能体的发展方向

  • 技术趋势与未来展望

  • 潜在的应用领域与市场机会

  • 研究与发展的挑战与对策


您认为,这样的技术在实践过程中有哪些痛点?

  • 我们注意到模型在性能和效率上存在挑战,如高计算资源消耗和响应速度问题,这直接影响了其泛化能力和鲁棒性,导致在新领域或面对异常输入时可能表现不佳。此外,由于模型决策过程缺乏透明度,解释性成为一大难题,这进一步影响了人机交互和用户体验的设计。为了保持模型性能,持续学习和更新是必要的,但这又带来了版本控制和知识迁移的问题。最终,这些技术挑战和社会接受度、公众认知紧密相关,需要通过教育和宣传来提升公众对这项技术的理解和信任,从而促进其广泛应用和普及。


演讲亮点

  • 端到端模型自主预测


听众收益

  • 深入理解大语言模型自主智能体的发展历程与未来趋势,全面了解从 GPT-3 开始的技术演进、阶段划分及每个阶段的代表性技术和应用,并获得关于该领域未来发展趋势的洞察,有助于提前布局和规划相关技术的研究与应用。

  • 分享将详细剖析大语言模型自主智能体在实际应用中的挑战,如数据隐私、模型偏差、解释性缺失等,并提供相应的解决方案和最佳实践,使听众学习到如何在实际项目中有效应对这些挑战,提升模型的性能和可靠性。


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


现在报名即可以享受 9 折优惠,单张门票立省 680 元,详情可扫码或联系票务经理 18514549229 咨询。


2025-03-21 09:534

评论

发布
暂无评论

架构师训练营 Week8 - 课后作业

极客大学架构师训练营

数据类型第2篇「字典和集合的原理和应用」

清菡软件测试

测试开发

DolphinDB与MongoDB在时序数据上的对比测试

DolphinDB

mongodb 分布式系统 时序数据库 DolphinDB 数据库开发

期权代持的“坑”里,加拿大人也在 | 法庭上的CTO(11)

赵新龙

CTO 法庭上的CTO

甲方日常 68

句子

工作 随笔杂谈 日常

生产环境全链路压测建设历程之十 淘宝网2013年的建设过程

数列科技杨德华

【经验分享】RTC技术系列之音频编解码

Hanson

SSO的通用标准OpenID Connect

程序那些事

OAuth 2.0 程序那些事 授权框架 安全框架 openid

架构之书:雄伟与《Domain Driven Design》

lidaobing

架构 领域驱动设计

量化交易APP系统软件开发(现成)

系统开发

在线医疗的发展和优势

anyRTC开发者

android 音视频 WebRTC RTC 医疗方案

anyRTC实时音视频-社交娱乐解决方案

anyRTC开发者

ios android 音视频 WebRTC RTC

Spring Boot 集成 Redis

噜噜猫

Spring Boot

【小菜学网络】数据链路层概述

fasionchan

网络编程 计算机网络 网络协议 TCP/IP

如何快速打造一款钉钉 Go sdk

Ceelog

钉钉 企业微信 Go 语言

盘点2020 | 30岁了,我终于入门编程了

盘点2020

探营苏州数字人民币试点

CECBC

数字人民币

旷工三天被开除,公司赔偿十万五 | 法庭上的CTO(9)

赵新龙

CTO 法庭上的CTO

1428万的Adobe采购纠纷 | 法庭上的CTO(10)

赵新龙

CTO 法庭上的CTO

架构师训练营W09作业

Geek_f06ede

架构作业--大数据

Nick~毓

Java并发编程:多线程如何实现阻塞与唤醒

李尚智

Java并发

硬核编程:30天=一个网站+一份周刊

老魚

程序员 建站 web全栈

互联网新规鼓励保险与大数据、区块链等新技术融合!业内呼吁配套产品管理制度尽快出炉

CECBC

互联网金融

C语言服务器编程必备常识

MySQL从删库到跑路

c

JVM从概述到调优图文详解,含思维脑图深度剖析!

Java架构师迁哥

从零开始学习Java8 Stream,看这篇就够了

Silently9527

Java stream java8

Canvas入门实战之用javascript面向对象实现一个图形验证码

徐小夕

Java 大前端 canvas

通过Postman和coding.net发布API

太极程序员

Postman API

SPI 在 Dubbo中 的应用

vivo互联网技术

Java jdk dubbo spi

第三代人工智能基础设施背后,是一次技术应用的常识普及运动

脑极体

智谱 AutoGLM 部门负责人刘潇确认出席 QCon 北京,分享大模型自主智能体发展_AI&大模型_QCon全球软件开发大会_InfoQ精选文章