写点什么

华为、阿里、喜马拉雅领衔专家深度解析 AI Agent 技术与应用|AICon

  • 2024-04-23
    北京
  • 本文字数:1942 字

    阅读完需:约 6 分钟

华为、阿里、喜马拉雅领衔专家深度解析 AI Agent 技术与应用|AICon

在人工智能的浪潮之下,AI Agent 正逐渐成为技术前沿探索与实践的焦点,不仅推动着各行各业的革新,也为我们提供了全新的交互体验。大模型技术的不断进步和普及使得 AI Agent 在企业生产、音视频创作、智能设备等多个领域展现出巨大的潜力和价值。为了深入探讨 AI Agent 的发展现状、挑战与未来方向,2024 北京站 AICon 全球人工智能开发与应用大会暨大模型应用生态展精心策划了一个 AI Agent 专题,邀请了阿里巴巴通义实验室 NLP 资深算法专家张佶作为专题出品人,精选了一系列既专业又吸引人的议题,以确保听众能获得最大的收益。


在本专题中,我们首先有幸邀请到清华大学智能产业研究院的副教授李鹏博士,李鹏博士在人工智能领域,尤其是自然语言处理、预训练语言模型、跨模态信息处理以及大模型智能体等方面,拥有深厚的研究基础,已在国际重要会议和期刊发表论文 90 余篇。他将带来关于大模型可进化智能体的前沿实践与理论研究的深入探索。李鹏博士的演讲将是本次专题的开篇,为我们勾勒出 AI Agent 面临的主要挑战及未来发展的新思路。


接着,张磊他是来自 OPPO 的 AI 中心系统架构师,他将分享 AI Agent 在 AI 手机中作为“数字游民”的应用实践。张磊的演讲不仅将揭示智能体在 AI 手机中的多种应用场景,还将深入讨论智能体开发平台的架构设计及其技术演进趋势,为我们展现 AI 手机的未来发展方向。


随后,我们非常荣幸地邀请到了马宇峰,阅文集团的 AIGC 技术负责人,他将带来题为**“阅文集团基于 Agent 的内容生产辅助探索”的精彩演讲。马宇峰凭借其在百度搜索和大数据领域的丰富经验,专注于自然语言处理与人工智能方向,并在多个重要赛事中取得显著成绩,如 CCKS 中文知识图谱大赛第一名。在阅文集团,他负责推进大模型、多模态、产研落地与知识管理与评估等多方面的团队工作,成功带领团队在内容行业垂类模型开发并实现场景落地,拥有丰富的一线实操经验。通过他的分享,你将深入了解到如何通过内容理解、剧本分镜、视觉化等流程**,构建以 AI Agent 为核心的内容生产辅助系统,帮助创作者显著提升内容生产效率。


当然,我们也荣幸邀请到了机器姬的 CTO 刘智勇,他是具身智能方向的技术专家和科学家。他的研究领域包括具身智能、机器人学习以及移动机器人技术,是文生行动推理智能体 JI Agent 和 ZROS 核心作者,也是国家奖学金获得者。他将分享具身智能机器人推理 Agent 和训练 Agent 的落地应用。刘智勇的分享将带领我们深入了解具身智能的前沿探索,特别是在开放世界中的应用实践,展示了智能体技术如何助力长周期机器人任务的规划与执行。


紧接着,我们邀请到的是阿里巴巴通义实验室高级算法专家严明,他专注于对话问答、预训练语言模型、大模型智能体以及多模态大模型的研究,在阿里主要负责 mPLUG 多模态大模型与 AI 智能体的基础技术,以及通义星尘、魔搭 Agent 的基础算法和 XPLUG 开源体系的构建。他将从模型协作智能体到个性化智能体技术的应用实践出发,分享他的广泛实践经验和技术演进。严明的演讲将深化我们对智能体技术最新进展的理解,展示如何利用大模型智能体技术解决实际应用中的问题。


之后,喜马拉雅珠峰 AI 产品总监吕睿韬将带来关于在音视频创作中 AI Agent 创新探索的分享。他将探讨如何通过构建基于音视频大模型的 AI agent 来应对这些挑战,实现创作过程的自动化和智能化,从而提高创作效率和内容质量。重点介绍将包括内容生成、编辑与后期制作的智能化、个性化推荐、互动体验,以及版权与合规性审核。此外,他还将讨论 AI 在分析观众数据、提供个性化内容建议、以及内容版权管理和合规性审核中的作用。通过吕睿韬的分享,您将获得对 LLM 底层思考和 AI agent 构建与实践的深入理解,掌握音视频创作中 AI 技术的应用与前景。


最后,来自华为云 aPaaS 服务产品部的首席架构师陈星亮,将带来“AI Agent 在企业生产中的技术实践”的内容分享。他从当前 AI Agent 进入企业生产场景面临的专业复杂问题、AI 生成结果难以达到可用标准以及知识安全难保障等全新挑战入手,分享华为云 AI Agent 的探索与实践,在虚拟客服、会议摘要等场景有着较好的应用效果,以期解决企业引入 AI 生成技术的瓶颈,并对 AI Agent 在未来的企业生产场景中进行多形态部署和交互进行展望,他的分享希望给你带来“AI Agent 如何在企业生产场景中充分发挥技术价值”的启发和思考。



从李鹏博士的理论研究到张磊的 AI 手机应用,再到刘智勇的具身智能机器人实践,严明的模型协作探讨,吕睿韬的音视频创作探索,以及陈星亮的企业生产实践,本次 AI Agent 专题全面涵盖了从理论到实践,从个体到系统,从产品到服务的各个方面。每位嘉宾的分享不仅相互补充,形成了对 AI Agent 现状、挑战与未来方向的全景式认知,也为参与者提供了一个深入理解和探索 AI Agent 潜力与价值的机会。

2024-04-23 10:025702
用户头像
AICon 全球人工智能开发与应用大会 一起探寻人工智能和大模型的边界!

发布了 61 篇内容, 共 37.3 次阅读, 收获喜欢 36 次。

关注

评论

发布
暂无评论
发现更多内容

悦数图数据库与 keyarchOS 完成浪潮信息澎湃技术认证

悦数图数据库

数据库 图数据库 分布式图数据库

第二周作业

大肚皮狒狒

面部表情识别技术在人机交互中的应用

数据堂

学习 ChatGPT 一切基础知识的绝佳资源

3D建模设计

人工智能 ChatGPT LLM

一云多芯能力再获认可!天翼云助推政企上云行稳致远!

天翼云开发者社区

云计算

从FTP到SFTP,哪个才是跨国传输大文件的最佳方案

镭速

大文件传输 传输大文件 跨国大文件传输

Adobe联创去世,没他就没有PDF,乔布斯也因他逆风翻盘

Openlab_cosmoplat

PDF

业内首份!电信和互联网数据安全标准汇编发布(附下载)

极盾科技

数据安全

LangChain + Streamlit + Llama:将对话式AI引入本地机器

3D建模设计

人工智能 LLM

如何使用LLM实现文本自动生成视频

3D建模设计

Python 人工智能

企业级私有化部署即时通讯,完美替代SaaS平台

BeeWorks

如何使用Redis实现分布式锁?

王磊

Java Java面试题

文心一言 VS 讯飞星火 VS chatgpt (79)-- 算法导论7.4 4题

福大大架构师每日一题

福大大架构师每日一题

如何高效实现混合App开发?

FinFish

混合开发 小程序化 混合app 超级App开发

解码全栈

互联网工科生

开发者 全栈工程师 全栈开发

2023.10.14-价值最大化沙盘演练

ShineScrum

使用 ChatGPT 的代码解释器进行数据科学的 5 种方法

3D建模设计

Python 数据分析 ChatGPT

企业级即时通讯协作和移动应用管理平台哪个品牌好?

BeeWorks

2023 ARTS打卡第一周

犇犇

ARTS 打卡计划

如何设计自动化测试落地方案

老张

自动化测试 测试方案

面部表情识别技术的最新研究进展

数据堂

使用three.js与WebGL相比有什么优势?

3D建模设计

WebGL three.js

面部表情识别的伦理问题与应对策略

数据堂

近期大型攻防演练观感及未来攻防趋势判断

墨菲安全

安全 软件供应链

图数据库有哪些:知名图数据库产品和应用场景介绍

悦数图数据库

数据库 图数据库

华为、阿里、喜马拉雅领衔专家深度解析 AI Agent 技术与应用|AICon_AI&大模型_李忠良_InfoQ精选文章