QCon北京|3天沉浸式学习,跳出信息茧房。 了解详情
写点什么

未来智能 CTO 王松:会议中的 AI Agent,从小任务到全场景的技术突破

未来智能

  • 2024-08-20
    北京
  • 本文字数:1977 字

    阅读完需:约 6 分钟

大小:1023.72K时长:05:49
未来智能CTO王松:会议中的AI Agent,从小任务到全场景的技术突破

近期,前谷歌 CEO 施密特在斯坦福大学的一场闭门演讲引发了广泛争议。无论其观点的正确与否,他的观点确揭示了一个事实:人工智能竞赛似乎是一场只有中美两国能参与的“游戏”。然而,两国在人工智能发展路线上的差异又十分显著。美国侧重于平台的研究与开发,而我国则更注重场景的应用与商业闭环的构建。我国的人工智能发展更加强调实用性,而非单纯的能力展示。


8 月 18 日-8 月 19 日,在上海举办的 AICon 2024 全球人工智能开发与应用大会进一步印证了这一差异。该大会以"智能未来,探索 AI 无限可能"为主题,探讨了 AI 商业洞察和 AI 原生产品的探索路径,以及大模型和多模态技术的实践和成功应用案例。其中的解决方案专场,则以“大模型在多场景下的部署与应用”为专题,邀请国内人工智能明星企业分享了当下的技术实践。其中人工智能硬件公司未来智能 CTO 王松受邀参加了解决方案专场,向业界全面展示了 AI Agent 在个人会议领域的探索和应用。


未来智能 CTO 王松


创新与实用结合:未来智能会议 Agent 引领 AI 应用趋势


未来智能是办公会议耳机赛道的领军企业,自创立之来就以 AI 为基础,聚焦办公会议场景,致力于用 AI 解决用户办公会议痛点,成功打造了一系列将 AI 做到实用的人工智能硬件产品。在 AI Agent 领域,未来智能依托强大的数据基础,早在行业初期就开始布局相关技术研发和探索。


在大会上,王松详细介绍了未来智能会议 Agent 如何通过“感知”、“推理”、“记忆”、“执行”四大模块,精准识别用户场景,并在不同场景下解决用户痛点,提升用户效率。


未来智能会议 Agent 的技术探索始终以办公会议场景为核心,致力于解决用户在办公会议中的痛点。对于职场办公人群来说,大量的时间被各式各样的会议占据,而这些会议中有的充斥着无效信息,有的则需要会前准备大量资料,会后还需进行会议纪要总结。如何提高会议效率,正是职场人士面临的一大难题。



作为一个为用户打造全链路的会议智能体,未来智能会议 Agent 的每个模块都有着明确的职责和具体的功能设计。在感知模块中,未来智能会议 Agent 能够自动收集会议通知并创建会议日程,从会议开始就帮助用户提高效率。由于会议信息主要来源于线上和线下两大信息源,因此会议 Agent 在获得系统或硬件的授权后,可通过技术手段获取相关信息,自动完成任务创建。


在推理模块,当下的 LLM 大模型依旧存在着能力不足等问题,未来智能则通过自研垂直模型,依托人类处理不同问题时的经验、知识,自适应选择合适的解题思路。通过工程化的方式,未来智能不断提升会议 Agent“大脑”的能力,并为未来更高级的 LLM 铺路,不断积累训练数据。


在记忆模块,未来智能会议 Agent 则是在场景之下强化数据的嵌入,向模拟人脑的记忆工作进化,让 Agent 具备长期和短期记忆,能够实现高准确度和命中率,还能快速的访问和存取。而在执行模块,未来智能会议 Agent 则是通过 LLM 来实现任务的落地和最终执行。



未来智能会议 Agent 的技术进步迅速。在大会上,王松就会议 Agent 的技术水平与新能源汽车智能驾驶相类比,预计未来智能会议 Agent 将在明年基本实现 L2.5-L3 水平,用户能够通过端到端的解决方案,让 AI 自动完成用户在会议中的相关任务,就像当下新能源汽车的高阶智驾一样,用户仅需手扶方向盘即可。



从小场景小任务做起,让 AI 在使用中不断进化


未来智能会议 Agent 的技术探索并没有停留在理论层面,而是从更小的场景和更小的任务出发,通过一个个功能点的创新,让用户先受益起来。


例如,面对冗长繁琐的会议内容,讯飞会议耳机内置的 viaim AI,能够智能分析记录内容,自动提取记录中的重点,2 小时会议可一键生成「摘要总结」,大幅简化会后总结难度,让会议核心内容一目了然。viaim AI 还能提取记录中的关键任务,一键生成「待办事项」,帮助用户轻松跟踪会后内容。


viaim AI 还拥有「快速问答」功能,用户只需语音/文字输入问题,viaim AI 就能回答用户关于当前记录内提到的问题和扩展问题,让用户快速获取记录内容中需要的信息。随着未来智能 AI 技术的不断进化,viaim AI 也会常用常新,不断为用户带来更多优秀的体验。



除此之外,未来智能不仅在通用场景中取得了进展,还深入细分行业领域,展开了广泛的探索。例如,在金融领域,未来智能正在探索如何让讯飞会议耳机自动识别金融相关的会议内容,耳机会在会后调用常用的开源或商业化的金融领域大模型,自动生成专业的会议报告。这些报告能够涵盖投研、ESG、财经、财报等多个投研相关细分领域,提供一系列专业的 AI 支持能力。


这种针对具体行业的会议技术解决方案,展示了未来智能技术的深度和实践能力。均给参会的行业人士带来了深刻的印象。


未来智能在 AI Agent 领域的探索,不仅展示了中国企业在技术路线上的独特优势,还体现了中国企业对实用性和场景适用性上的深刻理解。这种在技术发展与商业闭环之间的平衡,或许正是推动人工智能行业健康发展的关键所在。可以说,中国的人工智能企业正在以自己的方式引领全球人工智能发展的新趋势。

2024-08-20 11:056195

评论

发布
暂无评论
发现更多内容

PlayAI 发布 TTS 新模型,三方测试超 ElevenLabs;19岁华人辍学打造对话式 AI 助手,融资 200 万美元

声网

淘宝商品描述 API 接口的开发、应用与收益

科普小能手

数据挖掘 数据分析 淘宝 API 接口 跨境电商运营

CAD迷你看图 for Mac:高效便捷的CAD图纸查看与编辑神器

Rose

全球人形机器人行业 2024 年度汇总和行业前瞻报告:具身智能技术、人形机器人与商业化分析

机器人头条

机器人 科技 人形机器人 具身智能吗

Spring AI 提交 PR 实战指南:避免常见坑

快乐非自愿限量之名

Java spring 后端

百亿大表的实时分析:华安基金 HTAP 数据库的选型历程与 TiDB 使用体验

PingCAP

数据库 TiDB HTAP

快速入门 DeepSeek-R1 大模型

EquatorCoco

DeepSeek

面对全球化的泼天流量,出海企业如何观测多地域网络质量?

阿里巴巴云原生

阿里云 云原生

AnyGo for Mac:解锁虚拟定位新境界,全球位置任我行

Rose

自建云电脑,自建云电脑怎样最简单

柳岸风吟

舞台LED租赁显示屏搭建的4种形式

Dylan

视觉 LED LED display LED显示屏 舞台表演

亚马逊IP关联怎么解决?

Ogcloud

海外原生IP 海外IP 海外IP代理 海外静态IP 亚马逊IP关联

网络安全视角:从地域到账号的阿里云日志审计实践

阿里巴巴云原生

阿里云 云原生

软件测试丨PyTorch 图像目标检测

测试人

软件测试

DeepSeek系列新模型正式上线昇腾社区

Geek_2d6073

如何在离线环境下部署 EMQX ECP

EMQ映云科技

emqx EMQX ECP

劳工管理系统(源码 + 文档 + 部署 + 讲解)

深圳亥时科技

Rhinoceros 8:三维建模新纪元,引领设计革命

Rose

AI编程:Coze + Cursor实现一个思维导图的浏览器插件

卷福同学

AI编程 cursor

TiDB 分布式数据库多业务资源隔离应用实践

PingCAP

数据库 分布式 TiDB 资源隔离

本地部署DeepSeek

快乐非自愿限量之名

DeepSeek

攻克多版本运维难题:爱奇艺百套 TiDB 集群升级至 v7.1.5 实战宝典来袭!

PingCAP

数据库 分布式 运维 TiDB

深入理解 MongoDB 文档模型

彭振翼

mongodb 存储 索引 文档数据库 存储引擎

office 365 for mac破解版附激活工具

Rose

SecuritySpy Mac:打造高效、智能的视频监控解决方案

Rose

Navicat for MySQL:数据库管理与开发的全方位解决方案

Rose

新手入门:DGL在昇腾上的安装问题

Splendid2025

人工智能

2025春招 SpringCloud 面试题汇总

威哥爱编程

Java spring 面试题 spring cloud全家桶

蛇年开工送大礼,邀您一键体验DeepSeek系列新模型

华为云开发者联盟

人工智能 大模型 昇腾云 DeepSeek

ACK 容器监控存储全面更新:让您的应用运行更稳定、更透明

阿里巴巴云原生

阿里云 容器 云原生

一行代码不用写,用 Autoflow + Gitee AI 搭建本地知识库问答机器人

PingCAP

数据库 分布式 TiDB

未来智能CTO王松:会议中的AI Agent,从小任务到全场景的技术突破_企业动态_InfoQ精选文章