写点什么

未来智能 CTO 王松:会议中的 AI Agent,从小任务到全场景的技术突破

未来智能

  • 2024-08-20
    北京
  • 本文字数:1977 字

    阅读完需:约 6 分钟

大小:1023.72K时长:05:49
未来智能CTO王松:会议中的AI Agent,从小任务到全场景的技术突破

近期,前谷歌 CEO 施密特在斯坦福大学的一场闭门演讲引发了广泛争议。无论其观点的正确与否,他的观点确揭示了一个事实:人工智能竞赛似乎是一场只有中美两国能参与的“游戏”。然而,两国在人工智能发展路线上的差异又十分显著。美国侧重于平台的研究与开发,而我国则更注重场景的应用与商业闭环的构建。我国的人工智能发展更加强调实用性,而非单纯的能力展示。


8 月 18 日-8 月 19 日,在上海举办的 AICon 2024 全球人工智能开发与应用大会进一步印证了这一差异。该大会以"智能未来,探索 AI 无限可能"为主题,探讨了 AI 商业洞察和 AI 原生产品的探索路径,以及大模型和多模态技术的实践和成功应用案例。其中的解决方案专场,则以“大模型在多场景下的部署与应用”为专题,邀请国内人工智能明星企业分享了当下的技术实践。其中人工智能硬件公司未来智能 CTO 王松受邀参加了解决方案专场,向业界全面展示了 AI Agent 在个人会议领域的探索和应用。


未来智能 CTO 王松


创新与实用结合:未来智能会议 Agent 引领 AI 应用趋势


未来智能是办公会议耳机赛道的领军企业,自创立之来就以 AI 为基础,聚焦办公会议场景,致力于用 AI 解决用户办公会议痛点,成功打造了一系列将 AI 做到实用的人工智能硬件产品。在 AI Agent 领域,未来智能依托强大的数据基础,早在行业初期就开始布局相关技术研发和探索。


在大会上,王松详细介绍了未来智能会议 Agent 如何通过“感知”、“推理”、“记忆”、“执行”四大模块,精准识别用户场景,并在不同场景下解决用户痛点,提升用户效率。


未来智能会议 Agent 的技术探索始终以办公会议场景为核心,致力于解决用户在办公会议中的痛点。对于职场办公人群来说,大量的时间被各式各样的会议占据,而这些会议中有的充斥着无效信息,有的则需要会前准备大量资料,会后还需进行会议纪要总结。如何提高会议效率,正是职场人士面临的一大难题。



作为一个为用户打造全链路的会议智能体,未来智能会议 Agent 的每个模块都有着明确的职责和具体的功能设计。在感知模块中,未来智能会议 Agent 能够自动收集会议通知并创建会议日程,从会议开始就帮助用户提高效率。由于会议信息主要来源于线上和线下两大信息源,因此会议 Agent 在获得系统或硬件的授权后,可通过技术手段获取相关信息,自动完成任务创建。


在推理模块,当下的 LLM 大模型依旧存在着能力不足等问题,未来智能则通过自研垂直模型,依托人类处理不同问题时的经验、知识,自适应选择合适的解题思路。通过工程化的方式,未来智能不断提升会议 Agent“大脑”的能力,并为未来更高级的 LLM 铺路,不断积累训练数据。


在记忆模块,未来智能会议 Agent 则是在场景之下强化数据的嵌入,向模拟人脑的记忆工作进化,让 Agent 具备长期和短期记忆,能够实现高准确度和命中率,还能快速的访问和存取。而在执行模块,未来智能会议 Agent 则是通过 LLM 来实现任务的落地和最终执行。



未来智能会议 Agent 的技术进步迅速。在大会上,王松就会议 Agent 的技术水平与新能源汽车智能驾驶相类比,预计未来智能会议 Agent 将在明年基本实现 L2.5-L3 水平,用户能够通过端到端的解决方案,让 AI 自动完成用户在会议中的相关任务,就像当下新能源汽车的高阶智驾一样,用户仅需手扶方向盘即可。



从小场景小任务做起,让 AI 在使用中不断进化


未来智能会议 Agent 的技术探索并没有停留在理论层面,而是从更小的场景和更小的任务出发,通过一个个功能点的创新,让用户先受益起来。


例如,面对冗长繁琐的会议内容,讯飞会议耳机内置的 viaim AI,能够智能分析记录内容,自动提取记录中的重点,2 小时会议可一键生成「摘要总结」,大幅简化会后总结难度,让会议核心内容一目了然。viaim AI 还能提取记录中的关键任务,一键生成「待办事项」,帮助用户轻松跟踪会后内容。


viaim AI 还拥有「快速问答」功能,用户只需语音/文字输入问题,viaim AI 就能回答用户关于当前记录内提到的问题和扩展问题,让用户快速获取记录内容中需要的信息。随着未来智能 AI 技术的不断进化,viaim AI 也会常用常新,不断为用户带来更多优秀的体验。



除此之外,未来智能不仅在通用场景中取得了进展,还深入细分行业领域,展开了广泛的探索。例如,在金融领域,未来智能正在探索如何让讯飞会议耳机自动识别金融相关的会议内容,耳机会在会后调用常用的开源或商业化的金融领域大模型,自动生成专业的会议报告。这些报告能够涵盖投研、ESG、财经、财报等多个投研相关细分领域,提供一系列专业的 AI 支持能力。


这种针对具体行业的会议技术解决方案,展示了未来智能技术的深度和实践能力。均给参会的行业人士带来了深刻的印象。


未来智能在 AI Agent 领域的探索,不仅展示了中国企业在技术路线上的独特优势,还体现了中国企业对实用性和场景适用性上的深刻理解。这种在技术发展与商业闭环之间的平衡,或许正是推动人工智能行业健康发展的关键所在。可以说,中国的人工智能企业正在以自己的方式引领全球人工智能发展的新趋势。

2024-08-20 11:056333

评论

发布
暂无评论
发现更多内容

迈向云原生:名企FreeWheel应用架构演进

博文视点Broadview

如何使用GoldWave软件将文字转换为语音

懒得勤快

模块五作业:设计微博系统中”微博评论“的高性能高可用计算架构。

dean

架构实战营

微博系统中“微博评论”的高性能计算架构

波波

「架构实战营」

华云大咖说 | 安超信创桌面云金融行业解决方案

华云数据

极客时间

Nydia

28天写作 12月日更

大厂算法面试之leetcode精讲16.set&map

全栈潇晨

LeetCode 算法面试

react源码解析9.diff算法

buchila11

React React Diff

Git进阶(三):webstorm 的 git 切换分支

No Silver Bullet

git 12月日更

python 爬虫爱好者必须掌握的知识点“ 协程爬虫”,看一下如何用 gevent 采集女生用头像

梦想橡皮擦

12月日更

Go语言学习查缺补漏ing Day1

恒生LIGHT云社区

编程语言 Go 语言

在线火星文转简体中文工具

入门小站

工具

react源码解析10.commit阶段

buchila11

React react源码

【LeetCode】相对名次Java题解

Albert

算法 LeetCode 12月日更

数字化转型鸿沟如何消除?ROMA Connect融合集成,联接企业应用现在与未来

华为云开发者联盟

多云服务 应用 集成 集成平台 ROMA Connect

【Dart 专题】Generics 泛型 <T>

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 12月日更

Linux学习方法《Linux一学就会》:重定向和文件的查找

侠盗安全

MySQL only_full_group_by 1055 报错的三种解决方案,临时关闭有影响吗?

蒋川

MySQL 报错 MySQL 数据库

Apache APISIX 2.11.0 正式发布,蓄力两月带来更多新功能!

API7.ai 技术团队

开源 云原生 网关 API网关 Apache APISIX

中年人的沉重1

张老蔫

28天写作

大厂算法面试之leetcode精讲15.链表

全栈潇晨

算法 链表 LeetCode

Linux里的“宝塔”,真正的宝塔!详细教程

老表

Linux 开发工具 安装宝塔 跟老表学云服务器

Apache APISIX 社区双周报 | 11.15-11.30 功能亮点更新进行中

API7.ai 技术团队

开源 云原生 网关 api 网关 Apache APISIX

Redis玩转Message Queue之Stream详述

李子捌

redis 28天写作 Redis Stream 12月日更

Rust 元宇宙 11 —— Websocket

Miracle

rust websocket 元宇宙

模块五:如何设计业务高性能高可用计算架构? --学习总结

小鹿

设计微博评论架构

张靖

#架构实战营

刚提测就改需求,我是渣男吗?

小傅哥

Java 加班 小傅哥 需求迭代 产品功能

[Pulsar] JDBC core sink connector介绍及实现

Zike Yang

Apache Pulsar 11月日更 12月日更

模块5作业

忘记喝水的猫

架构训练营

设计模式【4】-- 建造者模式详解

秦怀杂货店

设计模式

未来智能CTO王松:会议中的AI Agent,从小任务到全场景的技术突破_企业动态_InfoQ精选文章