QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

世界机器人大会风靡,具身智能如何落地?

  • 2024-08-26
    北京
  • 本文字数:4197 字

    阅读完需:约 14 分钟

大小:2.08M时长:12:06
世界机器人大会风靡,具身智能如何落地?

人工智能浪潮席卷各行各业,具身智能作为人工智能的一个重要发展分支迅速崛起。我国具身智能领域的发展已步入快车道, 在 2024 世界机器人大会上,来自海内外的机器人企业展示了数十款人形机器人产品,数量创历届之最。根据大会公布的信息,中国在机器人创新、应用拓展和行业治理等方面均走在国际前列。各地地方政府纷纷支持人工智能产业的发展,如北京市就公布了打造全国具身智能创新高地的三年行动方案,希望提升我国参与全球具身智能竞争的核心力量。


无论是政策支持还是产业动向,都传递出具身智能技术高速发展的信号。那么,具体到实践层面,具身智能在技术成熟度、商业应用前景和投资回报率等层面的表现如何?能否在实际场景中提供有价值的解决方案?带着这些问题,本期《极客有约》栏目邀请到了北电数智战略与市场负责人杨震,共同探讨具身智能领域的发展情况。


具身智能:新范式带来新机会

InfoQ:具身智能赛道仍存在较多不确定性,北电数智为何选择坚定投入这一赛道?


杨震:首先,具身智能是一个新范式。过去的二三十年可以分成三个阶段,第一个阶段是信息时代,解决感知问题,大数据等技术的发展让我们获得了更多的知识和信息;第二个阶段是生成式人工智能时代,机器学习、深度学习等技术提高了思考能力,提高模型决策、判断能力;第三个阶段是具身智能时代,智能有了硬件载体,最终碰触到了整个链条的最后一个环节——面向场景做执行。在信息时代,获取信息决策、执行是由人类完成的;有了模型以后,模型可以辅助做一些判断和决策;具身智能则是一个全新范式,它可以自主完成从感知到决策再到执行的任务,形成一个闭环。


第二点,具身智能将开启新的交互窗口。信息时代用 PC 做交互,智能手机则可以通过语言、触屏等形式交互。具身智能是第三个窗口,也是革命级的窗口。它可以跨越接触介质,没有交互门槛,你可以用语言、手势甚至眼神等完成交互。


第三点,它是一个全新的平台。信息技术、模型技术、机器人技术都不是今天才有的,当这些技术在平台上叠加起来,就会出现非常多的商业模式,从而大幅影响社会和每个人的生活。有人担心未来不会用 AI 会失业,但这一波 AI 浪潮是以自然语言为基础的,会说话就可以使用 AI 。无人驾驶就是具身智能带来新商业模式的典型代表,萝卜快跑开启了无人驾驶的商业模式,但它并不会取代网约车司机、出租车司机的工作,车还是司机的,只是解放了司机的生产力,让他们找到新的工作方式、工作模式。


基于以上三点,我们看到具身智能是新范式、新入口、新平台,社会上已经衍生了一些新模式,它是一个很确定的趋势。


工业和信息化部也提出到 2025 年,我国人形机器人创新体系要初步建立,在关键技术取得突破。今年以来,多地出台了支持人形机器人产业发展的政策,北京、浙江、广东、四川更是成立了人形机器人产业创新中心,推动行业发展。


科技行业讲究第一性原理,任何工业革命级的创新都会有先驱者。特斯拉已经在做端到端的机器人,并将机器人用到自己的工厂里,国内一些头部具身智能厂商也在逐步探索商业道路和闭环方式。确定性的行业趋势,国家政策的支持和行业的落地探索进展,都让我们相信具身智能的发展未来。


InfoQ:具身智能会不会像元宇宙一样热度过了就消沉了?


杨震技术炒作现象有时是因为时候未到,或发展关键元素不齐备,导致不能充分落地和发挥作用。 机器人技术已发展多年,但过去使用场景并不广泛,当时的机器人是由规则控制的,协同技术不完善,没有学习能力,只能完成固定任务。如工业自动化通过设定量和阈值来控制,机械手只能做固定动作,任务复杂度越高,出问题概率就越大。生成式人工智能大模型的出现弥补了上述缺点,机器人能具备自纠错能力,如人形机器人在行走过程中踉跄后能自行站稳,这为机器人执行复杂任务奠定了技术基础。


世界机器人大会上,我们看到多家具身智能厂商展示了落地场景,智能搬运、智能质检、螺丝拧紧、零件安装、水果采摘等,奔驰、宝马等车企也开始在自家工厂里采用人形机器人,具身智能具备了商业闭环的可能。


未来随着专有场景出现,机器人可执行的动作、功能不断增加、完善,针对某一具体功能或能在多个场景复用的人形机器人的成本会快速下降。而当机器人的成本降低后,B 端企业、C 端用户会愿意接纳、尝试机器人。


此外,随着我国逐步进入老龄化社会,机器替人的需求将长期存在。以老人看护场景为例,年轻人需要工作,心有余而力不足,看护场景也不是一个人就能完成的,这就需要具身智能快速理解场景,实现落地。因此,我们不认为具身智能是一个短期炒作的领域。

具身智能行业如何破局和成长?


InfoQ:具身智能行业想要实现破局,需要哪些抓手?


杨震:无人驾驶出租车走上街头对具身智能赛道的发展是非常好的信号。无人驾驶需在完全开放的环境中运行,会受到不确定性因素的干扰。而具身智能将落地的工厂、家庭场景,环境都相对封闭和稳定,不确定因素有限。无人驾驶这么难的场景都已经落地了,具身智能的落地只会更容易一些。


多模态大模型等技术可以推动具身智能的落地,让模型去认知世界所有的变量和不变量,让具身智能学习专业技能并运用。但具身智能真正实现落地还缺了两个部分,一是让具身智能快速落地的先行场景,二是数据积累。 这两点既是具身智能产业发展的卡点,也是行业破局的关键。


InfoQ:具身智能产业上游核心技术组件的可靠性、稳定性、成本问题怎么解决?


杨震:感知单元、控制单元、决策单元等上游核心技术发展得很快,且国内外技术发展非常同步。只是在大规模量产前,人形机器人的零部件,像感知端的一些高端传感器等组件的成本还比较高,存在可靠性、稳定性问题。我们认为可以尝试沿途下蛋的方式,不断在小场景落地,用一些功能没那么完整甚至和人形差异较大的机器人,把场景和需求跑起来,不断打磨核心组件的可靠性、稳定性,将成本逐渐降下来。


InfoQ:具身智能的智能模型和本体硬件未来是否会一体化?


杨震:具体要看本体要承载的功能是什么。一个需具备泛化多功能能力的人形机器人,在处理复杂、需要频繁判断和决策的任务时,可能需要边缘云的介入。但如果只是相对简单的任务,不需要高频决策支持,如特定场景的炒菜机器人,小模型就可以做非常多的事情。

北电数智在行业发展中扮演怎样的角色?


InfoQ:从北电数智的角度出发,可以为整个生态圈的链接、繁荣做哪些事情?


杨震:人工智能是第四次工业革命的标志,它对整个科技链条及其运作模式产生重塑效果。当人工智能方兴未艾时,我们需要审视整个科技链条,找到卡点和难点,把整个链条串起来,让它能够真正形成闭环,让产业能够快速成长和繁荣起来,作为人工智能时代的基础设施建设者,我们正致力于成为人工智能的产业加速器。


具身智能赛道,有一类公司主要生产机器人,比如人形机器人本体、四足机器人或者灵巧手公司。另一类公司是模型公司,做底座大模型、自然语言大模型,赋予机器人感知、思考、决策的能力,可以想象成大脑;要操纵机器人精准地执行动作还需要小脑,很多机器人大模型公司在做小脑的事情。但即便机器人有了很好的判断能力、运动能力,想要真正进入千行百业,还需要一些专业技能,这就需要开发团队在具体应用场景中训练它的专业技能


如果想把这几层有效地连接起来,需要开放的训练场,要有一些具体场景。人工智能时代数据是最重要的,我们也看到在具身智能模型的训练中,无论是模拟仿真训练,还是远程操作示教,机器人数据都非常稀缺,数据的采集成本也非常高。例如特斯拉招聘的数据收集员,带上 VR 眼镜做一些任务来采集数据,每小时工资就要 48 美元。


我们做的事情首先是搭台子,让大家能够组团。其次是提供场景,把数据采集成本降下来,让产业链条上的本体公司、小脑公司和开发者团体形成自己的闭环。 这是具身智能产业快速发展的关键。


北电数智坚持中立的理念,我们不生产芯片,而是非常中立地把各种算力集合在一起,让它们能够协同作战。我们会广泛适配已有的底座模型、开发框架,让终端使用者、开发者找到自己的操作平台,落实到具身智能上。同样道理,我们既不生产本体,不生产小脑,也不训练它的专业技能。我们提供的是一个平台,希望平台能够把整个具身智能产业链上下游串接起来,让大家能够迅速组团,找到自己的最佳组合、最佳落地场景。


InfoQ:北电数智与生态合作伙伴已有哪些落地实践,可否给我们介绍 1-2 个案例?


杨震:上个月的全球数字经济大会期间,我们和中日友好医院达成合作,一起在医疗大模型和特有病种上做深度研究。我们看到,过往适应症研究、靶点研究主要采用机器学习方式训练,数据训练做得不是很好,动辄需好几年才能突破。在最新的案例中,可能 21 天就会有一个适应症的突破。


场景是具身智能产业链上下游伙伴发展起来的关键,也是大众能尽快享受具身智能的关键。我们希望在平台上将场景充分聚集起来,降低算力成本,为具身智能企业的发展提供沃土。与此同时,我们也会做好对数据安全的技术保障。


 InfoQ:展望未来,北电数智如何联合业内外合作伙伴一同推动具身智能的发展?


杨震:北电数智希望充分发挥 AI 基础设施建设者的优势,从算力、数采空间和边缘空间,到开发平台工具、训练场等,做好我们应做的工作,和整个产业链上下游的伙伴协同。我们会发挥优势,尽量链接到重要且能近期见效的场景,把场景放到训练场上,让行业里的优秀伙伴们能找到自己发挥的空间,让具身智能机器人能够快速落地实际的应用和案例,真正走到生产、生活中去。


 InfoQ:怎样成为北电数智的合作伙伴?


杨震:8 月 27 日,我们即将举办具身智能创新论坛,并宣布一些计划,包括联合实验室,以及针对开发者或初创公司的培知培育计划。我们也在建设北京数字经济算力中心,预计年底落成,这也是北京五环内唯一亿级的智算中心,将设置了人工智能企业的路演空间、交流空间甚至联合实验室,让人工智能企业能够展示自己的科技成果和想法。

活动预告


如何解决具身智能大规模、高质量训练数据的痛难点? 具身模型与算法更关注哪些维度?具身智能的商业化路径与落地场景将会是怎样?


8 月 27 日下午 14:00,「2024 具身智能创新论坛」将以“星火·点亮具身智能”为主题,邀请机器人本体公司、具身智能模型开发公司以及仿真训练场等领域代表,共同探讨具身智能破局的有效路径。如果你对这场活动感兴趣,欢迎扫描下方二维码,围观现场直播!



InfoQ,将在 08 月 27 日 14:00 直播

已预约

8 月 27 日 14:00,「2024 具身智能创新论坛」以“星火·点亮具身智能”为主题,欢迎围观见证!

视频号

2024-08-26 15:096210

评论

发布
暂无评论
发现更多内容

Prometeus 2.32.0 新特性

耳东@Erdong

Prometheus 28天写作 12月日更

22《重学JAVA》--字节流

杨鹏Geek

Java25周年 28天写作 12月日更

在线问诊初体验

mtfelix

28天写作

如何给产品做拉新?

石云升

AARRR 产品思维 28天写作 产品增长 12月日更

盘一盘Java中的abstract和interface

李子捌

28天写作 21天挑战 12月日更

如何设计异地多活架构

天天向上

架构实战营

盘点2021|「避坑宝典」为大家分享一下笔者在2021年所遇到“匪夷所思”的Bug趣事(上)

洛神灬殇

2021年展望 2021年度技术盘点与展望 盘点2021 避坑宝典

leetcode 206 反转链表

好吃不贵

盘点 2021|学习、分享、努力中成长

小隐乐乐

盘点2021

单步调试理解webpack里通过require加载nodejs原生模块实现原理

汪子熙

前端 前端开发 webpack 28天写作 12月日更

分布式数据缓存中的一致性哈希算法

程序员历小冰

缓存 一致性哈希 28天写作 12月日更

王者商城异地多活设计

天天向上

架构实战营

彩色图像色彩空间原理(理论篇—6)

不脱发的程序猿

机器视觉 图像处理 色彩空间原理

视频知识点(6)- MPEG vs JPEG

liuzhen007

28天写作 12月日更

2021的科技卦象·兑·一场“双碳”催化雨

脑极体

DDD领域驱动实战(二)-限界上下文(bounded context)

JavaEdge

12月日更

直播预告|百万人观看无卡顿!京东云CDN支撑直播丝般顺滑

京东科技开发者

CDN 直播

蓝绿发布、滚动发布、灰度发布

xcbeyond

灰度发布 28天写作 12月日更 蓝绿发布 滚动发布

【架构实战营】模块七作业

liu🍊

前端开发:Mac OS环境下的通过对Chrome浏览器设置SameSite解决跨域请求方法

三掌柜

28天写作 12月日更

PassJava 开源 (四):整合MyBatis-Plus实现CRUD

悟空聊架构

mybatis 28天写作 passjava 悟空聊架构 12月日更

今年读了多少书?(22/28)

赵新龙

28天写作

Python 的元类设计起源自哪里?

Python猫

Python ruby

管理文化

圣迪

管理 文化 强势文化 弱势文化

架构营模块七作业

GTiger

架构实战营

绩效沟通准备

搬砖的周狮傅

绩效管理

Dubbo 框架学习笔记十

风翱

dubbo 12月日更

性能分析之TPS从300到750的过程

zuozewei

性能测试 性能分析 12月日更

.NET6新东西--模式匹配中的Extended Property Patterns

喵叔

28天写作 12月日更

040022-week7-design

InfoQ_70156470130f

PassJava 开源 (三):快速生成前后端代码

悟空聊架构

SpringCloud 28天写作 passjava 悟空聊架构 12月日更

世界机器人大会风靡,具身智能如何落地?_AI&大模型_郑思宇_InfoQ精选文章