写点什么

世界机器人大会风靡,具身智能如何落地?

  • 2024-08-26
    北京
  • 本文字数:4197 字

    阅读完需:约 14 分钟

大小:2.08M时长:12:06
世界机器人大会风靡,具身智能如何落地?

人工智能浪潮席卷各行各业,具身智能作为人工智能的一个重要发展分支迅速崛起。我国具身智能领域的发展已步入快车道, 在 2024 世界机器人大会上,来自海内外的机器人企业展示了数十款人形机器人产品,数量创历届之最。根据大会公布的信息,中国在机器人创新、应用拓展和行业治理等方面均走在国际前列。各地地方政府纷纷支持人工智能产业的发展,如北京市就公布了打造全国具身智能创新高地的三年行动方案,希望提升我国参与全球具身智能竞争的核心力量。


无论是政策支持还是产业动向,都传递出具身智能技术高速发展的信号。那么,具体到实践层面,具身智能在技术成熟度、商业应用前景和投资回报率等层面的表现如何?能否在实际场景中提供有价值的解决方案?带着这些问题,本期《极客有约》栏目邀请到了北电数智战略与市场负责人杨震,共同探讨具身智能领域的发展情况。


具身智能:新范式带来新机会

InfoQ:具身智能赛道仍存在较多不确定性,北电数智为何选择坚定投入这一赛道?


杨震:首先,具身智能是一个新范式。过去的二三十年可以分成三个阶段,第一个阶段是信息时代,解决感知问题,大数据等技术的发展让我们获得了更多的知识和信息;第二个阶段是生成式人工智能时代,机器学习、深度学习等技术提高了思考能力,提高模型决策、判断能力;第三个阶段是具身智能时代,智能有了硬件载体,最终碰触到了整个链条的最后一个环节——面向场景做执行。在信息时代,获取信息决策、执行是由人类完成的;有了模型以后,模型可以辅助做一些判断和决策;具身智能则是一个全新范式,它可以自主完成从感知到决策再到执行的任务,形成一个闭环。


第二点,具身智能将开启新的交互窗口。信息时代用 PC 做交互,智能手机则可以通过语言、触屏等形式交互。具身智能是第三个窗口,也是革命级的窗口。它可以跨越接触介质,没有交互门槛,你可以用语言、手势甚至眼神等完成交互。


第三点,它是一个全新的平台。信息技术、模型技术、机器人技术都不是今天才有的,当这些技术在平台上叠加起来,就会出现非常多的商业模式,从而大幅影响社会和每个人的生活。有人担心未来不会用 AI 会失业,但这一波 AI 浪潮是以自然语言为基础的,会说话就可以使用 AI 。无人驾驶就是具身智能带来新商业模式的典型代表,萝卜快跑开启了无人驾驶的商业模式,但它并不会取代网约车司机、出租车司机的工作,车还是司机的,只是解放了司机的生产力,让他们找到新的工作方式、工作模式。


基于以上三点,我们看到具身智能是新范式、新入口、新平台,社会上已经衍生了一些新模式,它是一个很确定的趋势。


工业和信息化部也提出到 2025 年,我国人形机器人创新体系要初步建立,在关键技术取得突破。今年以来,多地出台了支持人形机器人产业发展的政策,北京、浙江、广东、四川更是成立了人形机器人产业创新中心,推动行业发展。


科技行业讲究第一性原理,任何工业革命级的创新都会有先驱者。特斯拉已经在做端到端的机器人,并将机器人用到自己的工厂里,国内一些头部具身智能厂商也在逐步探索商业道路和闭环方式。确定性的行业趋势,国家政策的支持和行业的落地探索进展,都让我们相信具身智能的发展未来。


InfoQ:具身智能会不会像元宇宙一样热度过了就消沉了?


杨震技术炒作现象有时是因为时候未到,或发展关键元素不齐备,导致不能充分落地和发挥作用。 机器人技术已发展多年,但过去使用场景并不广泛,当时的机器人是由规则控制的,协同技术不完善,没有学习能力,只能完成固定任务。如工业自动化通过设定量和阈值来控制,机械手只能做固定动作,任务复杂度越高,出问题概率就越大。生成式人工智能大模型的出现弥补了上述缺点,机器人能具备自纠错能力,如人形机器人在行走过程中踉跄后能自行站稳,这为机器人执行复杂任务奠定了技术基础。


世界机器人大会上,我们看到多家具身智能厂商展示了落地场景,智能搬运、智能质检、螺丝拧紧、零件安装、水果采摘等,奔驰、宝马等车企也开始在自家工厂里采用人形机器人,具身智能具备了商业闭环的可能。


未来随着专有场景出现,机器人可执行的动作、功能不断增加、完善,针对某一具体功能或能在多个场景复用的人形机器人的成本会快速下降。而当机器人的成本降低后,B 端企业、C 端用户会愿意接纳、尝试机器人。


此外,随着我国逐步进入老龄化社会,机器替人的需求将长期存在。以老人看护场景为例,年轻人需要工作,心有余而力不足,看护场景也不是一个人就能完成的,这就需要具身智能快速理解场景,实现落地。因此,我们不认为具身智能是一个短期炒作的领域。

具身智能行业如何破局和成长?


InfoQ:具身智能行业想要实现破局,需要哪些抓手?


杨震:无人驾驶出租车走上街头对具身智能赛道的发展是非常好的信号。无人驾驶需在完全开放的环境中运行,会受到不确定性因素的干扰。而具身智能将落地的工厂、家庭场景,环境都相对封闭和稳定,不确定因素有限。无人驾驶这么难的场景都已经落地了,具身智能的落地只会更容易一些。


多模态大模型等技术可以推动具身智能的落地,让模型去认知世界所有的变量和不变量,让具身智能学习专业技能并运用。但具身智能真正实现落地还缺了两个部分,一是让具身智能快速落地的先行场景,二是数据积累。 这两点既是具身智能产业发展的卡点,也是行业破局的关键。


InfoQ:具身智能产业上游核心技术组件的可靠性、稳定性、成本问题怎么解决?


杨震:感知单元、控制单元、决策单元等上游核心技术发展得很快,且国内外技术发展非常同步。只是在大规模量产前,人形机器人的零部件,像感知端的一些高端传感器等组件的成本还比较高,存在可靠性、稳定性问题。我们认为可以尝试沿途下蛋的方式,不断在小场景落地,用一些功能没那么完整甚至和人形差异较大的机器人,把场景和需求跑起来,不断打磨核心组件的可靠性、稳定性,将成本逐渐降下来。


InfoQ:具身智能的智能模型和本体硬件未来是否会一体化?


杨震:具体要看本体要承载的功能是什么。一个需具备泛化多功能能力的人形机器人,在处理复杂、需要频繁判断和决策的任务时,可能需要边缘云的介入。但如果只是相对简单的任务,不需要高频决策支持,如特定场景的炒菜机器人,小模型就可以做非常多的事情。

北电数智在行业发展中扮演怎样的角色?


InfoQ:从北电数智的角度出发,可以为整个生态圈的链接、繁荣做哪些事情?


杨震:人工智能是第四次工业革命的标志,它对整个科技链条及其运作模式产生重塑效果。当人工智能方兴未艾时,我们需要审视整个科技链条,找到卡点和难点,把整个链条串起来,让它能够真正形成闭环,让产业能够快速成长和繁荣起来,作为人工智能时代的基础设施建设者,我们正致力于成为人工智能的产业加速器。


具身智能赛道,有一类公司主要生产机器人,比如人形机器人本体、四足机器人或者灵巧手公司。另一类公司是模型公司,做底座大模型、自然语言大模型,赋予机器人感知、思考、决策的能力,可以想象成大脑;要操纵机器人精准地执行动作还需要小脑,很多机器人大模型公司在做小脑的事情。但即便机器人有了很好的判断能力、运动能力,想要真正进入千行百业,还需要一些专业技能,这就需要开发团队在具体应用场景中训练它的专业技能


如果想把这几层有效地连接起来,需要开放的训练场,要有一些具体场景。人工智能时代数据是最重要的,我们也看到在具身智能模型的训练中,无论是模拟仿真训练,还是远程操作示教,机器人数据都非常稀缺,数据的采集成本也非常高。例如特斯拉招聘的数据收集员,带上 VR 眼镜做一些任务来采集数据,每小时工资就要 48 美元。


我们做的事情首先是搭台子,让大家能够组团。其次是提供场景,把数据采集成本降下来,让产业链条上的本体公司、小脑公司和开发者团体形成自己的闭环。 这是具身智能产业快速发展的关键。


北电数智坚持中立的理念,我们不生产芯片,而是非常中立地把各种算力集合在一起,让它们能够协同作战。我们会广泛适配已有的底座模型、开发框架,让终端使用者、开发者找到自己的操作平台,落实到具身智能上。同样道理,我们既不生产本体,不生产小脑,也不训练它的专业技能。我们提供的是一个平台,希望平台能够把整个具身智能产业链上下游串接起来,让大家能够迅速组团,找到自己的最佳组合、最佳落地场景。


InfoQ:北电数智与生态合作伙伴已有哪些落地实践,可否给我们介绍 1-2 个案例?


杨震:上个月的全球数字经济大会期间,我们和中日友好医院达成合作,一起在医疗大模型和特有病种上做深度研究。我们看到,过往适应症研究、靶点研究主要采用机器学习方式训练,数据训练做得不是很好,动辄需好几年才能突破。在最新的案例中,可能 21 天就会有一个适应症的突破。


场景是具身智能产业链上下游伙伴发展起来的关键,也是大众能尽快享受具身智能的关键。我们希望在平台上将场景充分聚集起来,降低算力成本,为具身智能企业的发展提供沃土。与此同时,我们也会做好对数据安全的技术保障。


 InfoQ:展望未来,北电数智如何联合业内外合作伙伴一同推动具身智能的发展?


杨震:北电数智希望充分发挥 AI 基础设施建设者的优势,从算力、数采空间和边缘空间,到开发平台工具、训练场等,做好我们应做的工作,和整个产业链上下游的伙伴协同。我们会发挥优势,尽量链接到重要且能近期见效的场景,把场景放到训练场上,让行业里的优秀伙伴们能找到自己发挥的空间,让具身智能机器人能够快速落地实际的应用和案例,真正走到生产、生活中去。


 InfoQ:怎样成为北电数智的合作伙伴?


杨震:8 月 27 日,我们即将举办具身智能创新论坛,并宣布一些计划,包括联合实验室,以及针对开发者或初创公司的培知培育计划。我们也在建设北京数字经济算力中心,预计年底落成,这也是北京五环内唯一亿级的智算中心,将设置了人工智能企业的路演空间、交流空间甚至联合实验室,让人工智能企业能够展示自己的科技成果和想法。

活动预告


如何解决具身智能大规模、高质量训练数据的痛难点? 具身模型与算法更关注哪些维度?具身智能的商业化路径与落地场景将会是怎样?


8 月 27 日下午 14:00,「2024 具身智能创新论坛」将以“星火·点亮具身智能”为主题,邀请机器人本体公司、具身智能模型开发公司以及仿真训练场等领域代表,共同探讨具身智能破局的有效路径。如果你对这场活动感兴趣,欢迎扫描下方二维码,围观现场直播!



InfoQ,将在 08 月 27 日 14:00 直播

已预约

8 月 27 日 14:00,「2024 具身智能创新论坛」以“星火·点亮具身智能”为主题,欢迎围观见证!

视频号

2024-08-26 15:095997

评论

发布
暂无评论

行云创新亮相“OSCAR开源产业大会”:云调试加速应用创新

行云创新

30天读完300页,这份Alibaba面试通关手册,助我“闯进”字节跳动拿下offer

Java spring 编程 架构

区块链 ≠ 分布式存储

趣链科技

区块链 分布式 存储

Neuron v1.3.2 正式发布:新 logo、新界面、新可能

EMQ映云科技

边缘计算 网关 边缘流式数据 边云协同 emq

北鲲云探索医药研发,云计算再添新应用场景

北鲲云

Opus从入门到精通(三)手撸一个Opus编码程序

轻口味

音视频 9月日更 Andriod

代码的艺术

百度开发者中心

最佳实践 方法论 代码

阿里初面被两道编程题给干掉?,再次内推终上岸(已拿电子offer)

今晚早点睡

Java Alibaba

LDAP是什么意思?有什么用?

行云管家

运维 服务器 AD域 目录

Phaser类在性能测试中应用

FunTester

多线程 性能测试 测试框架 FunTester phaser

人民币突传大好消息,首款数字货币“官宣”了!

CECBC

隐私计算﹢区块链:让数据真正成为生产要素

CECBC

得偿所愿!字节4面斩下2-2Offer,入职就是30K16薪,相信你们也可以!

Java 程序员 字节跳动 面试 计算机

面试官:MySQL的幻读是怎么被解决的?

Java MySQL 编程 架构 后端

DDD实战分享-消息中心

麦麦

微服务 gRPC DDD 领域驱动设计DDD

博睿数据 短信服务监测解决方案专场直播

博睿数据

Growing 账号认证实践

GrowingIO技术专栏

spring security CAS SSO ldap

你真的了解Redis单线程为什么如此之快吗?

Linux服务器开发

数据库 redis 多线程 Linux服务器开发 单线程

字节4轮面试,拿43k*15 Offer!全靠过硬实力+1290题面试神技手册

Java 架构 面试 后端 计算机

基于MySQL binlog日志,实现Elasticsearch近实时同步实践

Java MySQL 编程 架构 计算机

做安全操作系统,这位技术老兵是认真的!

熵核科技

安全操作系统

聊聊汽车ECU中单片机开发

SOA开发者

车载控制单元

【等保三级】过等保三级需要哪些设备?大概多少钱?

行云管家

网络安全 信息安全 等保 堡垒机 等保三级

足以封神的SpringCloudAlibaba问世,看过的人都已经“登仙”了

Java 程序员 面试 springboot 计算机

滨海新区新的社会阶层人士开展“寻美.天津”主题活动

InfoQ 天津

【WIC•资讯】世界智能大会组委会秘书处祝贺 2021中国(天津)非公有制经济发展论坛圆满召开

InfoQ 天津

第1章-《Linux一学就会》-Linux课程介绍-学习环境搭建

学神来啦

Linux 运维 contos

模块八作业

Clarke

区块链技术,让数字政务跑出“加速度”

CECBC

智能汽车安全保障亟待加强,熵核科技助力“人车互联”

熵核科技

系统安全 自动驾驶安全

声网推出首个完整实时合唱解决方案 即将上线“咪哒”全国线下K歌房

声网

人工智能 音频体验

世界机器人大会风靡,具身智能如何落地?_AI&大模型_郑思宇_InfoQ精选文章