写点什么

高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元

灵初智能

  • 2024-11-13
    北京
  • 本文字数:2728 字

    阅读完需:约 9 分钟

大小:1.38M时长:08:00
高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元

近日,灵初智能完成天使轮融资,本轮融资由高瓴创投(GL Ventures)和蓝驰创投(Lanchi Ventures)领投。


本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数据生成及采集、端到端解决方案的研发及落地,打造业界领先的通用灵巧操作智能体

 

产品老兵 &科学家密度最高


灵初智能创始人王启斌博士在手机、智能音箱、机器人领域有近 20 年的成功操盘经验,多次实现产品从定义、开发、到上市、再到全球化 0-1-N 的产业闭环,是一名深谙机器人商业化落地的“老兵”


联合创始人柴晓杰博士,在机器人及无人驾驶领域从业 15 年,擅长算法、仿真、工程、全栈技术,有 L4 产品落地的数据闭环经验是量产经验丰富的研发专家。

 

灵初智能还被称为“科学家密度最高”的具身智能公司。灵初与北京大学成立北大-灵初智能具身灵巧操作联合实验室,由人工智能研究院杨耀东博士担任联合实验室项目负责人开展横向课题合作。


杨耀东博士是强化学习领域的知名青年学者,他博士毕业于 UCL, 是现代深度强化学习的发源地。


杨耀东课题组在强化学习领域有系列重要成果,其中包括带领华人团队研发多体强化学习算法首登 Nature 机器智能子刊,带领华人团队获得 NeurIPS 2022 具身灵巧操作冠军等

 

同时,北大-灵初联合实验室将和梁一韬博士就具身智能体长程任务规划开展课题合作,梁博士长期致力于如何将知识注入机器学习中以提高其性能和泛化性,在开放环境 MineCraft 中取得系列重要成果。


他利用 LLM 实现复杂任务的拆解和规划,让大模型“缸中之脑“长出手脚,在具身场景中自主行动

 

在灵初北大联合实验室之外,公司联合创始人陈源培是一名痴迷机器人的 00 后天才少年,作为 Stanford 访问学者,他师从 Karen Liu 和李飞飞教授,曾在全球首次实现利用强化学习在真实世界同时控制双臂、双手多技能操作。


此外,来自上海交大人工智能学院的温颖副教授也是技术团队关键成员,温教授课题组曾推出多模态决策大模型 DB1,实现了对 DeepMind 通才决策 Gato 模型的超越,并引入了与现实世界相关的百余个场景任务,为实际业务需求提供了有力工具。

 

由产品老兵带队,携手密度最高的科学家团队,灵初智能组成了 7890 六边形战队,团队跨越了 70、80、90、00 的年龄梯度,是一支有技术、懂产品、能落地的全能团队。


就像他们擅长基于强化学习(RL)的具身智能类人操作一样,具有更领先的技术,更大的商业潜力,和更强的战斗力。


具身智能的“不可达三角”


高泛化性、高灵巧性和高成功率是具身智能的“不可达三角”


高泛化性指机器人在变化环境对不同物体执行复杂任务,高灵巧性体现在执行任务的精确灵活(如搭乐高、双手操作等),高成功率即机器人受干扰时稳定正确执行任务(产品验证阶段成功率 95%、规模化落地高于 99.9%)。


兼顾这三者极具挑战


高泛化性需通用模型和注重数据多样性的学习算法,高灵巧性需要精细模型和关注精度细节的学习算法及特定控制算法,鲁棒性也对控制算法有要求。


强化学习是提升具身智能体这三方面性能的核心技术,能让智能体在仿真环境利用低成本合成数据训练,实现自主探索、试错学习最优解,提升灵巧性甚至超越人类上限,还能增强鲁棒性。

 

灵初智能早期一直深耕基于强化学习的全栈能力,从灵巧操作入手在具身智能领域积累技术壁垒,后将扩展至通用泛化操作。


其开发的分层端到端模型领先业界,包含 Psi-P0 规划模型和 Psi-C0 控制模型。Psi-P0 借助大模型交互推理理解行为对环境影响,拆解复杂任务以实现任务泛化;


Psi-C0 模型为陈源培提出的双层架构,结合人类运动数据和深度强化学习,上层用人类数据训练参考轨迹生成器,下层用其生成轨迹指导强化学习训练,解决泛化性和灵巧性难题,这也是世界首次利用强化学习在现实中控制双臂双手多技能操作。

 

Psi-C0 控制模型支持多个技能串联作业的训练难题。陈源培与斯坦福大学共同提出的 Sequential Dexterity 通过串联多个灵巧操作策略来完成长程的任务。


在真实世界的搭积木任务中,能将翻找、重定向、抓取和插入积木 4 个 skill 串联起来提高整体的成功率。这也是世界上第一个基于强化学习实现了灵巧操作的长程任务,显示了多技能组合的泛化性。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    梁一韬博士开发的 Psi-P0 实现开放环境中复杂任务的任务拆解和规划。其所支持的任务复杂度和准确度都超越同期 OpenAI(VPT)和 Nvidia 的工作(Minedojo)。


    如下面视频所示,我们可以进一步通过构建 memory 使具身模型具有 lifelong learning,即根据自身经历自我提升的能力。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00

      (图说:在开放世界用不同工具进行类人的探索、建造和对抗)

       

      在产品规划上,灵初智能将从 2B 服务业切入,以头部客户的高价值场景需求为指引,开发整合技能集,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性,灵巧性和成功率,给出具身领域“不可达三角”的最优解。


      创始人和投资方寄语


      灵初智能创始人兼 CEO 王启斌表示:“非常感谢投资人的鼎力支持。我们这支集合工业界老兵和高密度科学家的战队,拥有完整的技术栈,将在具身智能的前沿打造软硬一体的综合解决方案,拓展在先进制造,商超物流及 2B 服务业等场景中的应用场景,快速实现数据闭环,商业化落地。在具身智能赛道的初纪元,期待和我们的合作伙伴灵性成长,共同开创智能未来。”

       

      高瓴创投(GL Ventures)项目负责人表示:“作为人工智能与现实世界的深度结合,具身智能行业前景广阔,且拥有引发各行各业深刻变革的巨大潜力。灵初智能凭借在强化学习和模仿学习方面的技术深耕和积累,在实现机器人灵巧性、泛化性和高成功率的‘不可达三角’挑战上已取得显著进展;创始团队汇聚多领域顶尖人才,不仅有卓越的技术背景,还兼备强大的工程化能力以及深厚的商业化实战经验。我们相信,在创始人王启斌博士带领下,灵初智能能够为行业带来革命性的应用与高效率的解决方案,实现技术突破与商业价值的共赢。”

       

      蓝驰创投(Lanchi Ventures)项目负责人表示:“具身智能机器人市场潜力巨大,我们认为通用操作能力执行复杂任务是具身智能落地的重要技术卡点。灵初团队是全球范围内在强化学习和具身模型方面顶尖的技术团队。此外,团队懂产业懂场景,具备底层技术架构能力和充分的产品落地经验和供应链优势。我们相信随着具身智能的技术逐步成熟、产业链与生态更加完善,具身智能机器人市场将迎来高速发展期。我们非常看好具身机器人在全球市场的发展潜力。”

       

      关于灵初智能:

      灵初智能公司的英文全称是 Proto-Sentient Intelligence,缩写为 PsiBot。Proto 就是“初”,有原初、先驱的意思,这和公司主打的以强化学习为优势的具身智能创新技术路线非常符合;Sentient 是“灵”,有智识、灵性的意思,代表了能一点点自主完成对世界认知和交互的类人操作。正如它的名字,灵初智能将凭借最前沿创新的技术让具身智能应用拥有灵性,开启机器人时代的初纪元。

      2024-11-13 15:378067

      评论

      发布
      暂无评论
      发现更多内容

      极限科技荣耀入选《中国数据库产业图谱(2024年)》,引领搜索与分析型数据库新篇章

      极限实验室

      信通院 极限科技 搜索型数据库 中国数据库产业图谱

      基于Java+SpringBoot+Vue美发门店管理系统设计和实现

      hunter_coder

      后端开发

      阿里云 EMR Serverless StarRocks OLAP 数据分析场景解析

      阿里云大数据AI技术

      大数据 数据分析 OLAP EMR

      基于Java+SpringBoot+Vue前后端分离癌症患者交流平台设计和实现

      hunter_coder

      后端开发

      PDF密码清除软件 Cisdem PDF Password Remover for mac v5.0.0激活版

      理理

      PDF pdf文件密码打不开 pdf密码清除

      Maplesoft Maple 2024 for mac/Win:专业的数学计算软件

      理理

      macOS 14 Sonoma系统下载安装 苹果最新14系统离线安装包

      Rose

      DataBuilder2.3.2重磅发布,核心功能全面升级,引领数据治理新高度!

      数造万象

      数据治理 数据资产 数据开发 DataOps 版本升级

      AI 大模型微调训练营毕业总结

      gigifrog

      id2024下载 Adobe InDesign 2024最新破解版【mac/win】

      理理

      InDesign 排版设计

      autodeskautocad2024序列号【mac/win】

      理理

      Autodesk AutoCAD 2024 cad2024序列号 AutoCAD2024破解版

      户外LED显示屏具备哪些性能?

      Dylan

      广告 LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家

      基于Java+SpringBoot+Vue旅游管理系统设计和实现

      hunter_coder

      后端开发

      基于Java+SpringBoot+Vue来访管理系统设计和实现

      hunter_coder

      后端开发

      Avid Sibelius Ultimate(西贝柳斯乐谱软件) v2023.8激活版 西贝柳斯终极解锁版下载安装

      理理

      【最新LR2023安装包】lightroom classic 2023-一键安装-永久使用-中文简体

      Rose

      基于Java+SpringBoot+Vue汽车服务管理系统设计和实现

      hunter_coder

      后端开发

      mac多媒体影音库:Emby for Mac 中文版下载

      你的猪会飞吗

      mac软件下载 mac破解软件下载

      设备指纹市场分析及未来展望

      芯盾时代

      终端安全 移动安全 风控系统

      AI视界周刊第 1 期:最具性价比 GPT-4o mini 发布、大模型集体失智、语言模型安全漏洞

      战场小包

      人工智能 行业资讯

      基于Java+SpringBoot+Vue前后端分离毕业论文管理系统设计和实现

      hunter_coder

      后端开发

      macs fan control pro中文破解版下载(macs fan control pro序列号)

      理理

      实战攻略:如何用 TDengine 轻松搞定时序数据建模

      TDengine

      MATLAB R2023a中文版安装教程 MATLAB许可证密钥分享 Mac/win

      Rose

      数学软件 MATLAB R2023b破解版 MATLAB 密钥 MATLAB 安装教程

      基于Java+SpringBoot+Vue前后端分离毕业就业信息管理系统设计和实现

      hunter_coder

      后端开发

      基于Java+SpringBoot+vue前后端分离保信息学科平台系统设计实现

      hunter_coder

      后端开发

      Microsoft Remote Desktop v10.9.5中文直装版 微软远程工具

      理理

      4K Video Downloader Plus Pro for Mac(4K视频下载器)v1.8.0激活版

      理理

      Navicat Premium软件下载 Navicat Premium中文版 跨平台数据库软件

      理理

      强大的BT下载工具 uTorrent for Mac 体积小,安装速度超快

      理理

      BT下载工具 uTorrent

      法律服务机构启用电子签章网上签署法律文书,省时省力提效率

      Geek_2a38d5

      高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元_AI&大模型_InfoQ精选文章