HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元

灵初智能

  • 2024-11-13
    北京
  • 本文字数:2728 字

    阅读完需:约 9 分钟

大小:1.38M时长:08:00
高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元

近日,灵初智能完成天使轮融资,本轮融资由高瓴创投(GL Ventures)和蓝驰创投(Lanchi Ventures)领投。


本轮融资完成后,灵初智能将继续推进基于强化学习算法的机器人技能集训练、场景化的数据生成及采集、端到端解决方案的研发及落地,打造业界领先的通用灵巧操作智能体

 

产品老兵 &科学家密度最高


灵初智能创始人王启斌博士在手机、智能音箱、机器人领域有近 20 年的成功操盘经验,多次实现产品从定义、开发、到上市、再到全球化 0-1-N 的产业闭环,是一名深谙机器人商业化落地的“老兵”


联合创始人柴晓杰博士,在机器人及无人驾驶领域从业 15 年,擅长算法、仿真、工程、全栈技术,有 L4 产品落地的数据闭环经验是量产经验丰富的研发专家。

 

灵初智能还被称为“科学家密度最高”的具身智能公司。灵初与北京大学成立北大-灵初智能具身灵巧操作联合实验室,由人工智能研究院杨耀东博士担任联合实验室项目负责人开展横向课题合作。


杨耀东博士是强化学习领域的知名青年学者,他博士毕业于 UCL, 是现代深度强化学习的发源地。


杨耀东课题组在强化学习领域有系列重要成果,其中包括带领华人团队研发多体强化学习算法首登 Nature 机器智能子刊,带领华人团队获得 NeurIPS 2022 具身灵巧操作冠军等

 

同时,北大-灵初联合实验室将和梁一韬博士就具身智能体长程任务规划开展课题合作,梁博士长期致力于如何将知识注入机器学习中以提高其性能和泛化性,在开放环境 MineCraft 中取得系列重要成果。


他利用 LLM 实现复杂任务的拆解和规划,让大模型“缸中之脑“长出手脚,在具身场景中自主行动

 

在灵初北大联合实验室之外,公司联合创始人陈源培是一名痴迷机器人的 00 后天才少年,作为 Stanford 访问学者,他师从 Karen Liu 和李飞飞教授,曾在全球首次实现利用强化学习在真实世界同时控制双臂、双手多技能操作。


此外,来自上海交大人工智能学院的温颖副教授也是技术团队关键成员,温教授课题组曾推出多模态决策大模型 DB1,实现了对 DeepMind 通才决策 Gato 模型的超越,并引入了与现实世界相关的百余个场景任务,为实际业务需求提供了有力工具。

 

由产品老兵带队,携手密度最高的科学家团队,灵初智能组成了 7890 六边形战队,团队跨越了 70、80、90、00 的年龄梯度,是一支有技术、懂产品、能落地的全能团队。


就像他们擅长基于强化学习(RL)的具身智能类人操作一样,具有更领先的技术,更大的商业潜力,和更强的战斗力。


具身智能的“不可达三角”


高泛化性、高灵巧性和高成功率是具身智能的“不可达三角”


高泛化性指机器人在变化环境对不同物体执行复杂任务,高灵巧性体现在执行任务的精确灵活(如搭乐高、双手操作等),高成功率即机器人受干扰时稳定正确执行任务(产品验证阶段成功率 95%、规模化落地高于 99.9%)。


兼顾这三者极具挑战


高泛化性需通用模型和注重数据多样性的学习算法,高灵巧性需要精细模型和关注精度细节的学习算法及特定控制算法,鲁棒性也对控制算法有要求。


强化学习是提升具身智能体这三方面性能的核心技术,能让智能体在仿真环境利用低成本合成数据训练,实现自主探索、试错学习最优解,提升灵巧性甚至超越人类上限,还能增强鲁棒性。

 

灵初智能早期一直深耕基于强化学习的全栈能力,从灵巧操作入手在具身智能领域积累技术壁垒,后将扩展至通用泛化操作。


其开发的分层端到端模型领先业界,包含 Psi-P0 规划模型和 Psi-C0 控制模型。Psi-P0 借助大模型交互推理理解行为对环境影响,拆解复杂任务以实现任务泛化;


Psi-C0 模型为陈源培提出的双层架构,结合人类运动数据和深度强化学习,上层用人类数据训练参考轨迹生成器,下层用其生成轨迹指导强化学习训练,解决泛化性和灵巧性难题,这也是世界首次利用强化学习在现实中控制双臂双手多技能操作。

 

Psi-C0 控制模型支持多个技能串联作业的训练难题。陈源培与斯坦福大学共同提出的 Sequential Dexterity 通过串联多个灵巧操作策略来完成长程的任务。


在真实世界的搭积木任务中,能将翻找、重定向、抓取和插入积木 4 个 skill 串联起来提高整体的成功率。这也是世界上第一个基于强化学习实现了灵巧操作的长程任务,显示了多技能组合的泛化性。


00:00 / 00:00
    1.0x
    • 3.0x
    • 2.5x
    • 2.0x
    • 1.5x
    • 1.25x
    • 1.0x
    • 0.75x
    • 0.5x
    网页全屏
    全屏
    00:00


    梁一韬博士开发的 Psi-P0 实现开放环境中复杂任务的任务拆解和规划。其所支持的任务复杂度和准确度都超越同期 OpenAI(VPT)和 Nvidia 的工作(Minedojo)。


    如下面视频所示,我们可以进一步通过构建 memory 使具身模型具有 lifelong learning,即根据自身经历自我提升的能力。


    00:00 / 00:00
      1.0x
      • 3.0x
      • 2.5x
      • 2.0x
      • 1.5x
      • 1.25x
      • 1.0x
      • 0.75x
      • 0.5x
      网页全屏
      全屏
      00:00

      (图说:在开放世界用不同工具进行类人的探索、建造和对抗)

       

      在产品规划上,灵初智能将从 2B 服务业切入,以头部客户的高价值场景需求为指引,开发整合技能集,实现商业落地,并快速迭代硬件,算法,数据系统,不断提升具身智能整体解决方案的泛化性,灵巧性和成功率,给出具身领域“不可达三角”的最优解。


      创始人和投资方寄语


      灵初智能创始人兼 CEO 王启斌表示:“非常感谢投资人的鼎力支持。我们这支集合工业界老兵和高密度科学家的战队,拥有完整的技术栈,将在具身智能的前沿打造软硬一体的综合解决方案,拓展在先进制造,商超物流及 2B 服务业等场景中的应用场景,快速实现数据闭环,商业化落地。在具身智能赛道的初纪元,期待和我们的合作伙伴灵性成长,共同开创智能未来。”

       

      高瓴创投(GL Ventures)项目负责人表示:“作为人工智能与现实世界的深度结合,具身智能行业前景广阔,且拥有引发各行各业深刻变革的巨大潜力。灵初智能凭借在强化学习和模仿学习方面的技术深耕和积累,在实现机器人灵巧性、泛化性和高成功率的‘不可达三角’挑战上已取得显著进展;创始团队汇聚多领域顶尖人才,不仅有卓越的技术背景,还兼备强大的工程化能力以及深厚的商业化实战经验。我们相信,在创始人王启斌博士带领下,灵初智能能够为行业带来革命性的应用与高效率的解决方案,实现技术突破与商业价值的共赢。”

       

      蓝驰创投(Lanchi Ventures)项目负责人表示:“具身智能机器人市场潜力巨大,我们认为通用操作能力执行复杂任务是具身智能落地的重要技术卡点。灵初团队是全球范围内在强化学习和具身模型方面顶尖的技术团队。此外,团队懂产业懂场景,具备底层技术架构能力和充分的产品落地经验和供应链优势。我们相信随着具身智能的技术逐步成熟、产业链与生态更加完善,具身智能机器人市场将迎来高速发展期。我们非常看好具身机器人在全球市场的发展潜力。”

       

      关于灵初智能:

      灵初智能公司的英文全称是 Proto-Sentient Intelligence,缩写为 PsiBot。Proto 就是“初”,有原初、先驱的意思,这和公司主打的以强化学习为优势的具身智能创新技术路线非常符合;Sentient 是“灵”,有智识、灵性的意思,代表了能一点点自主完成对世界认知和交互的类人操作。正如它的名字,灵初智能将凭借最前沿创新的技术让具身智能应用拥有灵性,开启机器人时代的初纪元。

      2024-11-13 15:377763

      评论

      发布
      暂无评论

      前端是靠什么起家的?

      伤感汤姆布利柏

      BBEdit for Mac(HTML文本编辑器)

      Mac相关知识分享

      茶思屋直播|TinyEngine+AI:聚焦主航道,在实践中探索低代码技术黑土地

      OpenTiny社区

      低代码 OpenTiny TinyEngine

      数据驱动新时代:数据飞轮如何唤醒中台潜能

      不叫猫先生

      大数据 数据中台 数据仓库 数据飞轮

      谷歌云推出全新区块链RPC服务:简化Web3开发

      区块链软件开发推广运营

      交易所开发 dapp开发 区块链开发 公链开发 代币开发

      Node.js 扩展N-API 和应用场景

      PingCode研发中心

      node.js 应用场景

      用户需求瞬息万变?游戏直播平台快速开发应对方案

      软件开发-梦幻运营部

      从数据仓库到数据飞轮:数据技术演进的探索与思考

      不叫猫先生

      数据中台 数据仓库 数据 数据飞轮

      阿里巴巴搜索API返回值:电商市场竞争的新武器

      技术冰糖葫芦

      API Gateway API 接口 API 测试 pinduoduo API

      tair性能挑战赛攻略心得-Zzzzz

      阿里云天池

      离散制造 vs 流程制造:锚定精准制造未来,从装配线到化学反应,实时数据集成在制造业案例中的多维应用

      tapdata

      数据库

      什么是任务管理工具

      高端章鱼哥

      TikTok直播专线服务商推荐

      Ogcloud

      海外直播专线 tiktok直播 tiktok直播专线 tiktok直播网络 TikTok跨境直播

      万界星空科技MES系统:食品加工安全的实时监控与智能管理

      万界星空科技

      mes 万界星空科技 食品MES 食品行业 食品

      Flink垃圾图片分类优胜奖比赛攻略_贪吃的小香猪-148队

      阿里云天池

      C++中对象的延迟构造

      快乐非自愿限量之名

      Java c++

      fetch --nohooks webrtc 失败

      webrtc developer

      Multitouch for Mac(多点触控手势增强神器)

      Mac相关知识分享

      反DDD模式之关系型数据库

      EquatorCoco

      数据库 DDD

      TON基金会与Curve Finance合作:推出基于TON的新型稳定币互换项目

      区块链软件开发推广运营

      交易所开发 dapp开发 链游开发 NFT开发 公链开发

      TikTok怎么开直播?TikTok直播专线是什么?

      Ogcloud

      海外直播专线 tiktok直播 tiktok直播专线 海外直播网络 tiktok直播网络

      阿里巴巴API助力电商:商品详情获取与数据驱动的完美结合

      技术冰糖葫芦

      API Gateway API 接口 API 测试 pinduoduo API

      Java获取Object中Value的方法

      快乐非自愿限量之名

      Java

      VLDB 2024 圆桌会议回顾:展望物联网与 AI 时代的时序数据库

      Apache IoTDB

      VLDB 2024 圆桌会议回顾:展望物联网与 AI 时代的时序数据库

      Apache IoTDB

      火山引擎数智平台:高性能ChatBI的技术解读和落地实践

      字节跳动数据平台

      大数据 BI 数据可视化 大模型 ChatBI

      Java读取寄存器数据的方法

      不在线第一只蜗牛

      Java 数据库

      什么是任务管理工具

      爱吃小舅的鱼

      华瑞指数云ExponTech与崖山科技达成战略合作,共筑国产数据库新生态

      科技热闻

      四类取整方式

      不在线第一只蜗牛

      c++ C#

      低代码开发:数据分析如何快速响应企业需求

      EquatorCoco

      低代码

      高瓴、蓝驰领投灵初智能,强化学习开启具身智能初纪元_AI&大模型_InfoQ精选文章