整理 | 华卫、核子可乐
乒乓球的影响力早已不必多言,每一代国人都有着自己的国乒记忆。这个夏天,在 2024 巴黎奥运会人们又见证更多国乒名场面。最新赛绩是,中国乒乓男团和女团均晋级巴黎奥运会决赛。
8 月 9 日,DeepMind 的研究人员公布了首款能够与人类业余水平对抗的 AI 机器人乒乓球手,该系统将 ABB IRB 1100 工业机械手臂与 DeepMind 的定制 AI 软件结合起来。虽然人类专业运动员仍然更胜一筹,但该系统仍展示出机器在处理复杂物理任务时的瞬间决策与强大适应能力。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
而自十年前以来,乒乓球就在对机器人手臂进行基准测试方面发挥了关键作用,因为这项运动需要速度、反应能力和策略等。
研究人员在 arXiv 上发表的预印本论文中写道,“这是第一款能够与人类水平相比肩的运动机器人智能体,代表着机器人学习与控制领域的又一个里程碑。”
预印本论文链接:https://arxiv.org/abs/2408.03906
据了解,这款尚未正式定名的乒乓球机器人智能体(我们建议称之为“AlphaPong”)由包括 David B. D'Ambrosio、Saminda Abeyruwan 和 Laura Graesser 在内的研究团队开发而成,并且在与不同技能水平的人类选手开展一系列对抗中表现出色。在一项涉及 29 名参与者的研究当中,这款 AI 机器人成功拿下 45%的胜率,展现出扎实的业务级别球技。
更值得注意的是,它在与初学者的比赛中取得了 100%的胜率,在与中级选手的比赛中胜率同样达到 55%。然而,它还没有准备好与专业人士抗衡,在与高级选手对抗时每次都会输。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
谷歌 DeepMind 视频显示了 AI 智能体与人类乒乓球运动员的对决画面。
有网友这样评价谷歌的乒乓球机器人,“四年后,它应该代表美国参加奥运会。”也有网友质疑其能力,表示“作为一名拥有 30 多年乒乓球 经 验 的 终 身 运 动 员 , 我 怀 疑 目 前 这 款 机 器 人 能 否 从 我 这 里 拿 下 一 分 。 ”
能与各级选手对打,自适应输出乒乓球战术
乒乓球是一项对体力要求很高的运动,需要人类运动员经过多年的训练才能达到高水平的熟练程度。
据介绍,AlphaPong 的物理配置包括之前提到的 IRB 1100,这是一台 6 自由度机械臂,安装在两条线性轨道之上,使其可以在 2D 平面上自由移动。另有高速摄像机用于跟踪球的位置,而动作捕捉系统则负责观察人类对手的球拍动作。
为了建立起能够驱动机械臂的主脑,DeepMind 研究人员开发出一种两级方法,使得机器人能够执行特定的乒乓球战术,同时根据每位对手的打法实时调整其策略。换句话说,它具有足够的适应性,可以与任何业余级别的乒乓球选手比赛,而无需针对不同球员的情况接受特定训练。
该系统的架构将底层技能控制器(经过训练以执行特定乒乓球技术,例如正手击球、反手回球或者接发抢攻)与高级战略决策器(一种更为复杂的 AI 系统,能够分析比赛状态、适应对手风格,并针对每个来球选择激活相应的底层技能策略)结合起来。
研究人员表示,AlphaPong 的关键创新点之一在于 AI 模型的具体训练方法。据介绍,他们选择了一种混合方法,在模拟物理环境中使用强化学习,同时将现实世界的实例作为训练数据来源。这种技术使得机器人能够从约 1.75 万种真实存在的乒乓球飞行轨迹中学习——对于一项复杂的任务来说,这样的数据集确实相当袖珍了。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
谷歌 DeepMind 视频展示了 AI 智能体如何分析人类选手。
研究人员还使用迭代过程以完善机器人的技能,从小批量人机对战数据集起步,之后再让 AI 与真实对手较量。并且,每场比赛都会生成关于小球飞行轨迹与人类策略的新数据,团队将这些数据反馈到模拟当中以开展进一步训练。
据介绍,该机器人在模拟环境中进行训练时,可以准确地模拟乒乓球比赛的物理特性。一旦部署到现实世界中,它就会收集有关其与人类相比的性能数据,以在模拟中改进其技能,并创建一个连续的反馈循环。
- 3.0x
- 2.5x
- 2.0x
- 1.5x
- 1.25x
- 1.0x
- 0.75x
- 0.5x
整个过程重复了七个周期,使得机器人能够不断适应越来越熟练的对手和更加多样化的比赛风格。到最后一轮,AI 已经从超过 1.4 万个对拉球与 3000 次发球中学习,积累下大量乒乓球知识,帮助其弥合了模拟与真实场景之间的差距。
有趣的是,英伟达也一直在试验类似的模拟物理系统。以 Eureka 为例,这套系统允许 AI 模型快速在模拟空间、而非现实世界当中学习控制机械臂。在模拟当中加速物理效应,甚至能够同时开展数千次试验,这种方法有望大大减少未来机器人训练中复杂交互所耗费的大量时间和资源。
被人类选手所喜爱,但因局限性不敌高水平球员
除了对战技术成就之外,谷歌的这项研究还探索了人类与 AI 选手之间的对抗体验。令人惊讶的是,哪怕是输给了乒乓球机器人智能体,人类选手仍然表示非常享受这种比赛体验。
研究人员指出,“在所有技能组和胜率情况下,人类选手都表示与机器人对战既‘有趣又引人入胜’。”这种积极的反响,表明 AI 在体育训练和娱乐方面或有着广阔的潜在应用空间。
当然,这套系统也有自己的局限性,其在处理速度极快的球及高球方面表现不佳,且难以发现剧烈的球体旋转,在反手比赛中表现较弱。谷歌 DeepMind 还分享了一段演示视频,其中显示 AI 智能体由于很难对快速回球做出反应而被高水平球员成功拿下一分。
不过,谷歌 DeepMind 研究团队也正在优化解决这些不足之处。以下是其计划解决快球问题的方法:“为了解决阻碍机器人对快球反应时间的延迟限制,我们建议研究先进的控制算法和硬件优化,可能包括探索预测模型来预测球的轨迹,或者在机器人的传感器和执行器之间实现更快的通信协议。”
谷歌 DeepMind 研究团队强调,随着成果的进一步完善,他们相信该系统未来有望与高水平乒乓球运动员一较高下。在开发能够击败人类选手的 AI 模型方面,DeepMind 可谓是经验丰富,包括之前围棋界的大魔王 AlphaZero 与 AlphaGo。国际象棋与智能问答的桂冠已经落入了人工智能手中,也许乒乓球就是下一个目标。
研究人员还表示,这位机器人乒乓球“神童”的影响绝不仅限于乒乓球领域,其潜在应用范围很大。为该项目开发出的技术,完全可以应用于各种需要快速反应并适应人类不可预测行为的机器人任务,包括制造业和医疗保健。
参考链接:
评论