不久前,波士顿动力发布了一段视频,Atlas、Spot 和 Handle 在视频中跳着“Do You Love Me”。据视频描述,这是“庆祝我们希望这是一个更加快乐的一年的开始”。到截稿为止,这段视频已经被收看了将近 2400 万次,毫不奇怪,在技术力量和创意展示的惊人结合下,这段视频如此流行。
严格来说,视频中发生的事情并不是突破性的,从某种意义上说,我们没有看到任何一款机器人展现出全新的能力,但是这并不会影响到它给人的印象有多深刻——你所看到的是最先进的人形机器人技术、四足机器人技术,以及不管是什么鬼把手的机器人技术。
这段视频由波士顿动力制作,它的独特之处在于它的艺术元素,大多数都是通过舞蹈编导Monica Thomas的合作制作的(你可以在这里看到她的其他作品)。我们知道Atlas能做一些实际的任务,我们也知道它能做体操、跑酷,但跳舞肯定是新鲜的东西。
为进一步了解这些舞蹈机器人(舞蹈机器人比看上去要复杂得多),我们采访了波士顿动力的工程副总裁Aaron Saunders。
Saunders 从 2003 年开始在波士顿动力工作,这意味着他参与了波士顿动力大量机器人的研究和开发,甚至包括那些你可能已经忘记的机器人。举例来说,还记得LittleDog吗?这个可爱的小四足是由一个两人小组设计和制作的,Saunders 就是其中之一。
尽管从一开始他就参与了 Atlas 项目(并参与了波士顿动力的其他所有工作),Saunders 在过去几年中一直是 Atlas 团队的负责人,他非常友好地回答了我们有关他们舞蹈机器人的问题。
IEEE Spectrum: 你如何看待互联网上对这段视频的反应?
Aaron Saunders:我们对自己制作的视频有着不同的期望,而这段视频对我们来说绝对是立足于好玩的。YouTube 上的反应对我们来说是创纪录的。我们收到了几百封邮件、几百个电话,大家都在表达了自己的热情,也在分享自己的想法,我们下一步应该怎么做,歌曲如何,舞蹈如何,所以这真的让人觉得很有趣。
在我 94 岁的奶奶看了 YouTube 的视频后,我最喜欢的反应是,她通过家人发来消息,问我是否教过机器人那些可爱的动作。我认为这段视频可以吸引更多的观众,因为它把古老的音乐和新技术结合起来。
IEEE Spectrum:我们从来没见过 Atlas 做出这种动作,你能告诉我们你是怎么做到的吗?
Aaron Saunders : 我们首先与舞蹈演员和舞蹈编导合作,通过创作、组合一套舞蹈动作,形成舞蹈的初步概念;挑战之一可能是 Atlas 的核心挑战,尤其是调整人类的舞蹈动作,使之能够在机器人上表演。
为此,我们使用模拟技术对动作概念进行快速迭代,同时从舞蹈编导那里获取反馈信息,使 Atlas 有能力和速度执行的行为。它是一个非常重复的过程,它们会逐行跳出它们想让我们做的事情,而工程师则会看着屏幕说“这很容易”、“这很难”、“这让我害怕”。
接下来我们将讨论,尝试模拟中的不同之处,并通过调整找到一组可在 Atlas 上执行的兼容动作。
从整个项目来看,随着我们制作工具的进行,创作这些新舞蹈动作的时间越来越短,作为一个例子,我们最终可以用一天的时间,也就是我们拍摄前一天,来制作 Atlas 的芭蕾动作,并且获得成功。因此,它不是手写的,也不是手工编码的,而是一条管道,它允许你描述一组不同的动作,通过各种不同的输入,然后推动机器人完成。
IEEE Spectrum:在人类舞蹈中,有没有什么东西特别难以迁移到 Atlas?还是说 Atlas 能比人类做得更好?
Aaron Saunders : 在芭蕾部分,有些旋转的转体动作需要更多的迭代才能完成,因为它们距离我们所拥有的跳跃、奔跑和其他经验最远,因此它们用新的方式挑战机器和软件。当然,当你带着优秀运动员去做他们所做的事情时,我们不会低估他们的灵活性和力量,但对于机器人来说,这是个难题。
基本上,我不认为 Atlas 拥有运动员们所拥有的运动范围和力量,尽管我们继续朝这个方向发展机器人,因为我们相信,为了在商业上广泛使用这类机器人,并最终将其应用到家庭,我们认为机器人必须具备这样的性能。
机器人最擅长做的事情就是用同样的方法一遍又一遍地做着同样的事情。因此,一旦我们确定了我们想要做什么,当我们用不同的摄影角度拍摄时,机器人就能不停地重复这样做。
IEEE Spectrum:我能理解你如何用人类舞蹈演员来帮你和 Atlas 一起编排舞步,但是和 Spot,特别是和 Handle 一起编导舞步,是怎么做到的呢?
Aaron Saunders:在我看来,和我们一起工作的人们有很多思考运动的天赋,以及思考如何通过运动来表达自己。而且我们的机器人运动能力也很强:它们是动态的、激动人心的、平衡的。因此,我认为我们找到的是,舞蹈演员和机器人如何移动相关联,然后把它塑造成一个故事,无论它是两条腿还是四条腿,这并不重要。如果没有动物运动或者人类行为的模板,你只需更加努力地思考如何去做一些事情,同样也适用于更加务实的商业活动。
IEEE Spectrum:你教机器人跳舞,或者做体操,或者跑酷,这些经验对你的机器人商业应用方法有什么启示?
Aaron Saunders:我们认为,在舞蹈和跑酷中固有的技巧,比如敏捷、平衡和感知能力,是所有机器人应用的基础。或许更为重要的是,寻找构建新机器人能力与享受乐趣之间的交汇点,一直是波士顿动力在机器人领域取得巨大进展的秘诀。
举个例子,当你通过要求你的机器人在几天内做这些动态动作来挑战极限时,你就能了解到很多关于硬件健壮性的知识。通过产品化,Spot变得非常健壮,几乎不需要维护,只要你教它跳舞,它就能整天跳舞。而如今它之所以如此健壮,是因为我们从过去的事情中学到了很多经验教训,这些经验教训也许只是看起来怪怪的、有趣的。要进入未知的领域,了解自己不知道的东西。
IEEE Spectrum:看这类视频通常很难判断花费了多少时间来让事情按你所希望的方式运行,以及它们代表了机器人的实际能力。请你谈谈这个问题好吗?
Aaron Saunders:请允许我尝试回答这段视频中的问题,但是我想我们发布的所有视频都是一样的。我们尽力去做,一旦成功,就会成功。对 Atlas 来说,大多数的机器人控制存在于我们之前的工作中,就像我们在跑酷方面所做的那样,这使得我们能够利用模型预测控制器来解决动态和平衡问题。利用这些控制器,我们可以在机器人上完成一组舞蹈动作,这些舞蹈动作是我们与舞蹈演员和舞蹈编导一起设计的。因此,我们花了大量时间,数月去思考舞蹈,编排动作,并反复进行模拟。
舞蹈需要很大的力量和速度,因此我们甚至升级了一些 Atlas 的硬件,让它更有动力。舞蹈也许是我们迄今所做的最有力的事。虽然你可能会认为跑酷看起来更具爆发力,但是舞蹈的运动量和速度却令人难以置信。这也花费了几个月的时间;在机器中创建与算法相匹配的能力。
当我们得到最终的视频序列后,我们只拍了两天。大多数时间是用来研究如何在一组机器人的场景中移动摄像机,以录制一个连续的两分钟的镜头,尽管我们跑动了很多次,录制了很多次舞蹈,但我们仍然可以可靠地重复它。在开场的两分钟的镜头里,没有任何剪切和拼接。
当然,我们的机器人在硬件方面也存在一些故障需要维护,有时可能会磕磕绊绊地摔倒。这样的行为并不是为了产品化,也不是为了使产品变得百分之百可靠,但是它们肯定是可以重复的。我试着坦率地说出我们能做什么,而非我们曾经做过什么。当你说你已经取得了一些成就时,我感觉到你需要诚实,诚实对我们来说非常重要。
IEEE Spectrum:你说过 Spot 现在健壮到可以跳一整天的舞蹈了。Atlas 怎么样?如果你一直给它换电池,它也能整天跳舞吗?
Aaron Saunders:Atlas 仍然是一台机器,你知道……世界上只有少数的机器,它们非常复杂,可靠性并不是重点。当然,我们有时也会弄坏这个机器人。但是,在我们的工作中,硬件的坚固至关重要。要不是它的强健,我们根本做不出视频。在我看来,Atlas 更像是一架直升飞机,你需要花费更多的时间来维护和操作。而 Spot,我们的期望是它更像一辆车,在你需要维护它之前,你可以开很久。
IEEE Spectrum:在你教 Atlas 做新事情的时候, Atlas 有没有使用机器学习?假如没有,是什么原因?
Aaron Saunders:身为一家公司,我们已经探索了很多东西,但是 Atlas 还没有使用学习控制器。希望有朝一日我们也能做到。目前 Atlas 的舞蹈表演采用了我们常说的反射式控制(reflexive control),它结合了对力作反应、在线和离线轨迹优化以及模型预测控制。由于这些技术是实现真正高性能的可靠方法,并且我们知道如何更好地使用这些工具,所以我们利用这些技术。至于对它们能做些什么,我们还没有找到出路。
我们打算用学习来扩展和构建我们所开发的软硬件的基础,但是我想我们和社区仍然在努力寻找合适的地方来应用这些工具。你会发现这就是我们自然而然的发展过程。
IEEE Spectrum :目前, Atlas 的动态动作主要来自于它的下肢,但是跑酷也利用了上肢的力量和灵活性,我们已经看到了一些最近的概念图,显示 Atlas 正在进行跳马和引体向上。可以再告诉我们一些吗?
Aaron Saunders:人类和动物用它们的腿做一些令人惊奇的事,但是当它们用整个身体时,却做了更令人惊奇的事。跑酷为我们提供了一个奇妙的框架,使我们能够向全身运动的方向发展。步行和跑步只是这一旅程的开始。在过去的几年中,我们一直在研究更复杂的动态行为,如跳跃和旋转等。接下来的一步就是研究如何用手臂推动这个世界,从而扩大这个灵活性。
Atlas 团队的任务之一就是开始学习如何像使用腿一样使用手臂,从而增强和扩展我们的机动能力。我对 Atlas 在接下来的几年里的工作感到非常兴奋,因为它将为我们提供更多的机会去利用 Atlas 做一些令人兴奋的事情。
IEEE Spectrum :你如何看待液压驱动和电动驱动在高动态机器人中的作用?
Aaron Saunders:在我在波士顿动力的整个职业生涯中,我对许多不同类型的技术都充满了热情,但是现在我已经有了自己的想法,我并不认为这是一个非此即彼的问题。在驱动技术的选择上,我认为真正的决定因素是你所制造的机器人的尺寸,你想要这个机器人做什么,你想要它去哪里,以及其他很多因素。最终,最好能在你的工具箱中有这两种驱动技术,我喜欢使用这两种驱动技术,我们已经成功地将它们用于制造给人印象深刻的动态机器。
在我看来,液压驱动和电动驱动之间唯一的界限可能就是规模。生产小型液压设备确实是一项挑战,因为在工业中这些工作并不多见,而在工业中则更少出现大型电动设备。你可能会发现,这是这两种技术之间的一种天然区分。
IEEE Spectrum :除了你在波士顿动力的工作外,你对最近的机器人研究最感兴趣的是什么?
Aaron Saunders:对我们公司来说,我们非常乐意将注意力集中在传感、计算机视觉、地形学等技术上,这些技术越好,我们能做的就越多。就我个人而言,我喜欢集中研究操纵问题,特别是操纵研究,它可以帮助我们理解复杂的,基于摩擦的相互作用,例如滑动和推动,或者移动像绳索这样的柔性物体。
从简单地捏东西,提东西,搬东西,丢东西,到更有意义地与环境互动,我们看到了一个转变。我认为这类操作研究,将释放出移动操纵器的潜能,我认为这将真正开启机器人与世界进行大量互动的能力。
IEEE Spectrum :你还想让大家从这个视频中得到什么启示吗?
Aaron Saunders:就个人而言,我认为这是因为我花了大量时间投入到机器人领域,并深刻地认识到什么是机器人,它的能力和局限性,我强烈的愿望是让更多的人花更多的时间与它相处。
当人们在 YouTube 上观看我们的视频时,我们发现了许多观点和想法,在我看来,如果更多的人有机会去思考和了解机器人,花时间与它相处,那么这种新的理解水平将有助于他们想象出机器人在我们日常生活中有用的新方式。我觉得这些可能性非常激动人心,我只希望有更多的人能踏上这个旅程。
作者介绍:
Evan Ackerman,Automaton 特约编辑,IEEE Spectrums 获奖机器人博客 Automaton 的高级作家。自 2007 年以来,他已经写了 6000 多篇关于机器人技术和新兴技术的文章。
原文链接:
评论