写点什么

从再三拒绝到带头研发,Meta CTO “真香”:我曾觉得 VR/AR 是个大坑,是小札“疯了”

  • 2024-10-08
    北京
  • 本文字数:13370 字

    阅读完需:约 44 分钟

大小:6.40M时长:37:16
从再三拒绝到带头研发,Meta CTO “真香”:我曾觉得VR/AR是个大坑,是小札“疯了”

Meta 近期发布的 AR 头显 Orion 赢得了一片赞誉。发布后,Meta 首席技术官 Andrew Bosworth (AB)在最近接受 Ben Thompson(BH)时谈到了他在 Meta 的工作历程,同时回应了不少争议问题,包括 Meta 公司需要尽快让大家看到 Orion,以此为证明自己在 Reality Labs 身上砸下的数十亿美元物有所值。


AB 谈到了 AI 在其中的作用:在 AR 方面,AI 确实是最核心的技术,在混合现实和虚拟现实方面,AI 更多扮演的是启动器的角色。他还谈了与苹果之间的竞争,他即认为苹果的投入赢得了市场关注,但也对他们把手机和设备锁定得太狠。


下面是访谈的原文,我们在不改变愿意基础上进行了删减,以飨读者。

扎克伯格,曾经的学生、现在的老板


BH:你当初为什么会选择从事科技行业?


AB:我在湾区长大,科技一直是我个人生活中的组成部分。有趣的是,我在湾区南部的一个马场长大,所以可能跟很多朋友猜想的不一样,来自那种农业企业家的家庭。农民之间做交易的方式很简单,“嘿,你有马匹要卖吗?”“好啊,我们这边是粪肥太多了,那咱们就相互交换吧。”做生意不就是在互通有无嘛,所以我对创业之类的事情很感兴趣。


硅谷是个独特的地方。我上高中的时候去过那里,当时参观的是 Silicon Graphics 和惠普公司,这些地方都很酷。但实际上,电子游戏最后让我下定了学习计算机科学的决心——特别是《合金装备》,玩过它之后我下定决心要搞人工智能。那是第一款拥有半智能 AI 设计的游戏作品。虽然按今天的标准,它的效果远远算不上智能,但在当时 MGS3 绝对是震惊业界的作品。


所以我去了哈佛大学读本科,在那里学习计算机科学,但主业其实是计算神经生物学。回想起来,在学校里学到的所有东西当中,最重要的经历就是我大四那年担任一门课程的助教——人工智能入门。随机分配之下,我阴差阳错地遇上了一名学生、也是我现在的老板,马克·扎克伯格。


BH:我记得你教过马克·扎克伯格,但总是搞混具体时间,因为我又记得你好像没在学校正式任过教。


AB:确实没有正式任教,当时我是大四的学生,而他正在读大二。在数学和计算机科学专业里,本科生负责教授一门课程其实挺常见的。因此教授每周会讲两到三天课,同一门课程的其余部分则由一名本科生负责——教材是完全相同的,但本科生时间更多,所以能给出更详尽的解答,还会给作业评分、组织考试等等。总之,我在大二和大三的时候都教过计算机科学入门课 CS50,并且在大四的时候成为 CS182 的首席教学研究员,跟着教授 David Parkes。


扎克伯格是被随机分到我课上的。顺带一提,很多教过我的人后来也成了 Facebook 的早期工程师,大家彼此之间有着奇妙的师生缘分。


BT:现在你担任 CTO 了,大家应该是相处得比较融洽吧?


AB:没错,之前我曾经在微软工作了大概 15 个月。时间不长,期间我开发出一款名为 Visio 的出色软件。还有 ShapeSheet,只是产品质量虽好,但却没有得到市场的广泛认可。


我很享受在微软的时光。我的顶头上司很棒,工作环境也很舒适。但突然有一天,我收到了 Facebook 招聘人员发来的 AOL 私信,对方说“嘿,过来试试呗。”我琢磨着这就像一段免费的探亲之旅,毕竟那边离我的老家湾区很近。所以我一冲动就跑了过去,之后意外被扎克伯格和他团队的宏大愿景震撼。我亲眼见识过他的团队,特别是 Jeff Rothschild,一切都令人印象深刻、难以忘怀。


BT:有意思。所以你们在哈佛大学甚至是进入 Facebook 之前关系都不算近。一直到加入 Facebook,你跟扎克伯格都只能算是点头之交。**


AB:是的。我是 Facebook 的第 1681 号用户,而扎克伯格是 4 号用户。我觉得从技术上讲,前三个应该是测试账户,所以实际编号应该再减去 3。总之我们相互认识,但关系并不算密切。


后来他告诉我,当时招聘人员问过他对新人的需求,他说“我想做这个项目”,也就是后来的 News Feed。他的要求是“一个懂 AI 的人,你们有什么推荐吗?”招聘人员说“我倒是想起一个”,于是跑来找到我。大家最终一拍即合。


Meta 首席产品官 Chris Cox 和我坐在一起,就是跟他一起混多了,我才会秃头。他负责开发前端,我负责开发后端,Ruchi Sanghvi 是产品经理,我们共同打造出了 News Feed。这项工作始于 2006 年 1 月 9 号,当时我刚刚过完 24 岁生日。


BT:我一直很关注企业的早期发展阶段,期间甚至可能会激怒用户,真的会有人打着横幅到办公室外面抗议。


AB:确实,我们都经历过。


BT:你们坚持了下来,第一次遭遇大量抗议时也没有妥协。这到底是顺势而为,还是说真的顶住压力、告诉自己“这是对的,必须坚持下去”?


AB:我很清楚自己需要坚持什么,又面临怎样的压力。如果你当时也跟我们一样经常使用 Facebook 的产品,就会发现它首先是一款面向大学生的校园类软件。而我自己也读过大学,就是这款产品的核心受众,所以我始终相信自己的选择就是正确答案。


但产品发布时确实出了不少问题。我总爱打个比方,就像大家都聚在一场派对上,现场很吵。可就在我们跟某人说话的瞬间,音乐突然停止了。这时候就很尴尬,我们不知道到底要不要把这句话说完。基本上,使用 Facebook 产品的上千万用户就是这种情况,也确实做出了强烈的反应。一旦真搞砸了,后果真的不堪设想。但好在后来使用量不断翻番,而且再也没有下降过。


在有了这样一款热门产品之后,我们只需要认真考虑“用户做出了怎样的反馈,我们又该如何在未来加以整合?”但你说得没错,Facebook 确实从中总结出了处理问题的典型思路,即步子不停、修复不断。“哪怕出了问题,哪怕遇到了挑战,我们也要以前瞻性的方式把反馈整合进后续开发当中。”这就是长久以来我们跟用户群体之间的关系。现在双方的关系已经相当稳定,我们在功能发布方面也确实做得更好了。


BT:你在写“丑恶”备忘录那会负责的是什么工作?


  • 注:“丑恶”备忘录是 2016 年的主题为“丑陋”的备忘录,AB 在其中写道,“丑陋的现实是,我们就是要为人们提供连接,任何能让我们连接更多人的做法‘事实上’都是好的。”*


AB:讽刺的是,我当时做的事情跟那份备忘录里讨论的内容完全无关——我当时正在经营广告业务。


BT:就是说你压根不在增长部门。


AB:不光不在增长部门,我甚至就没参与过那些讨论。因为当时我正在经营广告业务,这是一份我喜欢而且非常重要的工作。我根本就没有像如今这样真正参与到过其他部门的对话中来。


我之所以写下这份备忘录,是因为当时 Facebook 内部正在进行一场大讨论。我把它提炼成了清晰的形式,就这么简单。所以很高兴你也能正确看待它,毕竟其中的内容都是真实发生过的,而我自己所做的就是把它整理出来让更多人知道。


如果非要说,我本应该在备忘录里加入更多讨论过程中的细节,让更多人能够体会内中难处。


BT:确实,但那毕竟只是一份内部备忘,没必要苛求。


AB:确实。随着时间推移,我最大的感受就是当初撰写备忘录的情境开始逐渐消散。当时内部人士更能理解这份备忘录的背景,所以我才可以直接把情况整理成极其精简的版本。而一旦把它拿给外面的人们,大家就会觉得缺少背景支撑。


“我曾觉得这可能是个大坑”


BT:在去年夏天,你提到加入 Reality Labs 的时候,觉得之前没怎么跟该部门接触过是件好事,因为这样你才能用全新的眼光看待事物。


AB:在职业生涯当中,扎克伯格曾经多次跟我提起过这一点。他总是把我推向新的业务。就拿当初的广告部门来说,他就提到“我觉得你应该试试做广告”,我前后两次拒绝了他。但他还是坚持说,“真的,我觉得你应该去试试”。最后,我就加入了进来,而且发现自己不仅有能力做好这事,而且还乐在其中。而且重要的是,身为一个局外人,我能够以全新的、甚至有点像批评家的视角看待部门所面对的机遇。这里的空间很大,靠做广告赚钱虽然不是特别难,但想做好也不容易。


后来同样的事情再次发生,而且过程还挺有趣。当时我刚刚有了第二个孩子,是个女儿。扎克伯格跑过来。对了,咱们正好也说说他。


很多人没有意识到扎克伯格是个多么优秀的人、多么伟大的合作伙伴。我两个孩子出生之后,第一个来看望他们的非家庭成员就是扎克伯格了。这其实很不容易,毕竟他可是一家大企业的 CEO。


当时他马上就来探望,一边抱着我女儿一边说,“嘿,我觉得你应该换个岗位。”我的反应是,“赶紧把女儿还给我吧,你这是想打感情牌占我的便宜,咱们最好重新平衡一下。”而让我大出所料的是,他给我的新工作就是管理 Rality Labs,而之前我一直是公司内部最反对这项业务的批评者。


我说,“你是不是疯了,我跟你说,我觉得咱们压根就不该搞这门业务。”但他针锋相对地提到,“明白,但你也可以花点时间想想,到底要怎么调整才能让你认同这门业务。”


BT:你当时为什么觉得 Facebook 不应该在 VR/AR 方面投入精力?


AB:对于身处应用层的开发者来说,长时间的参与会让我习惯了应用层那种美妙的整洁感。毕竟最早我们还想过要做手机呢,但最终还是决定重新回归应用程序,只是必须要做出最好的应用程序,让它无处不在。那段经历让我学会了很多,而这次加入 Reality Labs 也相当于历史再度重演。所以,你应该能理解我为什么比较抗拒去做平台,甚至觉得这可能是个大坑,因为我们真的不具备这方面的专业知识。


所以我表达了负面观点,甚至再一次明确拒绝。扎克伯格也没有强迫,只是说“好吧,那描述一下你理想中的项目应该是什么样子。”于是,我专门写了份文件,当时大家更多关注的是虚拟现实 VR,而 AR 仍然只是个研究项目。可我个人从一开始就更相信 AR,这可能是最大的不同。


BT:对于任何怀疑 VR 领域的关注者来说,最核心的理由应该都是 AR 更有前途。


AB:没错,但当时 VR 的投资规模更大,吸引到的资金也更多。当时我曾写过文章,认为最终成果应该不只是娱乐设备,而必须是一种能够更深入地渗透到我们工作结构中的产物。比如,要打造出超逼真的 Codec 化身,还附带更强大的进化版 Workrooms 之类软件,让人们真正能够打破物理空间的束缚、同时在场参与,不必亲身前往办公室就能获得跟人们面对面交流时的感受和效率优势。


突然之间,这样的环境也具备了真正的市场吸引力。因为我们不仅能在其中一起讨论、一起做事,甚至还能拥有无限的数字景观。所以我从刚开始就对更广阔的应用前景抱有兴趣,毕竟纯粹作为游戏外设的 Rift 总是在激起一点热度后又快速被人们所遗忘。


BT:没错,而且它还只能连接 PC。


AB:这款设备价格是 Quest 3S 的两倍,另外还需要一台价值 2000 美元的 PC 跟它搭配,所以总体拥有成本实在是太高了。所以从现在我们选择的解决思路也能看出,独立、手势追踪和混合现实,更多强调自然和直观的使用感受,再就是继续攻克设备外形和分辨率等方面的问题。总而言之,我觉得我们真的开始走上了七、八年前所设想的道路。


BT:你和 Matthew 谈到的分歧之一,是想要制造最好设备的人跟其他人之间无法达成统一。我觉得约翰·卡马克(Oculus 首席技术官)对于这样的权衡相当直言不讳,你也曾经在采访当中提到,他们想要制造更便宜的设备。两年前我试用过 Quest Pro,如今又在这里体验了 3S。3S 挺不错,但也要花上 299 美元。那可以说最终是约翰·卡马克获胜了吗?**


AB:首先,我总是喜欢给卡马克点赞。他最爱的就是在推特上给我发各种批评意见,我很喜欢,约翰请继续。


我的想法是这样,其实两种情况都有。比如说,卡马克本人是 Oculus GO 的忠实拥护者,而 Oculus Go 是一款三自由度(3DoF)头显。因为它不支持六自由度,所以就相当于把用户的脑袋锁进一个盒子里。它的实际使用感受还行,但是由于没有很好的控制方案,所以始终满足不了预期。我一直很喜欢这个主意,尽管它最终没能造成多大影响,但如果真的能在三自由度之内做好设计,那么现在我们讨论的将会是售价 100 美元、甚至是 50 美元的头显。可惜我们做不到。


所以我觉得对于这类产品应该有个最低标准,就是“至少要达到这样,才有必要尝试”的边界。我认为我们在 Quest 2 中找到了这个点,还有与之对应的功能集。


对了,卡马克对于手部追踪有点怀疑。他说“现在的控制器已经足够好了”;他对于混合现实也有疑虑,会觉得“那是额外的东西,有什么必要呢?”我真的很感谢他的判断,因为他把那些东西都去掉了。这一切都让最终设备便宜一点、轻一点、反应更快一点,这些都是很重要的指标。


与此同时,我还一直在考虑怎么让手头不宽绰的用户用上这款头显。事实上,我们从研究和应用中得知,混合现实和手部追踪等功能确实能让头显使用起来更舒适。他们会感觉更处在、体验更自然,也更有一切尽皆内化的感觉。


还记得刚开始把 Quest 2 交给从未使用过的人时,首先得教他们如何使用控制器来完成某些操作,整个过程相当复杂而且难以沟通。但现在大家已经适应了,意识到“只要抓住这些小东西,就能移动它”。


所以我真心觉得,身为技术人员,我们有时候会低估设计成果在人们眼中的上手难度。成就一款优秀产品的不仅仅是价格和舒适度,保证其易于理解和使用也同样非常重要。


BT:那在你看来,Quest Pro 是个错误吗?


AB:这话说起来就长了。扎克伯格和我一直在争论这个问题。如果没有 Quest Pro,我们很可能就搞不出 Quest 3。


Quest Pro 是第一款率先使用饼干镜头的设备,还使用到了眼动追踪和面部追踪设计。它开创了所有这些功能,相当于是给未来开启了可能性。硬件领域有这样一种说法,第三代产品才是我们理想当中第一代产品的样子。但没办法,这里没有捷径可走、也不可能跳过难题。必须得先有第一代,才有后面的第三代。我真心认同这个理论,即硬件开发没有捷径可走。


这里我也稍微给自己辩解几句,在设计 Quest Pro 的时候,我们经过了充分讨论,最终决定投放巨额资金开发这些全新镜头,并且要为这些成本极高的镜头建造新工厂。在这样的情况下,哪怕 Quest Pro 可能没有达到我们理想中的销售预期,但市场表现仍然算不错。我们还卖出了所有镜头,这同样很了不起。只能说 Pro 本身没能轰动一时,但它最终成为我们推出 3S 的关键前提。所以扎克伯格一直觉得这是个非常成功的项目,而我自己希望它能再卖得多一点。


“如果 Vision Pro 卖得好,我们也会改变策略”


BT:你之所以重新关注低端产品,是不是因为 Vision Pro 的定位实在太过高端了?


AB:我觉得自己是无论如何都会着眼于低端产品。我的意思是,首先我很喜欢 Vision Pro——很多朋友可能不信,其实我欣赏他们走极端的做法。那种感觉就像是“如果我们把这项指标拉满,但让系统的其余部分保持原样,结果会如何?”我们确实没这么做,而苹果在 Vision Pro 的重量和成本方面是拉满了的。这对我们也有很好的参考价值。


BT:就是因为太极端了,所以我觉得你和扎克伯格在看到 Vision Pro 之后似乎有种如释重负的感觉。


AB:当竞争对手发布产品时,我们唯一需要担心的就是对方取得了自己没有实现的突破。他们可能搞清楚了某些我们还没搞清的技术,这样他们就能够在一段时间之内保持优势,直到我们迎头赶上、将其击败。


所以我觉得对于任何一款设备问世时,人们都会有这样的反应,类似“太好了,还是用我们知道的材料制成的,用的也都是我们接触过的技术。”


BT:“我们能理解它为什么这么贵,也能理解它为什么这么重。”


AB:差不多,就是我们也能造出同样的东西,只是我们选择不这么造。人们倾向于探索不同的空间,这对整个世界来说是件好事。顺带一提,如果 Vision Pro 卖得很好,我们当然也会改变策略。我们会说,“好吧,原来这部分市场比我们想象中更大,那我们也试试看。”顺便说一句,我觉得只要有软件作为加持,就会有相应的市场空间。


BT:苹果在 Vision Pro 上发布的内容相当有限,你对此有感到意外吗?


AB:问题的关键,在于获取内容的方式。毕竟要想让设备卖得好,就得有更多软件;但如果设备卖得不好,谁又愿意多开发软件呢?这是个先有鸡还是先有蛋的问题。对于保有量不大的产品,开发商会觉得“虽然设备已经面世,但对我来说普及度还不够,不值得为它构建内容。”


BT:那么低成本明显就是要解决这个问题,先用友好的价格打开市场,然后才可能吸引到更多人为它开发软件。**


AB:百分之百是这样。我们一直在讨论这个问题,特别是如何建立 Quest 生态系统。我关注的不是 Quest 系列设备,而是如何尽可能多地为开发者们扩大目标受众,这样他们就能销售自己的软件、吸引到更多开发者加入进来,再由此培养出更多消费者,最终实现飞轮效应。等到规模达到一定程度,就能再向市场迈进下一步。到那个时候,我们才有可能打造利润空间更大、定位更高的设备,因为市面上已经有了很多可供其消费的内容。


BT:观察 Vision Pro 在过去 6 到 9 个月之间的发展变化,你的态度是否逐渐从“我们可以和谐共处”变成了“最终还是会由我们吃下整个市场”?


AB:哎呀,这个问题嘛,反正我们对自己的市场地位感到满意。


其实我这个人讲的永远是坦诚的观点和想法,只是有时候需要以一种巧妙的方式表达出来。我之所以要保持谨慎,唯一的原因就是我真的不想跟任何人为敌,包括苹果。


我认为他们愿意投资参与这个领域是件好事,也希望他们能继续参与进来。实际上,Vision Pro 已经帮助整个 VR/AR 设备领域的吸引到了投资热度,连我们也在一定程度上从中受益。过去几个月间,我接到了很多电话。如果苹果没有推出 Vison Pro,如果没有他们吸引人们对后续版本做出遐想,那我根本就不会接到这些电话。总之能有这样的竞争关系真的非常非常健康,对消费者们有好处、对我们也有好处。


同时我也坚信,如果你身为一名开发人员、却不选择优先为我们开发产品,那就太蠢了。我们这边的软件购买受众很大,大到足以维持你的业务。在完成这一步之后,不妨再考虑把它移植到苹果 Vision Pro 上。


BT:下面两种情况,你更害怕哪一种:在竞争中输给苹果,还是 VR/AR 设备永远没有足以容纳自己的市场?


AB:这个问题好。没错,我确实担心市场会有某种程度的上限,导致其无法真正起飞。至于苹果那边,我最担心的一点就是他们把手机和设备锁定得太狠了,所以容易陷入自我感动的设计流程当中。


就拿我们的 Orion 眼镜为例,这些属于纯 AR 眼镜设计,效果很棒。我们在眼镜中使用了定制芯片,在遥控器端也使用了定制芯片。而在苹果的产品中,一个重要前提就是只匹配自家产品、部分功能不对外开放。他们在 AirPods 上就做了这样的选择。


BT:他们之所以不做遥控装置,是因为他们已经有了 iPhone。


AB: 是的,他们想要维持手机的核心地位,AirPods 就是这样被绑定在了手机上。


BT:还有 Apple Watch。


AB:是的。这些并不是最好的产品,但苹果用种种方式阻止其他人参与到这些产品的制造中来。所以如果非要说我对苹果抱有什么顾虑,那么关键并不在于他们的头显做得好不好、强不强,而是他们总想以一种让他人难以竞争的方式将各方捆绑到自己的生态系统当中。


BT:下面让咱们来聊聊 Orion。我很想买一个,但却买不到。那为什么还要把它展示出来呢?**


AB:其实我对这个问题看得很开。我们之所以要展示这款产品,只有两个原因。首先,我们已经在这件事上投资了 10 年,也一直在呼吁和鼓励更多技术人员、投资者还有公众跟我们一同踏上这段旅程,希望他们相信 Meta。在过去三、四年间,我们也因为在这个领域投入了巨额资金而一直受到严格的财务审查。


BT:那你后悔公司从 Facebook 改名成 Meta 吗?


AB:不后悔,完全不后悔。我很喜欢 Meta 这个名字。对我们来说,最重要的开发出了这些 Meta 眼镜,它们能正常工作、效果惊人而且反应灵敏。我觉得这才是真正能打动人的证据,也是真正能够吸引到技术人员的原因。


它真正让人看到了希望。我也是在 Orion 身上第一次感觉到手机可能危险了。


BT:另外一个令人印象深刻的点在于,我一直感觉苹果 Vision Pro 的视野比 Quest 要大得多,虽然实际差距可能没那么夸张。


AB:实际上,苹果 Vision Pro 的视野更小。


我第一次尝试配套软件是在四、五个月之前,感受跟你很相似。开发团队也一直在道歉,比如说“我们知道这里的像素显示还有问题,我们需要在这里进行色彩校正”。但说实话,我的感受就是震撼,完全不在乎他们提的那些缺点。我一直体验到最终一刻,当时心里只有一个想法:“你们别再道歉了,这东西真是太不可思议了。你们成功了,恭喜!”


演示的内容也很有趣,展现的是一个有趣的小故事。人们不停地走进一个个房间,我也不知道他们在做什么,据说是在搬汽水。这么做是为了给设备冷却以防止过热,所以他们不停往冰球上放汽水。电池已经充满了电,可以使用两个小时,而过热前电量已经被耗尽,所以总时长大约是两到三个小时,因此把演示时长设定成了三小时。


总之,我们展示这些内容的第一个原因,就是希望向大家证明这点——“和我们一起投入,相信我们的决心。如果你是技术专家,也欢迎与我们携手同行。”第二点则是,对于开发者们来说,我们希望能点燃大家的热情 ,吸引更多人加入我们的虚拟化身平台。我们在台上也表达了这一点,“如果各位投资于我们的这次平台,那么不仅能够从 Quest 生态系统中获得红利,最终也将在 AR 生态系统中获得红利。”


BT:你之前提到过,苹果 Vision Pro 造成的最大担忧,就是苹果在技术层面已经取得了一定进展。这些进展可能被申请成专利或者受到保护,或者是其他什么制度性保障。那你有没有自信拿出一些不会被他人轻易模仿的成果?


AB:问得好,我们当然是有的。我们有两项值得骄傲的成果,比如我们的 MicroLED 就相当出色。我们不仅自己设计、自己制造,我们还由合作伙伴帮助分担一部分工作。我们是系统的构建者,所以我们肯定在某些方面掌握着领先的技术优势。


Orion 中的所有东西跟我们接下来要开发的方案并不接续。我们已经初步设计出后续几款全 AR 眼镜的原型,并且希望接下来的产品能够在开发阶段为消费者使用做好准备,特别是要在其中引入一些非常酷炫的变化。它们要更轻、更薄、价格大幅降低,做出一系列具体权衡。视野就是我们需要平衡的因素之一,其他还有亮度、成本和重量等等。总之对我们来说,目前我们在很多方面都具有技术优势。


我们采用的是混合方法。对于某些技术,我们完全保留第一方立场,也就是唯一能够实现的厂商。但对于其他很多技术,我们则与行业合作伙伴们携手,因为其应用不仅限于 AR,应当允许合作伙伴们在除 AR 之外的各类其他市场上自由推动技术商业化。除了与这些产品存在竞争关系的特定方之外,这对于吸引更大的行业投资也是一种福音。


BH:但这需要多长时间?一年内、两年内,五年内还是十年内?


AB:肯定是要以年计,但应该不至于以十年计。我们可能会在未来一、两年内研究这方面问题,并在软件开发中磨练自己的敏感度。之后,我认为应该把重点放在产品打磨上,努力为消费者们的广泛使用做好准备。


BH:也就是说,2027 年左右?


AB:我暂时还没办法确定,至少没法明确承诺。但我们肯定会在未来三到五年内逐渐将计划落地。


“粉丝的很多抱怨都相当合理”


BH:你在开发者主题演讲的开头,向开发者们道了歉。


AB:是的,这是给粉丝们的一点回应。不知道你逛不逛 Reddit 社区或者 Threads,每一天我和 Mark Rabkin 都会收到很多用户的消息,他们对为 Meta VR/AR 平台开发软件时遇到的挑战抱有种种不满。


其中很多抱怨都相当合理,所以我们希望能留住他们,真诚希望能帮助他们接触到目标受众。他们的很多想法非常有趣,提出的很多要求也确实具有挑战性,这也是我们去年最主要的关注点。但与此同时,“整理一下开发者文档”、“请确保建立一套好的端到端 Unity 和虚幻引擎体系”之类看似合理的建议又很难得到响应,毕竟我们清楚平台将很快发生变化,包括引入混合现实或者是手势跟踪之类,这一切都将彻底改变所有原语。


所以我之所以用道歉开头,就是想让观众们意识到你的声音我一直在倾听。我读过所有内容、关心大家的感受。只是我们现在的重点是打造一套出色的开发平台,一套令人愉快的开发平台,这其中涉及很多具体工作。我们还需要关注稳定性,以便大家能够在构建 API 的同时,不必担心这些 API 会被频繁弃用并影响到自己的应用开发成果。


BH:那到底是什么促使你们决定停止试验,真正开始构建产品?


AB:这个问题很重要。其实真正的拐点来自效率年之前。我觉得这种情况很常见,各种项目都会经历这样的扩张期,参与者们一时搞不清真正重要的是什么、不知道哪种技术是正确的选择,不知道该使用哪种操作系统,也不清楚做出正确权衡的合适理论依据。所以,如果想在特定时间范围之内提高取得成功的信心,那就得以并行方式朝着多个方向推进。


BH:那你并行推进了多长时间呢?


AB:我们一直到 Quest 2 的时候才迎来了转机,特别是在看到了混合现实的时候。真正的构建过程由此开始,如今我们的元宇宙部门已经将混合现实推向了高度集中的发展阶段,对于什么是“好”、什么是“对”有着非常清晰的愿景,能够坚定不移地朝着正确的方向迈进。基于这样强有力的路线判断,我们才能非常高效地配置资源、制定并行路径清单,进而加快重要工作的处理速度。


一年之前,Orion 凭借出色的增强现实体验让我们达到了这样的阶段。我们也终于有信心说,“好吧,我们想对了、也做好了,终于搞清楚接下来该往哪里去。”其间雷朋 Meta 眼镜也帮上了大忙。它很酷,而且除此之外,我们在此之前推出的一系列设备也都起到了重要的探索性作用。


“AI 最能发挥作用的方向是 Horizon Worlds”


BH:那 AI 有没有帮上 Reality Labs 的大忙?


AB:哎呀,终于说起 AI 了。我们的 FAIR,也就是基础人工智能研究小组,直到今年才开始向我汇报。我们刚刚把该小组转移到 Chris 领导的其他 AI 部门。


我不确定能不能算帮上大忙,但这一波确实走得很顺,也是我记忆当中整个项目首次赶上了顺风。回想起之前的开发经历,主要都是痛苦的回忆,一个逆风接着一个逆风。比如说“知道吗,这东西的热性能比你想象中要差,电池续航比你想象中要差,执行效率比你想象中要差”,而现在终于有东西比想象中效果好了。这个比预期表现更好、出现更早的成果,就是 AI。


这些设备都经历了相应的扩张期和收缩期。在前一阶段它会不断扩张,旨在让我们体会什么是好的,建立起相应的理解和直觉。接下来的工作则是做减法,这个过程中我们也越来越善于舍弃不必要的部分。


如今我们的架构非常紧密,手部跟踪、眼部跟踪、面产串上、Codec Avatars 等等,都是能在 VR 和 AR 领域同时发挥作用的技术。我们有一支共同的团队来构建这些技术。另外,AR 操作系统必须是独立且专用的,因为其在用例、实际操作和交互范式方面与过往的操作系统都完全不同。


BH:所以根据我的理解,二者的分叉也变得更加清晰。


AB:确实是这样。


BH:Facebook 起步于中间区域,也就是社交 / 公共区域的逐渐消失。而现在又出现了新的分叉,VR/AR 体现的正是这个分叉点。**


AB:是的,这很有趣,我从来没从这个角度考虑过内容的问题。我完全同意你的观点,AI 最能发挥作用的方向就是 Horizon Worlds。我希望每个人都能创造一个世界,但长久以来 3D 设计的上手难度都太大了。


BH:是的,所以游戏在这方面遇到了瓶颈。


AB:无论把门槛放得多低,这都是有门槛、有难度的,除非你能单凭语言描述就创造出一个新世界。但如今,我们已经看到了希望。我们在演讲中谈到了 NPC——NPC 就是这样一个复杂的体系,如果没有它,游戏就很难进行下去。现在我们可以用 AI 来生成 NPC。同样的,我们也可以在 AI 技术在 AR 当中构建传感结果。


所以我想分享另一个我们内部尝试过的演示,那就是 Orion 风格的超传感式眼镜。它压根就没有显示屏,只提供始终开启的传感器。人们可以在它的帮助下回顾自己一整天的经历,比如查询这一天干了些什么。用户可以说,“嘿,在今天我们的设计会议上,我们为沙发选择了什么颜色?”它会给出正确答案。再就是“今天下班的时候我,在墙上看到了一张海报,具体是什么内容?”或者“对了,这周末下午 4 点要组织一场家庭烧烤,具体要邀请谁?”总之,一整天的经历都变得可以查询了。


这肯定算不上是很大的飞跃,我们还没探索太多,但这至少能够实现很多代理功能。比如它会提醒用户“你要开车回家了吗,别忘了顺便去趟杂货店,你说过需要买奶油。”就是这样简简单单的提醒功能,足以让我们的日常发生改变。我们可以用这种 VR 和混合现实方式作为 AI 的输出空间,再利用 AI 输入建立起相应的 AR 空间。


AI 方案能够持续感知,并成为我们日常工作和生活中的惊人驱力。我们对此深感兴奋。


BH:雷朋眼镜在扩大受众规模、营造应用氛围方面到底有多重要?


AB:可以说非常重要。我认为如果想要通过某种方式让自己跟领域内的其他 AR 厂商有所区别,那我们首先得想办法让 Orion 变得易于穿戴、降低负担。


BH:听说是 EssilorLuxottica 找到了你们,而不是你们主动去找他们,这是真的吗?**


AB:是的,EssilorLuxottica 那边的首席可穿戴设备官 Rocco Basilico 几年前给我们发过邮件,而且是冷不丁突然给扎克伯格去了邮件,说“我们应该合作”。实际上,当时我正在跟 Hugo Barra 搭档,而 Hugo 表示“我觉得这事靠谱”。我猜扎克伯格把邮件转发给了高管团队,问有没有人跟进一下,而 Hugo 表示“必须抓住机会”。


BH:就是说扎克伯格得亲自上阵。


AB:于是扎克伯格飞到意大利,与时任 Luxotiica 董事长、创始兼董事长,已故的 Leonardo Del Vecchio 建立了牢固的关系。


BH:所以说扎克伯格的思路从这时候开始真正转变,Rocco 认为外观非常重要,他也认同了这一点。


AB:说句实话,扎克伯格的厉害之处就在于,他一直都知道外观很重要。从我接手当时被称为 AR/VR 部门(也就是现在的 Reality Labs)那一刻起,他就非常明白。“如果产品看起来不好看,人们就不愿意戴,那其他东西做得再好也没意义了”,而尺寸就是其中最核心的挑战。把设备做成两倍大小,能够让研发难度降低四分之三,但他不允许我们那么干。哪怕目前的 Orion 只有区区 98 克重,我们也在考虑如何在下一个版本中让它变得更轻、更薄、更小。我们仍然在不断探索新的极限。


BH:再就是探索怎么把这东西卖到 1000 美元。


AB:我们已经有了大致的思路。同样的,其中也要做出各种权衡,而且是真正的探索和妥协。好在面前的道路已经越来越清晰,这是在实践当中摸爬滚打出来的,单凭思想实验永远不可能达成。


BH:回到 AI 上,你强调的就是高度集成,也就是关键在于把硬件跟 AI 集成起来。


AB:是这样的。


BH:那又该怎么理解“我们保持开放”呢,只是个口号吗?


AB:对我们来说,最需要的就是围绕开放建立起一个生态系统,这也是当前真正缺失的部分。但我们过往的经验带来了很多指导,包括开放计算项目还有“推动补充要素的商业化”。对我们来说,AI 确实让我们的产品更完善了。


BH:那对 Reality Labs 来说,这种补充要素是什么呢?


AB:AI 让我们的产品变得更好,但没有其他人能够提供来自 Facebook 的 News Feed,只有我们自己可以做到。所以说这种补充要素就是 AI,而且无论是谁开发出的 AI,都能为我们的产品所用。正如头显之于 Horizon Worlds,AI 也能让我们的产品、包括其他人的产品都更上一层楼。


BH:所以核心产品就是 AI。


AB:我觉得这是双向的。在 AR 方面,我认为 AI 确实就是最核心的技术。至于在混合现实和虚拟现实这边,AI 更多扮演的是启动器的角色。


BH:那么,如今的 Meta 到底是一家内容公司还是社交网络公司?


AB:我们从来不把自己看作是纯粹的社交网络公司,我们是一家科技公司,也一直在努力强调这样的定位。人们总想把我们框定起来、限制起来,这也是很多人误解了我们在 Reality Labs 中工作内容的原因之一。实际上,我们一直都是一家科技公司。


早期我们做 HPHP 的时候,我们做 Hadoop 项目的时候,做 Cassandra 开发的时候,所有工作成果都是开源的。为什么要选择开源呢?因为我们的目标就是围绕这些工具建立起社区,这个社区能够达成单凭我们自己根本无法完成的目标。


BH:Reality Labs 又为什么要把自己的产品开放出去呢?


AB:抱歉,我以为我们还在讨论 Llama。是的,从开发者的角度来看,Horizon OS 最大的开启生转变就是我们曾经构建过一个精心设计的商店,但大家真的很不喜欢。他们更希望有一个开放的应用商店,任何人都可以把任何 APK 添加进去,由消费者自主选择。所以我们在去年做出了相应改变。总之,是的,我知道“开放”这个词在科技行业中有着非常具体的定义,每个人都想从蹭一蹭热度。也总会有 Richard Stallman 这样近乎狂热的原教旨主义者……


BH:我记得 Matt Mullenweg 最近还批评了你对“开放”一词的理解。


AB:我也看到了。我还是觉得开放有着宽泛的指代范围,而且具体定义永远是相对的。只有相对开放和相对封闭。我想说的是,我们希望自己的产品能够在相对开放这一侧。


BH:戴上 Orion 之后,我真正体会到了你们工作的未来愿景。但你们还没有真正解决制造和交付流程中的很多问题,所以暂时还不能打 100 分。


AB:老实说,我非常欣慰。你肯定无法想象,过去几年间我们在财务审查中承受的巨大压力。直到大约一年之前,我们还不知道自己到底能不能造出理想中的成果,一切还在未定之天。到几个月前,我们才真正体验过这款软件,我到现在也刻那个激动人心的时刻。让我激动的不仅是身为一名技术人员的参与感,更是一个关心这些产品的普通人对于所见、所感的惊喜。再想想这是整整十年的开发历程,以及成千上万人呕心沥血的结晶,着实让人感慨。


BH:事实证明,这 750 亿美元终究还是花得物有所值了。


AB:哈哈,这么多钱可不单是用来开发 Orion 的。我们投资了很多非常棒的项目,相信这些投资终将获得回报。


原文链接:


https://stratechery.com/2024/an-interview-with-meta-cto-andrew-bosworth-about-orion-and-reality-labs/


声明:本文为 InfoQ 翻译,未经许可禁止转载。


2024-10-08 14:116396

评论

发布
暂无评论
发现更多内容

Lock-It for Mac应用程序加密工具,保障数据安全!

Rose

VMware ESXi 8.0U3b macOS Unlocker & OEM BIOS 2.7 Dell HPE 定制版 9 月更新发布

sysin

esxi

文献解读-Listeria monocytogenes personalized cancer vaccines drive therapeutic immune responses to cancer derived neoantigens

INSVAST

基因数据分析 生信服务

GIS、向量、文字检索...火山引擎ByteHouse集成全场景分析能力

字节跳动数据平台

大数据 数据仓库 云原生 向量检索

Sermant Backend配置管理功能在微服务治理场景中的应用

华为云开源

开源 微服务治理 sermant

测试要不要转岗产品经理?

老张

产品经理 软件测试 职业发展

解锁电商精准营销新境界:深入解析亚马逊国际商品详情API的返回值

代码忍者

API 测试 pinduoduo API

如何选择LED显示屏型号以满足使用需求

Dylan

LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家 户内led显示屏

Spring Boot3集成iText实现PDF导出功能

江南一点雨

Navicat Charts Creator for Mac(Navicat图表创建器) v1.2.14激活版

Rose

零信任身份安全如何做到安全防护

芯盾时代

身份安全 零信任模型

“探索端智能,加速大模型应用” 火山引擎边缘智能x扣子技术沙龙圆满落幕!

火山引擎边缘云

边缘计算 机器人 物联网, 智能IoT边缘服务 #大模型

从 RAG 到 KAG:我们将发布国内首个专业领域知识增强服务框架

可信AI进展

平凯星辰亮相 2024开放原子开源生态大会,分享开源教育及社区治理经验

PingCAP

数字样机:惯性导航系统控制单元仿真

DevOps和数字孪生

数字样机

第69期 | GPTSecurity周报

云起无垠

“软件定义汽车”下的软件虚拟化技术

DevOps和数字孪生

从0到1:多服务厅预约小程序开发笔记(上)

CC同学

免费试听 | 深圳测试开发线下周末班,从自动化到测试平台开发

测试人

软件测试

分布式数据库的进度管理:TiDB 备份恢复工具 PiTR 的原理与实践

PingCAP

分布式数据库的进度管理:TiDB 备份恢复工具 PiTR 的原理与实践

PingCAP

Medis for Mac Redis 数据库管理工具 v2.13.0

Rose

Photomator for mac 技术领先的照片编辑工具

Rose

AI与消费电子的双向奔赴,2024世界消费电子展值得一探!

AIOTE智博会

消费电子展 消费电子展会 消费电子展览会

1688电商数据化运营新篇章:深度解析阿里巴巴商品详情API返回值的应用

代码忍者

pinduoduo API API 性能测试

如何利用 Milvus 实现多模态搜索

Zilliz

Milvus Zilliz 向量数据库 多模态搜索

Featuring IPQ4019, IPQ4029, QCN9024, IPQ5018, and IPQ5332 WiFi vs Industrial WiFi: What’s the Difference?

wallyslilly

IPQ4019 IPQ8072 ipq5018 IPQ5332

Chroma for Mac(颜色编辑器) 使用教程

Rose

HarmonyOS NEXT 模拟登录页,华为账号一键登录

李洋-蛟龙腾飞

HarmonyOS NEXT

等保三级堡垒机基本要求简单概述以及厂商推荐

行云管家

堡垒机 等保测评 等保三级

2024 最全 Java 面试八股文(整整 1685 页,25 个架构技术栈)

采菊东篱下

编程 java面试

从再三拒绝到带头研发,Meta CTO “真香”:我曾觉得VR/AR是个大坑,是小札“疯了”_AI&大模型_Ben Thompson_InfoQ精选文章