一群曾经参与构建 Android 平台的前谷歌、Stripe 高管,如今创建了一家专注于开发 AI 智能体操作系统的新公司/dev/agents,并已经在种子轮筹集到 5600 万美元。
/dev/agents 正在构建全新的 AI agent 操作系统,为开发者提供与 AI agent 合作所需的工具。该公司的愿景是打造一个中央系统,该系统能够对每个用户建立共同的理解,并提供必要的 UI 模式、开发者平台以及周边生态系统,以便构建一类新的、令人愉悦的产品。
“史诗般的团队”
越来越多的科技企业正着手开发所谓 AI 智能体,这些智能体可以执行诸如航班预订或者代码编写等任务,且期间只需极少量的人为介入。这些工具的目标在于提高生产力,让人们能够与 AI 直接交互,且实际体验高度接近与人类同事或助手协同工作。
但/dev/agents 的创始人们认为,这其中还缺少关键的一环。如果 AI 智能体有朝一日将如当下的应用程序一样无处不在,那么开发人员肯定需要一套通用技术框架将这些服务连接起来并允许其相互通信——其功能定位就类似于苹果 iOS 或者谷歌 Android 系统。
/dev/agents 公司联合创始人兼 CEO David Singleton 表示,“我们需要在 AI 领域创造出 Android 时刻。”
Singleton 帖子下面很多网友表达了自己的期待。
值得的关注的是,/dev/agents 的创始团队被网友称为是“史诗般的团队”。“作为投资人,我们遇到了许多企业家,但很少遇到像这个这样出色的创始团队”,CapitalG 公司也如此说道。
作为本世纪各大计算平台变革的先驱,创始团队的 David Singleton、Hugo Barra、Ficus Kirkpatrick 和 Nicholas Jitkoff 已经开发出了每天有数十亿人使用的软件。Barra 指出,“这是一支曾经参与最近三代操作系统的开发队伍。”他指的自然是 Android、可穿戴设备和 AR/VR 这三大系统平台。
David Singleton 在创业之前,曾在 Stripe 担任首席技术官近 7 年,在建立金融渠道方面发挥了关键作用。这之前,Singleton 还曾在谷歌担任 Android 产品工程副总裁,负责监督 Android 新界面的开发,特别是移动界面的开发。在谷歌任职期间,他创立了为智能手表和其他可穿戴设备设计的 Android 操作系统版本 Android Wear。
Hugo Barra 的职业生涯始于计算机行业的早期关键时刻,他开发了一系列产品。大学毕业后,Barra 与他人共同创立了一家公司,专注于开发语音识别技术,这项技术后来为苹果第一代 Siri 提供了支持。之后,他在 Android 生态系统中工作了近十年,先是在谷歌负责 Android 操作系统的产品管理,随后在小米担任全球副总裁,负责建立全球智能手机业务。最近,Barra 在 Meta 担任了四年副总裁,负责管理 Oculus VR 产品。此后,他成为 Detect(一家 AI 健康诊断公司)的联合创始人兼首席执行官。
Ficus Kirkpatrick 是移动计算转型的早期先驱之一。他曾是 Danger Hiptop(也称为 T-Mobile Sidekick)的创造者之一,这款手机是第一款始终连接到互联网的现代智能手机。在 Google 收购 Danger 之前,Kirkpatrick 是原始 Android 团队的工程师。后来,他加入谷歌担任工程主管,成功将 Google Play 打造成一家价值数十亿美元的企业。最近,他与 Hugo Barra 合作,担任 Meta 的副总裁,负责虚拟现实(VR)和增强现实(AR)平台的开发。目前他担任/dev/agents 的 CTO 一职。
Nicholas Jitkoff 在 Chrome OS、Android 和 Oculus 等新计算平台的设计中扮演了关键角色,专注于探索性输入、交互和系统设计。他曾是 Material Design 的首席设计师,负责构建 Google 的整体界面框架。此外,Jitkoff 还曾担任 Dropbox 的设计副总裁,并后来领导了 Figma 的核心系统和 AI 设计团队。
“我们都能感受到 AI 智能体的巨大潜力空间。但从开发者的角度出发,现在想靠它做出好的产品实在太过困难。”Singleton 说道。
Kirkpatrick 转发 Singleton 的话很简单:让我们重新发明应用程序。Barra 则表示,“回归 Android 本源,为人类和 AI 智能体构建一个新的操作系统。”
为了解决这个问题,/dev/agents 计划构建一款能够运行在手机、笔记本电脑甚至是车载系统上的云端操作系统。该公司还希望开发一套新型用户界面,让人们能够更加顺畅自然地与各种硬件设备上的智能体进行交互。
除了四位创始人之外,/dev/agents 还有另外两名员工。其中,Björn Bringert 领导谷歌搜索在安卓系统上的发展近 10 年,使其用户数量超过了十亿。之后,他领导了沃尔沃汽车在线、连接性和商业数字产品的发展。最近,他一直在构建从电动货运自行车、海上救援无人机和便携式电子设备到移动应用、网络应用、后端服务和各种 AI 原型产品。
该公司目前也在扩大团队:“我们正在寻找以用户为中心、注重工艺、具有开拓精神、不太自视甚高的人加入我们旧金山的团队。我们雄心勃勃,但又务实。我们奔跑迅速,但注重细节。我们认为创造未来的最佳方式是每天坚持不懈地取得进步。”
Singleton 表示,该公司计划保持相对灵活的运营形态,类似于 Android 早期开发团队。该公司打算着力投入的一个主要方向在于计算推理,这也是为 AI 智能体构建操作系统所必需的前置科技。
Karpahy 等知名人士参投
/dev/agents 总部位于旧金山,其在本周二宣布完成了由 Index Ventures 领投、Alphabet 成长投资基金与谷歌旗下 CapitalG 等联合跟投的大型种子轮融资。据一位未获授权公开披露细节信息的知情人士透露,此轮融资已经将/dev/agents 的估值拉升至 5 亿美元。
创始人的背景正是左右投资决策的关键因素。“考虑到这家公司的员工以及创始人阵容与市场需求的契合度,就能意识到他们的开发目标必将大有可为。”对于 Index Ventures 合伙人 Nina Achadjian 说道,她与 Singleton 在谷歌工作时就已经相识。
CapitalG 合伙人 Jill Chase 则表示,“他们选择的是一条千载难逢的机遇赛道。”过去一年多以来,Chase 本人一直在苦苦找寻为 AI 智能体开发操作系统的企业投资对象。
而最引人关注的则是数十位天使投资者也参与进来,其中包括 Scale AI 公司 CEO Alexandr Wang、Palo Alto Networks CEO Nikesh Arora 以及 OpenAI 联合创始人 Andrej Karpahy 等知名人士。
Andrej Karpathy 在去年提出了 LLM 操作系统的概念,当时在硅谷引发了热议。
Karpathy 提出的 LLM OS 在概念上类似一颗“大脑”,相当于 GPT-4 大语言模型的涡轮增压版,设想以每秒 20 Hz 的“心率”以 token 为单位保持运行。所谓 token 单位,用以表示系统预期的语言处理能力——作为大模型一项必不可少的技能,未来用户下达命令可能如同好友之间的寒暄般轻松随意。
该系统的内存使用能容纳 128K tokens 的 RAM,意味着其能够轻松处理大量文本。而其中设想的文件数据存储系统为“Ada002”。对视频和音频等 I/O 外设的支持绝非临时起意,如今的多模态模型已经开辟出一种新的可能性:大模型可以观看无声电影并实时生成故事脚本,或者根据雨滴敲打窗户的白噪音创作交响乐。
Karpathy 的蓝图中也不乏开发者们熟悉的软件工具。Python 解释器加上终端或将拥抱自然语言操作指令。也许未来的编程工作,就像跟好友谈天说地般轻松自然。
Karpathy 当时的想象就预示了计算范式将会迎来巨大转变。LLM OS 让人们开始重新构想自己的日常数字交互方式与体验:在未来,“请安装最新更新”这种当下常规的操作在多数用户眼中将变得如同计算机系统维护一样复杂——毕竟已经完全由大模型操作系统代劳了;而“帮我找条回家的最佳路线”也不再只是冷冰冰的行程规划,而是一段关于日程安排的深入讨论。
Karpathy 所展现的未来不仅建立在更复杂的算法之上,还将与同理心与情感共鸣密不可分——种种传统上只属于人类的心灵体验,也许将成为能够在人机之间分享的真切感受。
如果说,当时的 LLM OS 还只是纯粹的思想实验,那 Singleton 几人的创业则是在为实现这个思想实验提供助力。
巨头们的 Agent 战争
如今,人工智能系统已经能够主动与计算机界面互动,而不仅仅停留在处理文本和图像上。
操作系统提供了硬件和软件之间的基本接口。而生成式 AI 正以并行操作系统的形式出现,协调大规模计算基础设施和复杂应用程序之间的交互,这些应用程序现在被重新定义为 AI agent。这种转变不是简单的自动化或逐步改进。
原来由英特尔、ARM 和 SPARC 主导的硬件层,现在正在不断发展以满足 AI 工作负载的需求。Nvidia 、Groq、Cerebras 等公司正在提供下一代硬件,专门研究 AI 专用处理器。而原来戴尔、HPE 和 IBM 等 OEM(原始设备制造商)的提供服务器、存储和网络设备来运行操作系统驱动的应用程序,现在变成 AWS、Microsoft Azure 和 Google Cloud 等云平台引领着 AI 技术栈,提供针对生成 AI 优化的基础设施和服务。
在传统的操作系统内核中,管理内存和进程等低级功能。在生成式 AI 技术栈中,语言模型(如 Llama、Gemma、Mistral 和 Phi)充当核心,使系统能够生成类似人类的文本、图像甚至代码。Apple Intelligence 和 Microsoft Copilot+ PC 是 GenAI 模型如何成为操作系统不可或缺的一部分的早期例子。正如内核对于操作系统的功能至关重要一样,这些模型是 AI 系统的基石。
与核心操作系统实用程序类似,嵌入模型、矢量数据库和如 LangChain 和 LlamaIndex 等编排框架等 AI 工具现在已成为关键组件。它们简化了处理复杂工作流程的过程,使 AI agent 能够检索知识并有效地执行任务。这些框架还为开发人员和组织提供了一个“shell”,用于构建、训练和部署 AI agent。
在传统技术栈中,应用程序构建在操作系统之上,用于执行特定任务并为用户提供价值。在生成式 AI 技术栈中,AI agent 承担这些应用程序的角色,但是它们的能力远远超过传统软件。AI agent 是自主的、能够与环境交互,从数据中学习并执行从客户服务到软件开发等各种领域的任务。
目前,围绕 AI agent 的整个生态正在逐渐建立和完善。所有领先的人工智能公司都承诺将推出自主 AI agent,而 OpenAI 最近也大肆宣传这种可能性。
几周前,在 Reddit 的论坛上,OpenAI 首席执行官 Sam Altman 表示,“我们将拥有越来越好的模型”,但“我认为下一个重大突破将是 agent。”OpenAI 首席产品官 Kevin Weil 也表示,“2025 年将是 agent 系统最终进入主流的一年。”
本月,有消息称 OpenAI 公司计划于 2025 年 1 月,以研究预览和开发工具的形式,推出名为“Operator”的自动化 AI 智能体,可以独立控制计算机并执行各种任务。此举加剧了开发 AI agent 科技巨头之间的竞争:微软最近宣布构建了强大的 AI agent 生态;Anthropic 推出“computer use”功能,而据报道谷歌也在准备自己的版本,将于本月发布。
这些公司希望 AI agent 能够提供一种将强大但昂贵的 AI 模型货币化的方法,那这条路能否带来理想的效果,需要时间验证,但应该不会太久。
参考链接:
https://www.capitalg.com/insights/dev-agents-the-operating-system-for-ai-agents/
评论