写点什么

近三代操作系统开发元老一起创业搞 AI Agent 操作系统,AI 大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

  • 2024-11-29
    北京
  • 本文字数:4461 字

    阅读完需:约 15 分钟

大小:2.05M时长:11:54
近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源

一群曾经参与构建 Android 平台的前谷歌、Stripe 高管,如今创建了一家专注于开发 AI 智能体操作系统的新公司/dev/agents,并已经在种子轮筹集到 5600 万美元。

 

/dev/agents 正在构建全新的 AI agent 操作系统,为开发者提供与 AI agent 合作所需的工具。该公司的愿景是打造一个中央系统,该系统能够对每个用户建立共同的理解,并提供必要的 UI 模式、开发者平台以及周边生态系统,以便构建一类新的、令人愉悦的产品。

 


“史诗般的团队”

 

越来越多的科技企业正着手开发所谓 AI 智能体,这些智能体可以执行诸如航班预订或者代码编写等任务,且期间只需极少量的人为介入。这些工具的目标在于提高生产力,让人们能够与 AI 直接交互,且实际体验高度接近与人类同事或助手协同工作。

 

但/dev/agents 的创始人们认为,这其中还缺少关键的一环。如果 AI 智能体有朝一日将如当下的应用程序一样无处不在,那么开发人员肯定需要一套通用技术框架将这些服务连接起来并允许其相互通信——其功能定位就类似于苹果 iOS 或者谷歌 Android 系统。

 

/dev/agents 公司联合创始人兼 CEO David Singleton 表示,“我们需要在 AI 领域创造出 Android 时刻。”

 

Singleton 帖子下面很多网友表达了自己的期待。

 


值得的关注的是,/dev/agents 的创始团队被网友称为是“史诗般的团队”。“作为投资人,我们遇到了许多企业家,但很少遇到像这个这样出色的创始团队”,CapitalG 公司也如此说道。

 

作为本世纪各大计算平台变革的先驱,创始团队的 David Singleton、Hugo Barra、Ficus Kirkpatrick 和 Nicholas Jitkoff 已经开发出了每天有数十亿人使用的软件。Barra 指出,“这是一支曾经参与最近三代操作系统的开发队伍。”他指的自然是 Android、可穿戴设备和 AR/VR 这三大系统平台。

 

  • David Singleton 在创业之前,曾在 Stripe 担任首席技术官近 7 年,在建立金融渠道方面发挥了关键作用。这之前,Singleton 还曾在谷歌担任 Android 产品工程副总裁,负责监督 Android 新界面的开发,特别是移动界面的开发。在谷歌任职期间,他创立了为智能手表和其他可穿戴设备设计的 Android 操作系统版本 Android Wear。

 

  • Hugo Barra 的职业生涯始于计算机行业的早期关键时刻,他开发了一系列产品。大学毕业后,Barra 与他人共同创立了一家公司,专注于开发语音识别技术,这项技术后来为苹果第一代 Siri 提供了支持。之后,他在 Android 生态系统中工作了近十年,先是在谷歌负责 Android 操作系统的产品管理,随后在小米担任全球副总裁,负责建立全球智能手机业务。最近,Barra 在 Meta 担任了四年副总裁,负责管理 Oculus VR 产品。此后,他成为 Detect(一家 AI 健康诊断公司)的联合创始人兼首席执行官。

 

  • Ficus Kirkpatrick 是移动计算转型的早期先驱之一。他曾是 Danger Hiptop(也称为 T-Mobile Sidekick)的创造者之一,这款手机是第一款始终连接到互联网的现代智能手机。在 Google 收购 Danger 之前,Kirkpatrick 是原始 Android 团队的工程师。后来,他加入谷歌担任工程主管,成功将 Google Play 打造成一家价值数十亿美元的企业。最近,他与 Hugo Barra 合作,担任 Meta 的副总裁,负责虚拟现实(VR)和增强现实(AR)平台的开发。目前他担任/dev/agents 的 CTO 一职。

 

  • Nicholas Jitkoff 在 Chrome OS、Android 和 Oculus 等新计算平台的设计中扮演了关键角色,专注于探索性输入、交互和系统设计。他曾是 Material Design 的首席设计师,负责构建 Google 的整体界面框架。此外,Jitkoff 还曾担任 Dropbox 的设计副总裁,并后来领导了 Figma 的核心系统和 AI 设计团队。

 

“我们都能感受到 AI 智能体的巨大潜力空间。但从开发者的角度出发,现在想靠它做出好的产品实在太过困难。”Singleton 说道。

 

Kirkpatrick 转发 Singleton 的话很简单:让我们重新发明应用程序。Barra 则表示,“回归 Android 本源,为人类和 AI 智能体构建一个新的操作系统。”

 

为了解决这个问题,/dev/agents 计划构建一款能够运行在手机、笔记本电脑甚至是车载系统上的云端操作系统。该公司还希望开发一套新型用户界面,让人们能够更加顺畅自然地与各种硬件设备上的智能体进行交互。

 

除了四位创始人之外,/dev/agents 还有另外两名员工。其中,Björn Bringert 领导谷歌搜索在安卓系统上的发展近 10 年,使其用户数量超过了十亿。之后,他领导了沃尔沃汽车在线、连接性和商业数字产品的发展。最近,他一直在构建从电动货运自行车、海上救援无人机和便携式电子设备到移动应用、网络应用、后端服务和各种 AI 原型产品。

 

该公司目前也在扩大团队:“我们正在寻找以用户为中心、注重工艺、具有开拓精神、不太自视甚高的人加入我们旧金山的团队。我们雄心勃勃,但又务实。我们奔跑迅速,但注重细节。我们认为创造未来的最佳方式是每天坚持不懈地取得进步。”

 

Singleton 表示,该公司计划保持相对灵活的运营形态,类似于 Android 早期开发团队。该公司打算着力投入的一个主要方向在于计算推理,这也是为 AI 智能体构建操作系统所必需的前置科技。

 

Karpahy 等知名人士参投

 

/dev/agents 总部位于旧金山,其在本周二宣布完成了由 Index Ventures 领投、Alphabet 成长投资基金与谷歌旗下 CapitalG 等联合跟投的大型种子轮融资。据一位未获授权公开披露细节信息的知情人士透露,此轮融资已经将/dev/agents 的估值拉升至 5 亿美元。

 

创始人的背景正是左右投资决策的关键因素。“考虑到这家公司的员工以及创始人阵容与市场需求的契合度,就能意识到他们的开发目标必将大有可为。”对于 Index Ventures 合伙人 Nina Achadjian 说道,她与 Singleton 在谷歌工作时就已经相识。

 

CapitalG 合伙人 Jill Chase 则表示,“他们选择的是一条千载难逢的机遇赛道。”过去一年多以来,Chase 本人一直在苦苦找寻为 AI 智能体开发操作系统的企业投资对象。

 

而最引人关注的则是数十位天使投资者也参与进来,其中包括 Scale AI 公司 CEO Alexandr Wang、Palo Alto Networks CEO Nikesh Arora 以及 OpenAI 联合创始人 Andrej Karpahy 等知名人士。

 

Andrej Karpathy 在去年提出了 LLM 操作系统的概念,当时在硅谷引发了热议。

 


Karpathy 提出的 LLM OS 在概念上类似一颗“大脑”,相当于 GPT-4 大语言模型的涡轮增压版,设想以每秒 20 Hz 的“心率”以 token 为单位保持运行。所谓 token 单位,用以表示系统预期的语言处理能力——作为大模型一项必不可少的技能,未来用户下达命令可能如同好友之间的寒暄般轻松随意。

 

该系统的内存使用能容纳 128K tokens 的 RAM,意味着其能够轻松处理大量文本。而其中设想的文件数据存储系统为“Ada002”。对视频和音频等 I/O 外设的支持绝非临时起意,如今的多模态模型已经开辟出一种新的可能性:大模型可以观看无声电影并实时生成故事脚本,或者根据雨滴敲打窗户的白噪音创作交响乐。

 

Karpathy 的蓝图中也不乏开发者们熟悉的软件工具。Python 解释器加上终端或将拥抱自然语言操作指令。也许未来的编程工作,就像跟好友谈天说地般轻松自然。

 

Karpathy 当时的想象就预示了计算范式将会迎来巨大转变。LLM OS 让人们开始重新构想自己的日常数字交互方式与体验:在未来,“请安装最新更新”这种当下常规的操作在多数用户眼中将变得如同计算机系统维护一样复杂——毕竟已经完全由大模型操作系统代劳了;而“帮我找条回家的最佳路线”也不再只是冷冰冰的行程规划,而是一段关于日程安排的深入讨论。

 

Karpathy 所展现的未来不仅建立在更复杂的算法之上,还将与同理心与情感共鸣密不可分——种种传统上只属于人类的心灵体验,也许将成为能够在人机之间分享的真切感受。

 

如果说,当时的 LLM OS 还只是纯粹的思想实验,那 Singleton 几人的创业则是在为实现这个思想实验提供助力。

 

巨头们的 Agent 战争

 

如今,人工智能系统已经能够主动与计算机界面互动,而不仅仅停留在处理文本和图像上。

 

操作系统提供了硬件和软件之间的基本接口。而生成式 AI 正以并行操作系统的形式出现,协调大规模计算基础设施和复杂应用程序之间的交互,这些应用程序现在被重新定义为 AI agent。这种转变不是简单的自动化或逐步改进。

 

原来由英特尔、ARM 和 SPARC 主导的硬件层,现在正在不断发展以满足 AI 工作负载的需求。Nvidia 、Groq、Cerebras 等公司正在提供下一代硬件,专门研究 AI 专用处理器。而原来戴尔、HPE 和 IBM 等 OEM(原始设备制造商)的提供服务器、存储和网络设备来运行操作系统驱动的应用程序,现在变成 AWS、Microsoft Azure 和 Google Cloud 等云平台引领着 AI 技术栈,提供针对生成 AI 优化的基础设施和服务。

 

在传统的操作系统内核中,管理内存和进程等低级功能。在生成式 AI 技术栈中,语言模型(如 Llama、Gemma、Mistral 和 Phi)充当核心,使系统能够生成类似人类的文本、图像甚至代码。Apple Intelligence 和 Microsoft Copilot+ PC 是 GenAI 模型如何成为操作系统不可或缺的一部分的早期例子。正如内核对于操作系统的功能至关重要一样,这些模型是 AI 系统的基石。

 

与核心操作系统实用程序类似,嵌入模型、矢量数据库和如 LangChain 和 LlamaIndex 等编排框架等 AI 工具现在已成为关键组件。它们简化了处理复杂工作流程的过程,使 AI agent 能够检索知识并有效地执行任务。这些框架还为开发人员和组织提供了一个“shell”,用于构建、训练和部署 AI agent。

 

在传统技术栈中,应用程序构建在操作系统之上,用于执行特定任务并为用户提供价值。在生成式 AI 技术栈中,AI agent 承担这些应用程序的角色,但是它们的能力远远超过传统软件。AI agent 是自主的、能够与环境交互,从数据中学习并执行从客户服务到软件开发等各种领域的任务。

 

目前,围绕 AI agent 的整个生态正在逐渐建立和完善。所有领先的人工智能公司都承诺将推出自主 AI agent,而 OpenAI 最近也大肆宣传这种可能性。

 

几周前,在 Reddit 的论坛上,OpenAI 首席执行官 Sam Altman 表示,“我们将拥有越来越好的模型”,但“我认为下一个重大突破将是 agent。”OpenAI 首席产品官 Kevin Weil 也表示,“2025 年将是 agent 系统最终进入主流的一年。”

 

本月,有消息称 OpenAI 公司计划于 2025 年 1 月,以研究预览和开发工具的形式,推出名为“Operator”的自动化 AI 智能体,可以独立控制计算机并执行各种任务。此举加剧了开发 AI agent 科技巨头之间的竞争:微软最近宣布构建了强大的 AI agent 生态;Anthropic 推出“computer use”功能,而据报道谷歌也在准备自己的版本,将于本月发布。

 

这些公司希望 AI agent 能够提供一种将强大但昂贵的 AI 模型货币化的方法,那这条路能否带来理想的效果,需要时间验证,但应该不会太久。

 

参考链接:

https://www.bloomberg.com/news/articles/2024-11-26/former-google-stripe-executives-raise-56-million-for-ai-agent-startup?leadSource=uverify%20wall

https://www.capitalg.com/insights/dev-agents-the-operating-system-for-ai-agents/

https://x.com/karpathy/status/1723140519554105733

https://medium.com/@marcelheinz/the-llm-os-a-glimpse-into-the-future-of-tech-with-andrej-karpathy-3bcbc0baf339

https://www.forbes.com/sites/janakirammsv/2024/09/25/if-generative-ai-is-the-new-operating-system-agents-are-the-new-apps/

2024-11-29 09:508506

评论

发布
暂无评论
发现更多内容

在API 接口的设计中数据的安全性和完整性,该如何保证?

伤感汤姆布利柏

通义灵码 AI 程序员来了!丨阿里云云原生 9 月产品月报

阿里巴巴云原生

阿里云 云原生 通义灵码

精准监控,高效运营 —— 商品信息实时分析为商家带来新机遇

技术冰糖葫芦

API 接口 API 文档 API 测试 pinduoduo API API 性能测试

活动预告|博睿数据将受邀出席GOPS全球运维大会上海站!

博睿数据

什么是iPaaS?iPaaS选型、落地及案例分析

RestCloud

数据集成 应用集成 ipaas

老韩运维知识解析系列02:深入理解网络监控指标与实战应用

Geek_a83400

3个步骤轻松集成Push Kit,实现App消息推送

快乐非自愿限量之名

人工智能 深度学习 HarmonyOS

没有方向盘和踏板,特斯拉发布无人驾驶出租车;字节豆包推出 AI 智能体耳机 Ola Friend丨 RTE 开发者日报

声网

打造你的专属语音助手,基于函数计算托管 CosyVoice 语音模型

阿里巴巴云原生

阿里云 云原生 函数计算

登顶!智源BGE首开国产模型Hugging Face月度下载全球第一

智源研究院

内核级流量治理引擎Kmesh八大新特性解读

华为云开发者联盟

服务网格 ebpf Sidecar Kmesh

基于 Nginx 的大型互联网集群架构与实战方案

EquatorCoco

nginx 架构 运维

Spring Boot3集成 LiteFlow 实现业务流程编排

江南一点雨

Mac专用投屏工具:AirServer 7 for Mac 激活版

你的猪会飞吗

AIrserver7 Mac软件下载站 AirServer 7 mac激活版

拍立淘API返回值在商品数据分析中的应用

代码忍者

pinduoduo API API 性能测试

繁星·数智思享会第2期:流程挖掘,全知视角驱动业务增长

望繁信科技

流程挖掘 流程资产 流程智能 望繁信科技 数字换转型

Code Review:探索工程实践之道

京东科技开发者

淘宝商品详情API返回值:深度挖掘其业务价值

代码忍者

pinduoduo API API 性能测试

如何挑选CDN加速器节点网络?

Ogcloud

CDN 网络加速 CDN加速 企业网络加速 CDN网络加速

天猫商品描述API返回值中的商品参数对比与竞品分析

技术冰糖葫芦

API 接口 API 文档 API 测试 API 性能测试

「软件设计哲学」于延保代码改造中的实践

京东科技开发者

在Vue3中如何实现四种全局状态数据的统一管理?

不在线第一只蜗牛

JavaScript vue.js 前端

云桌面VS传统PC:企业用户该如何取舍

青椒云云电脑

云桌面

软件测试学习笔记丨二叉树:添加练习

测试人

软件测试

解锁保险新世界-带你走进保险基本法

京东科技开发者

阿里云可观测 2024 年 9 月产品动态

阿里巴巴云原生

阿里云 云原生 可观测

数据仓库 Palo 2.0 for Apache Doris 冷热分离原理分析

Baidu AICLOUD

数据仓库 数据仓库服务

一文读懂HyperWorks的耦合求解功能

智造软件

CAE altair hyperworks

浙江鲲鹏昇腾产业与人才创新论坛成功举办!

Geek_2d6073

博睿数据Bonree ONE全面适配HarmonyOS NEXT,守护鸿蒙原生应用稳健前行

博睿数据

Python:条件分支 if 语句全讲解

不在线第一只蜗牛

Python

近三代操作系统开发元老一起创业搞AI Agent操作系统,AI大神卡帕西、谷歌都投了!大佬:要回归 Android 本源_AI&大模型_褚杏娟_InfoQ精选文章