GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”_AI&大模型_罗燕珊

2025 AI基础设施风向标，不看必后悔！#AI基础设施峰会了解详情 



 写点什么

GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”

研发超过 18 个月却还未见影子的 GPT-5（代号 Orion）项目又有了新爆料。

《华尔街日报》最新报道称，有接近该项目的人士表示，尽管目前 Orion 的表现优于 OpenAI 当前的模型，但当前的进步并不足以证明继续运转新模型所需的巨大成本是合理的。

据知情人士透露，GPT-5 至少进行过两轮训练，每次训练都暴露出新的问题，达不到研究人员的预期。而且，每轮训练耗时数月，仅一轮计算成本就接近 5 亿美元。

总而言之，这个项目是否能成功、何时能成功，目前尚不明确。它还面临着一个更严峻的问题：全球的数据量不足以让它达到理想的智能水平。

训练之路困难重重

自 GPT-4 于 2023 年 3 月发布后，OpenAI 随即投入到 GPT-5 的开发。同年 11 月，Altman 就曾表示不会在 2024 年发布任何名为 GPT-5 的东西。

一般来说，AI 模型的能力会随着其吸收的数据量增加而增强。在训练过程中，模型被灌入数万亿个 tokens，训练可能持续好几个月，并且依赖于成千上万块昂贵且稀缺的计算芯片。Altman 曾透露，单是训练 GPT-4 的成本就超过了 1 亿美元，而未来的 AI 模型训练费用预计将突破 10 亿美元。若训练失败，其后果将如同火箭发射失败一样，造成巨大的损失。

为了减少失败的风险，OpenAI 通常会先进行小规模的试运行，以验证模型设计和训练的可行性。通过这种方式，研究人员可以在正式的大规模训练之前发现并修正潜在问题。

然而，GPT-5 的开发从一开始便遇到了挑战。2023 年中，OpenAI 启动了一个名为“Arrakis”的实验性训练，旨在测试 GPT-5 的新设计。遗憾的是，训练进展缓慢，显示出如果进行更大规模的训练，将会耗费极长时间，并且成本极其高昂。实验结果还表明，GPT-5 的开发比原先预期的要更加复杂和困难。

因此，OpenAI 的研究团队决定对 Orion 进行一系列技术调整，并进一步意识到，现有的公开互联网数据已经无法满足模型的需求。为了提升 GPT-5 的性能，他们迫切需要更多种类和更高质量的数据。

“从零开始创造数据”

据报道，为了应对数据不足的问题，OpenAI 决定“从零开始创造数据”。具体来说，OpenAI 正在雇人编写新的软件代码或解决数学问题，让 Orion 从这些任务中学习。这些人包括软件工程师和数学家，并且还会向 Orion 解释他们的工作过程。

许多研究人员认为，代码作为软件的语言，能够帮助大模型解决它们没有见过的问题，从而提升其解决复杂问题的能力。

Turing 公司首席执行官兼联合创始人 Jonathan Siddharth 表示：“我们是在将人类智慧从人脑转移到机器脑。”

在 AI 的训练过程中，Turing 的一位高管解释说，软件工程师可能会被要求编写一个程序来高效地解决复杂的逻辑问题；而数学家则可能需要计算由一百万个篮球构成的金字塔的最大高度。这些任务的关键不只是得到最终答案，更重要的是 得出答案的思考过程，都会被纳入 AI 的训练材料中。

此外，OpenAI 还与理论物理学等领域的专家合作，让他们解释如何解决自己领域中的棘手问题。这些内容也有助于提升 Orion 的智能水平。

但不管怎么说，雇人从头构建数据这个事情，怎么看也不会是个高效的过程。GPT-4 的训练数据约为 13 万亿个 token。如果有 1000 个人每天写 5000 个字，生产 10 亿个 token 也得花费几个月的时间。

为了加速训练，OpenAI 也有用所谓的“合成数据”，即由 AI 生成的数据，来帮助训练 Orion。然而有研究表明，AI 生成数据再用于 AI 训练的反馈循环，有时会导致模型出错或生成毫无意义的答案。

对此，知情人士称，OpenAI 的科学家认为，通过使用 o1 生成的数据可以避免这些问题。

内外夹击下前行

OpenAI 面临的挑战不仅仅是技术层面的，还有内部的动荡和竞争对手几乎不间断的挖角。其次，来自技术和资金的双重压力也在明显增加。每一次的训练耗资高达 5 亿美元，那么最后训练成本就很可能超过 10 亿美元。与此同时，竞争对手的崛起对 OpenAI 构成了更大压力。Anthropic、谷歌等公司纷纷推出新一代模型，试图赶超 OpenAI。

人才流失和内部分歧进一步拖慢了开发进度。去年，OpenAI 董事会突然解雇了 Altman，导致一些研究人员开始质疑公司是否能够继续运作。然而，Altman 很快被重新任命为 CEO，并着手对公司的治理结构进行改革。

今年以来，超过 20 位关键高管、研究人员和长期员工离开了 OpenAI，其中包括联合创始人兼首席科学家 Ilya Sutskever 和技术负责人 Mira Murati。就在前不久，广受尊敬的研究人员 Alec Radford 也宣布离职，他曾在 OpenAI 工作约八年，并主笔了多篇重要论文。

随着 Orion 的进展停滞，OpenAI 开始开发其他项目和应用，包括简化版的 GPT-4 和可以生成 AI 视频的 Sora 产品。但报道也提到，这导致了 不同团队之间争夺有限计算资源的局面，特别是在新产品开发团队和 Orion 研究团队之间，发生了激烈的竞争。

GPT-5 的困境或许揭示了一个更大的行业命题：AI 是否已经接近发展的“瓶颈期”？业内人士指出，依靠海量数据和更大模型的策略正逐渐失效。正如前 OpenAI 科学家苏茨克维尔日前在公开场合所说，“我们只有一个互联网”，数据的增长正在放缓，这一推动 AI 飞跃的“化石燃料”正逐渐枯竭。

对于 GPT-5 的未来，Altman 始终未给出明确的时间表，目前我们仍然无法确定 OpenAI 何时或者是否会推出一个值得称为 GPT-5 的模型。

参考链接：

https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693

发布

暂无评论

创作场景

GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”

训练之路困难重重

“从零开始创造数据”

内外夹击下前行

评论

手把手教你如何使用 Timestream 实现物联网时序数据存储和分析

DPDK源码分析之DPDK技术简介

资本“呼唤”：走产品化路线，找得到PMF的云安全创业项目

新书上市 | Vue 3.0 核心源码解析，这本书给 Vue 学习提供新方法

图库

2022年第十三届蓝桥杯Web国赛真题解析

超详细：这份全网首发的Kafka技术手册，从基础到实战一应俱全！

架构师的十八般武艺：一致性

每日算法刷题Day12-跳台阶、排列、替换空格、求n累加

TO B的本质是“定制化”不变，“定制化”实现方式求变

Redis命令传播的心跳检测

MFC与Qt多个控件响应统一响应消息处理

5 个 Promise 要避免的常见用法~

DPDK源码分析之DPDK基础概览

DAYU200升级最新的OpenHarmony系统，一起来玩开源鸿蒙呀！

图解Kafka Producer中的消息缓存模型

新书上市 | Vue 3.0 核心源码解析，这本书给Vue学习提供新方法

jquery入门到实战

NtyCo纯C协程的原理分析

Sentinel哨兵机制

企业容器云建设及推广的一点Tips

【蓝桥杯Web】2022年第十三届蓝桥杯Web大学组省赛真题解析（精华版）

DPDK源码分析之rte_eal_init(一)

DPDK源码分析之rte_eal_init(二)

NFTScan 正式发布 PlatON 网络 NFT 浏览器

mysql实数类型和字符串类型

白天建筑师，晚上CG艺术家，他将建筑的华丽发挥极致

【蓝桥杯Web】2022年第十三届蓝桥杯Web大学组省赛真题解析（完整版）

计算机网络——奈式准则

《新神榜：杨戬》亮点抢先看！追光新神话宇宙再添超燃国风巨作

创作场景

GPT-5 研发一年半进度堪忧！每轮 5 亿美金训练成本打水漂，还得雇人从头“造数据”

训练之路困难重重

“从零开始创造数据”

内外夹击下前行

评论

推荐阅读

电子书

大厂实战PPT下载