产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

打破英伟达芯片短缺制约,OpenAI 决定自研 AI 芯片:正物色收购目标

  • 2023-10-07
    北京
  • 本文字数:2004 字

    阅读完需:约 7 分钟

大小:1.03M时长:06:01
打破英伟达芯片短缺制约,OpenAI决定自研AI芯片:正物色收购目标

OpenAI 正在探索自研 AI 芯片

 

据路透社 10 月 6 日报道,有知情人士透露,打造出 AI 超级明星 ChatGPT 的 OpenAI 公司目前正探索制造原研 AI 芯片,而且正在评估一家潜在的收购目标。

 

据路透社在内部讨论中得到的消息,OpenAI 公司尚未决定是否继续推进。但知情人士透露称,至少自去年开始,OpenAI 就已经在讨论各种方案、希望解决因供应短缺而愈发昂贵的 AI 芯片问题。相关选项包括打造原研 AI 芯片、与包括英伟达在内的其他芯片制造商开展密切合作,以及在英伟达之外拓展更加多元的供应来源。

 

对此,OpenAI 公司拒绝发表置评。

 

目前还不清楚 OpenAI 到底会不会迈出定制芯片这关键性的一步。业内资深人士表示,此举将成为一项重大战略措施,也对应着可观的投资数额,其年均成本也许将高达数亿美元。而且即使 OpenAI 为此投入资源,也无法保证必然获得成功。

 

如果能收购一家芯片企业,则可以加快 OpenAI 原研自有芯片的进程。比如,亚马逊曾在 2015 年收购 Annapurna Labs。

 

据一位知情人士透露,OpenAI 已经在考虑对一家潜在收购目标开展尽职调查。但 OpenAI 计划审查和收购的这家公司是谁,目前仍然成谜。

 

即使 OpenAI 继续推进定制芯片计划(包括实施收购),整个工作也可能要耗时数年,也就是说,该公司在相当长的时期内仍须调蓄依赖英伟达和 AMD 等商业供应商。

芯片短缺是导火索

 

今年 6 月,OpenAI 创始人 Sam Altman 与 Humanloop CEO Raza Habib 以及其他 20 位开发者面对面进行了一场闭门交流。Altman 表示,目前 OpenAI 正受到 GPU 资源的严重限制,导致不少短期计划已经被迫推迟。

 

比如,微调 API 受到 GPU 资源的限制。因为还没用上 Adapters 或 LoRa 等高效微调方法,所以 OpenAI 的微调运行和管理仍须占用大量算力。未来微调的支持效果会更好,OpenAI 甚至可能为社区贡献模型设立专门的市场。

 

在这次闭门会上,几家大客户还抱怨了 API 的可靠性和速度表现。Altman 认同这些意见,并解释称主要问题源自 GPU 供应不足。

 

此外,Altman 还曾公开抱怨图形处理单元供应不足,目前该市场由英伟达所主导,其在全球范围内控制着 AI 应用类处理芯片超 80% 的市场份额。

 

Altman 强调,之所以要努力扩大芯片来源,主要基于两个现实问题:为 OpenAI 软件提供支持的先进处理器严重不足,且现有工作及产品所依赖的底层硬件所造成的运行成本“令人眼花缭乱”。

 

在大语言模型和 AIGC 大爆发后,各 AI 企业对于 GPU 的需求比以往任何事时候都要紧迫。英伟达的高端 GPU 芯片价格已经达到了每片数万美元,AI 基础设施公司正在以数万台的价格购买它们。

 

马斯克也曾表示他已经为他的新 AI 初创公司 X.AI 购买了 3 万多块英伟达顶级的 H100 GPU 芯片,每个价格超过 3 万美元。此外,Meta 和微软已经是今年英伟达 GPU 的最大买家之一(Meta 可能排名第一,因为 Facebook、Instagram、WhatsApp 和 Messenger 应用程序中有很多 AI 增强的东西要用到 GPU)。

 

这就是为什么从 Altman 会表示 OpenAI 也很缺 GPU 的原因。Sam Altman 也曾在媒体采访中公开强调过 GPU 的可用性如何影响 OpenAI 今年及以后的计划。

 

自 2020 年以来,OpenAI 在就一直在其最大支持者之一微软提供的大型计算系统之上开发生成式 AI 技术。这套计算系统搭载有 1 万个英伟达图形处理单元(GPU)。

 

对于任何企业来说,ChatGPT 的运行成本都绝不是一个小数目。根据 Bernstein 分析师 Stacy Rasgon 的推测,ChatGPT 的单次查询成本约为 4 美分。如果 ChatGPT 查询最终能够增长到谷歌搜索规模的十分之一,则启动阶段就需要价值约 481 亿美元的 GPU,后续每年还需要价值约 160 亿美元的芯片才能保持服务运行。

大厂集体迈入自研芯片时代?

 

在芯片短缺背景下,不少大型科技企业都开始自研芯片,但成果却相当有限。

 

据路透社报道,Meta 的定制芯片研发就一直进展不顺,导致该公司最终废弃了部分 AI 芯片项目。作为 Facebook 的母公司,Meta 目前正开发一款新型芯片,希望能涵盖所有 AI 类型。

 

另据技术外媒 The Information 报道,OpenAI 的主要支持者微软也在开发定制 AI 芯片,并交由 OpenAI 进行测试。OpenAI 自研 AI 芯片的消息可能标志着两家公司将由此分道扬镳、各自安好。

 

自去年 ChatGPT 发布以来,全球市场对于专用 AI 芯片的需求可谓一路狂飙。最新生成式 AI 技术的训练和运行都需要特定芯片、或者说 AI 加速器的支持,而英伟达则是少数几家能够生产实用型 AI 芯片并在市场上占据主导地位的芯片制造商之一。

 

如果真能开发自己的 AI 芯片,则意味着 OpenAI 将成功跻身少数科技巨头之列。对于 OpenAI 的自研芯片前景,你是否看好呢?

 

参考链接:

https://www.reuters.com/technology/chatgpt-owner-openai-is-exploring-making-its-own-ai-chips-sources-2023-10-06/

https://web.archive.org/web/20230601000258/https://website-nm4keew22-humanloopml.vercel.app/blog/openai-plans

https://www.infoq.cn/article/xZaNyw2QsZcxmNXUvkZv

2023-10-07 14:305486

评论

发布
暂无评论
发现更多内容

带你一同认识和使用JPA框架进行开发你的应用服务

Java你猿哥

Java SSM框架 jpa Java工程师

安装Zookeeper和Kafka集群

Java你猿哥

Java kafka zookeeper SSM框架 Java工程师

测试环境治理之MYSQL索引优化篇

京东科技开发者

MySQL 性能优化 测试环境 企业号 4 月 PK 榜

深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

汀丶人工智能

人工智能 机器学习 深度学习 损失函数

从源码角度深入解析Callable接口

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号 4 月 PK 榜

字节面试官:你没有高并发、性能调优经验,为什么录取你?

做梦都在改BUG

Java 高并发 性能调优

百度CTO王海峰做客《中国经济大讲堂》:文心一言,读书破万亿

飞桨PaddlePaddle

飞桨 文心一言

面试了个985毕业的大佬,回答“性能调优”题时表情令我毕生难忘

做梦都在改BUG

Java 性能优化 性能调优

清单推荐:常见的研发效能度量指标(科学管理版)

LigaAI

研发管理 技术管理 效能度量 研发效能度量 企业号 4 月 PK 榜

4 月 22 日丨【云数据库技术沙龙】技术进化,让数据更智能

NineData

MySQL 数据库 程序员 开发者 Clickhouse

网络编程懒人入门(十五):外行也能读懂的网络硬件设备功能原理速成

JackJiang

网络编程 即时通讯 IM

最近,我们做了一次“实景”容灾演练

云布道师

阿里云

Scrum敏捷研发和项目管理

顿顿顿

Scrum 敏捷开发 敏捷开发流程 leangoo 敏捷开发管理工具

浅谈离线数据倾斜

京东科技开发者

hive sql 数据倾斜 Spark java 企业号 4 月 PK 榜

白活了!谷歌架构师10年心血汇成的《24种设计模式》,这才是正解

做梦都在改BUG

Java 设计模式

“淄”味当道,工赋十足

Openlab_cosmoplat

开源社区 双碳

Apifox 更新 | WebSocket 接口调试功能上线!

Apifox

程序员 开发工具 Apifox API 接口工具

剖析多利熊业务如何基于分布式架构实践稳定性建设

百度Geek说

分布式 稳定性 多利熊 企业号 4 月 PK 榜

阅读完synchronized和ReentrantLock的源码后,我竟发现其完全相似

做梦都在改BUG

Java 源码 synchronized ReentrantLock

全量通过,华为云GaussDB首批完成信通院全密态数据库评测

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

软件复杂度的思考与解决之道

阿里技术

技术成长 软件复杂度

接口设计文档的12个注意点

做梦都在改BUG

Java 后端开发 接口设计

华为云新一代iPaaS全域融合集成平台全新升级

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

Groovy def关键字妙用

FunTester

InfluxDB vs TDengine,用数据“说”性能

TDengine

大数据 tdengine Influxdb 时序数据库 InfluxDB Cluster

JDK8到JDK17有哪些吸引人的新特性?

京东科技开发者

Java jdk8 jdk17 java 8 的新特性 企业号 4 月 PK 榜

【架构与设计】常见微服务分层架构的区别和落地实践

京东科技开发者

架构 微服务 DDD 分层架构 企业号 4 月 PK 榜

Dock优化工具:HyperDock mac中文激活版

真大的脸盆

Mac Mac 软件 优化工具

Kubernetes集群调度增强之超容量扩容

京东科技开发者

Kubernetes k8s 集群 企业号 4 月 PK 榜 超容量扩容

如何用scrum敏捷工具做迭代规划及迭代执行。

顿顿顿

Scrum Sprint 敏捷开发管理工具 敏捷工具 迭代规划

火山引擎DataTester:让企业“无代码”也能用起来的A/B实验平台

字节跳动数据平台

AB testing实战 无代码 A/B 测试 企业号 4 月 PK 榜 企业增长

打破英伟达芯片短缺制约,OpenAI决定自研AI芯片:正物色收购目标_企业动态_凌敏_InfoQ精选文章