写点什么

AI 芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

  • 2024-09-27
    北京
  • 本文字数:1635 字

    阅读完需:约 5 分钟

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

根据咨询研究机构贝恩公司本周发布的一份报告,随着 AI 计算需求的激增,数据中心芯片、个人电脑和智能手机的供应链将面临重大压力。其指出,持续的地缘政治紧张局势和其他供应风险可能会导致下一轮半导体短缺


半导体的供需是一个微妙的平衡,过去几年的经历让业界对此深有感触。在此背景下,贝恩公司呼吁各方密切关注半导体供应链的复杂性——“当需求增加约 20% 或更多,很有可能打破平衡,导致芯片短缺’。”

从报告来看,其关键观察有以下几点:


  1. 数据中心及其专用芯片的支出依然强劲,主要云服务提供商预计在 2024 年的资本支出将同比增长 36%,这一增长主要源于对 AI 和加速计算的投资。

  2. 如果数据中心对当前一代图形处理单元(GPU)的需求到 2026 年翻倍——鉴于当前的趋势,这是一个合理的假设,那么关键部件的供应商在某些情况下需要将产量增加 30% 或更多。

  3. 为促进 AI 的增长,必须在建设数据中心、晶圆厂、先进封装技术和电力保障等方面整合复杂的供应链要素,确保获得先进的封装技术和充足的电力。


虽然报告的重点是购买芯片的组织需要做什么,但首席信息官们可以采取一些措施,以确保将来能获得所需的产品,或为价格剧烈波动做好准备。


Info-Tech 研究集团的研究主管 Scott Bickley 指出,先进的半导体供应链是全球最脆弱的供应链之一,必须有超过 5000 家供应商完美协作才能生产最先进的芯片。


他说,其中许多供应商“为单个公司供应单一的组件,如果没有它们,整个系统就会嘎然而止。单是技术障碍就令人瞠目结舌,更不用说台积电面临的地缘政治风险和物流管理的阻力了。”


Bickley 还表示,技术买家主要分为两类:一类是为大规模基础设施采购的买家,例如私有云环境...... 也可以说是财富 200 强规模的客户;另一类则是为小规模项目采购的买家,比如数据中心现代化、小规模的 LLM 内部模型,以及先进的 AI 功能 PC。


在私有云层面,Bickley 建议买家应立即制定技术战略。举例来说,你是否要大干一场,押注于英伟达下一代 Blackwell 系列 GPU,或选择第一代 H100 进行模型训练。数据中心基础设施的挑战不容小觑,尤其是在水冷环境和高密度 GPU 集群的设计上,以平衡能耗、性能和环境要求。


而传统企业环境中的技术买家面临的挑战则不同,他们由于规模较小,对供应商的影响力有限,在这种环境中,这些买家将不得不过度扩张,现在就下注,以确保以后的供应。“为生产延迟做提前规划可能需要买家承担一些昂贵的前沿技术产品库存,并且这些产品可能很快就会过时。”


Forrester Research 的高级分析师 Alvin Nguyen 补充道,谈到首席信息官可以做些什么来确保他们能够继续获得所需的产品,或者为价格的剧烈变化做好准备,他们需要考虑几个方面:

  • 风险管理:Nguyen 说,生成式 AI 的进展速度以及对特定模型或方法的巨额投资,日后可能被证明是错误或非最佳的选择:“对于大多数希望利用 AI 而非推动 AI 市场发展的企业来说,规避风险,利用现有的 AI 服务,而不是大力获取大量 AI 基础设施,是最有意义的。”

  • 人员培训:首席信息官和技术高管“需要投资于 现有员工的培训 / 技能提升,以及为已知的可有效利用的 AI 用例(如代码开发)招聘具备基本 AI 技能的新人才。他们需要让他们的技术人员、架构师和工程师试验最新的 AI 技术,以确定他们需要做出的选择。如果你能够获取大量的 AI 基础设施,那么就在这里大量投资,以建立相对于他人的竞争优势。”

  • AI 基础设施:目前 AI 加速器的需求超出供应,在未来几年内不太可能改变,因此 AI 加速器 /GPU 目前会有溢价。因此,企业可以考虑利用云服务提供商的 AI 服务。

  • 可持续性:生成式 AI 对更多能源和水资源的需求,以及其碳足迹,已经影响了一些组织实现其可持续性目标的能力。在对 AI 的需求持续增长的情况下,这种情况不太可能改变。因此首席信息官和技术高管需要从可再生能源中采购电力,并在可能的情况下采用可持续的建筑和运营实践(建筑材料的选择、施工方法、回收利用)。


参考链接:

https://www.cio.com/article/3540407/bain-warns-prepare-for-ai-chip-shortage.html

2024-09-27 14:539073

评论

发布
暂无评论
发现更多内容

微服务的版本号要怎么设计?

江南一点雨

微服务 语义化

公共服务 智慧政务数据可视化大屏一体化系统

2D3D前端可视化开发

数据可视化 数字政务 智慧政务 数字政府 可视化大屏

ISV生态合作伙伴体系多领域赋能,开拓市场赛道

元年技术洞察

数据中台 数据 数字化转型 ISV 方舟平台

ProgressBar(进度条)

芯动大师

Android Studio 进度条 ProgressBar

视频实时自然美颜, 无惧素颜上镜

HarmonyOS SDK

HMS Core

重磅发布丨从云原生到 Serverless,先行一步看见更大的技术想象力

Serverless Devs

Jenkins 项目的 gpg: signing failed: Bad passphrase 错误

HoneyMoose

如何把 高并发限流 实现的那叫一个优雅!

风铃架构日知录

Java 程序员 高并发 IT 限流

一次JVM GC长暂停的排查过程

京东科技开发者

Java 后端 JVM 虚拟机 企业号 1 月 PK 榜

一次关于 MySQL 主从模式采用 GTID 的实践记录

风铃架构日知录

Java MySQL IT 主从复制 MySQL 数据库

ShardingSphere分库分表schema名称导致NPE问题排查记录

小小怪下士

Java 程序员 后端

云图说 | Workflow:流水线工具,助您高效完成AI开发

华为云开发者联盟

人工智能 华为云 AI开发 企业号 1 月 PK 榜

2023年,祝你有个好习惯!

石云升

习惯 年终总结 1月月更

React源码分析5-commit

flyzz177

React

Postgresql分析慢sql

查拉图斯特拉说

数据库 postgresql db PgSQL PG库

一个词语总结2022,你的是什么? | 2022 年度总结

陈言必行

2022年终总结

React源码分析7-state计算流程和优先级

flyzz177

React

二维码的秘密

古时的风筝

二维码 二维码生成

关于 Serverless 应用架构对企业价值的一些思考

Serverless Devs

甩掉容量规划炸弹:用 AHPA 实现 Kubernetes 智能弹性伸缩

阿里巴巴中间件

阿里云 Kubernetes 云原生 AHPA

Java高手速成 | 高质量代码编写最佳实践

TiAmo

编程好习惯 设计原则 Java’

Jenkins 构建过程中提示 GPG 错误

HoneyMoose

带你认识数仓的增量备份核心设计

华为云开发者联盟

数据库 后端 华为云 数仓 企业号 1 月 PK 榜

Git操作不规范,战友提刀来相见!

王中阳Go

golang git 深度思考 高效工作 学习方法

2022年终总结:一年读完的40本书

石云升

读书笔记 年终总结 1月月更

LogicFlow安装与准备工作

小鑫同学

前端 vite Vue 3 Vue3 Typescript

为什么网络I/O会被阻塞

华为云开发者联盟

后端 开发 华为云 企业号 1 月 PK 榜

React源码分析6-hooks源码

flyzz177

React

《金融电子化》:隐私计算赋能银行助贷业务自主风控 | 华夏银行×洞见科技

洞见科技

隐私计算 风控

Serverless 奇点已来,下一个十年将驶向何方?

Serverless Devs

ClickHouse 挺快,esProc SPL 更快

陈橘又青

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?_芯片与网络_Paul Barker_InfoQ精选文章