写点什么

AI 芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

  • 2024-09-27
    北京
  • 本文字数:1635 字

    阅读完需:约 5 分钟

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?

根据咨询研究机构贝恩公司本周发布的一份报告,随着 AI 计算需求的激增,数据中心芯片、个人电脑和智能手机的供应链将面临重大压力。其指出,持续的地缘政治紧张局势和其他供应风险可能会导致下一轮半导体短缺


半导体的供需是一个微妙的平衡,过去几年的经历让业界对此深有感触。在此背景下,贝恩公司呼吁各方密切关注半导体供应链的复杂性——“当需求增加约 20% 或更多,很有可能打破平衡,导致芯片短缺’。”

从报告来看,其关键观察有以下几点:


  1. 数据中心及其专用芯片的支出依然强劲,主要云服务提供商预计在 2024 年的资本支出将同比增长 36%,这一增长主要源于对 AI 和加速计算的投资。

  2. 如果数据中心对当前一代图形处理单元(GPU)的需求到 2026 年翻倍——鉴于当前的趋势,这是一个合理的假设,那么关键部件的供应商在某些情况下需要将产量增加 30% 或更多。

  3. 为促进 AI 的增长,必须在建设数据中心、晶圆厂、先进封装技术和电力保障等方面整合复杂的供应链要素,确保获得先进的封装技术和充足的电力。


虽然报告的重点是购买芯片的组织需要做什么,但首席信息官们可以采取一些措施,以确保将来能获得所需的产品,或为价格剧烈波动做好准备。


Info-Tech 研究集团的研究主管 Scott Bickley 指出,先进的半导体供应链是全球最脆弱的供应链之一,必须有超过 5000 家供应商完美协作才能生产最先进的芯片。


他说,其中许多供应商“为单个公司供应单一的组件,如果没有它们,整个系统就会嘎然而止。单是技术障碍就令人瞠目结舌,更不用说台积电面临的地缘政治风险和物流管理的阻力了。”


Bickley 还表示,技术买家主要分为两类:一类是为大规模基础设施采购的买家,例如私有云环境...... 也可以说是财富 200 强规模的客户;另一类则是为小规模项目采购的买家,比如数据中心现代化、小规模的 LLM 内部模型,以及先进的 AI 功能 PC。


在私有云层面,Bickley 建议买家应立即制定技术战略。举例来说,你是否要大干一场,押注于英伟达下一代 Blackwell 系列 GPU,或选择第一代 H100 进行模型训练。数据中心基础设施的挑战不容小觑,尤其是在水冷环境和高密度 GPU 集群的设计上,以平衡能耗、性能和环境要求。


而传统企业环境中的技术买家面临的挑战则不同,他们由于规模较小,对供应商的影响力有限,在这种环境中,这些买家将不得不过度扩张,现在就下注,以确保以后的供应。“为生产延迟做提前规划可能需要买家承担一些昂贵的前沿技术产品库存,并且这些产品可能很快就会过时。”


Forrester Research 的高级分析师 Alvin Nguyen 补充道,谈到首席信息官可以做些什么来确保他们能够继续获得所需的产品,或者为价格的剧烈变化做好准备,他们需要考虑几个方面:

  • 风险管理:Nguyen 说,生成式 AI 的进展速度以及对特定模型或方法的巨额投资,日后可能被证明是错误或非最佳的选择:“对于大多数希望利用 AI 而非推动 AI 市场发展的企业来说,规避风险,利用现有的 AI 服务,而不是大力获取大量 AI 基础设施,是最有意义的。”

  • 人员培训:首席信息官和技术高管“需要投资于 现有员工的培训 / 技能提升,以及为已知的可有效利用的 AI 用例(如代码开发)招聘具备基本 AI 技能的新人才。他们需要让他们的技术人员、架构师和工程师试验最新的 AI 技术,以确定他们需要做出的选择。如果你能够获取大量的 AI 基础设施,那么就在这里大量投资,以建立相对于他人的竞争优势。”

  • AI 基础设施:目前 AI 加速器的需求超出供应,在未来几年内不太可能改变,因此 AI 加速器 /GPU 目前会有溢价。因此,企业可以考虑利用云服务提供商的 AI 服务。

  • 可持续性:生成式 AI 对更多能源和水资源的需求,以及其碳足迹,已经影响了一些组织实现其可持续性目标的能力。在对 AI 的需求持续增长的情况下,这种情况不太可能改变。因此首席信息官和技术高管需要从可再生能源中采购电力,并在可能的情况下采用可持续的建筑和运营实践(建筑材料的选择、施工方法、回收利用)。


参考链接:

https://www.cio.com/article/3540407/bain-warns-prepare-for-ai-chip-shortage.html

2024-09-27 14:538639

评论

发布
暂无评论
发现更多内容

带你认识图数据库性能和场景测试利器LDBC SNB

华为云开发者联盟

人工智能 华为云 图数据库

4种方法教你如何查看java对象所占内存大小

华为云开发者联盟

Java 开发 内存 代码

国内首家!EMQ加入亚马逊云科技“初创加速-全球合作伙伴网络计划”

EMQ映云科技

物联网 IoT emq 亚马逊 6月月更

【ELT.ZIP】OpenHarmony啃论文俱乐部—见证文件压缩系统EROFS

ELT.ZIP

OpenHarmony 压缩数据 压缩算法 ELT.ZIP

工作流自动化 低代码是关键

力软低代码开发平台

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

鳄鱼视界

在线文本按行批量反转工具

入门小站

工具

2022年中国音频市场年度综合分析

易观分析

音频市场

2022年第一季度消费金融APP用户洞察——总数达4479万人

易观分析

消费金融

拥抱云原生:江苏移动订单中心实践

鲸品堂

云原生

SQL报了一个不常见的错误,让新来的实习生懵了

华为云开发者联盟

数据库 sql 程序员 后端 华为云

什么是 ICMP ?ping和ICMP之间有啥关系?

wljslmz

网络协议 ping ICMP 6月月更

大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测

阿里云弹性计算

大数据 io SSD NoSQL 数据库

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

小哈区块

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

西柚子

Vue3 - $attrs 的几种用法(1个或多个根元素、Options API 和 Composition API)

德育处主任

Vue composition-api 组件通信 6月月更 Vue透传

【ELT.ZIP】OpenHarmony啃论文俱乐部—数据密集型应用内存压缩

ELT.ZIP

OpenHarmony 压缩数据 压缩算法 ELT.ZIP

Substrate 源码追新导读: 4月底重大更新: Nomination Pool 即将上线, NFT增加锁定功能

彭亚伦

Substrate 波卡 波卡生态

跟着官方文档学 Python 之:简介

甜甜的白桃

Python 零基础 6月月更

可观测,才可靠:云上自动化运维CloudOps系列沙龙 第一弹

阿里云弹性计算

DevOps 可观测性 自动化运维 CloudOps

如何使用物联网低代码平台进行画面管理?

AIRIOT

低代码 物联网 低代码开发 低代码开发平台 低代码,项目开发

开源二三事|ShardingSphere 与 Database Mesh 之间不得不说的那些事

SphereEx

数据库 SphereEx Apache ShardingSphere Database Mesh Pisanix

基于 Nebula Graph 构建百亿关系知识图谱实践

NebulaGraph

知识图谱 Nebula Graph

OpenSSF 安全计划:SBOM 将驱动软件供应链安全

SEAL安全

软件物料清单

数仓的字符截取三胞胎:substrb、substr、substring

华为云开发者联盟

数据库 后端 开发 华为云

等保2.0密码要求是什么?法律依据有哪些?

行云管家

网络安全 等保 等保2.0

NFT双币质押流动性挖矿dapp合约定制

开发微hkkf5566

如何制作登录界面

海瞳Seapupil

Hi,你有一份Code Review攻略待查收!

Jianmu

后端 Code Review 代码规范 SonarQube checkstyle

【干货分享】红黑树硬核讲解

C++后台开发

后端开发 红黑树 linux开发 Linux内核 C++开发

等保三级密码复杂度是多少?多久更换一次?

行云管家

堡垒机 等级保护 过等保 等保2.0

AI芯片或面临新一轮短缺,首席信息官们如何提前布局应对?_芯片与网络_Paul Barker_InfoQ精选文章