根据咨询研究机构贝恩公司本周发布的一份报告,随着 AI 计算需求的激增,数据中心芯片、个人电脑和智能手机的供应链将面临重大压力。其指出,持续的地缘政治紧张局势和其他供应风险可能会导致下一轮半导体短缺。
半导体的供需是一个微妙的平衡,过去几年的经历让业界对此深有感触。在此背景下,贝恩公司呼吁各方密切关注半导体供应链的复杂性——“当需求增加约 20% 或更多,很有可能打破平衡,导致芯片短缺’。”
从报告来看,其关键观察有以下几点:
数据中心及其专用芯片的支出依然强劲,主要云服务提供商预计在 2024 年的资本支出将同比增长 36%,这一增长主要源于对 AI 和加速计算的投资。
如果数据中心对当前一代图形处理单元(GPU)的需求到 2026 年翻倍——鉴于当前的趋势,这是一个合理的假设,那么关键部件的供应商在某些情况下需要将产量增加 30% 或更多。
为促进 AI 的增长,必须在建设数据中心、晶圆厂、先进封装技术和电力保障等方面整合复杂的供应链要素,确保获得先进的封装技术和充足的电力。
虽然报告的重点是购买芯片的组织需要做什么,但首席信息官们可以采取一些措施,以确保将来能获得所需的产品,或为价格剧烈波动做好准备。
Info-Tech 研究集团的研究主管 Scott Bickley 指出,先进的半导体供应链是全球最脆弱的供应链之一,必须有超过 5000 家供应商完美协作才能生产最先进的芯片。
他说,其中许多供应商“为单个公司供应单一的组件,如果没有它们,整个系统就会嘎然而止。单是技术障碍就令人瞠目结舌,更不用说台积电面临的地缘政治风险和物流管理的阻力了。”
Bickley 还表示,技术买家主要分为两类:一类是为大规模基础设施采购的买家,例如私有云环境...... 也可以说是财富 200 强规模的客户;另一类则是为小规模项目采购的买家,比如数据中心现代化、小规模的 LLM 内部模型,以及先进的 AI 功能 PC。
在私有云层面,Bickley 建议买家应立即制定技术战略。举例来说,你是否要大干一场,押注于英伟达下一代 Blackwell 系列 GPU,或选择第一代 H100 进行模型训练。数据中心基础设施的挑战不容小觑,尤其是在水冷环境和高密度 GPU 集群的设计上,以平衡能耗、性能和环境要求。
而传统企业环境中的技术买家面临的挑战则不同,他们由于规模较小,对供应商的影响力有限,在这种环境中,这些买家将不得不过度扩张,现在就下注,以确保以后的供应。“为生产延迟做提前规划可能需要买家承担一些昂贵的前沿技术产品库存,并且这些产品可能很快就会过时。”
Forrester Research 的高级分析师 Alvin Nguyen 补充道,谈到首席信息官可以做些什么来确保他们能够继续获得所需的产品,或者为价格的剧烈变化做好准备,他们需要考虑几个方面:
风险管理:Nguyen 说,生成式 AI 的进展速度以及对特定模型或方法的巨额投资,日后可能被证明是错误或非最佳的选择:“对于大多数希望利用 AI 而非推动 AI 市场发展的企业来说,规避风险,利用现有的 AI 服务,而不是大力获取大量 AI 基础设施,是最有意义的。”
人员培训:首席信息官和技术高管“需要投资于 现有员工的培训 / 技能提升,以及为已知的可有效利用的 AI 用例(如代码开发)招聘具备基本 AI 技能的新人才。他们需要让他们的技术人员、架构师和工程师试验最新的 AI 技术,以确定他们需要做出的选择。如果你能够获取大量的 AI 基础设施,那么就在这里大量投资,以建立相对于他人的竞争优势。”
AI 基础设施:目前 AI 加速器的需求超出供应,在未来几年内不太可能改变,因此 AI 加速器 /GPU 目前会有溢价。因此,企业可以考虑利用云服务提供商的 AI 服务。
可持续性:生成式 AI 对更多能源和水资源的需求,以及其碳足迹,已经影响了一些组织实现其可持续性目标的能力。在对 AI 的需求持续增长的情况下,这种情况不太可能改变。因此首席信息官和技术高管需要从可再生能源中采购电力,并在可能的情况下采用可持续的建筑和运营实践(建筑材料的选择、施工方法、回收利用)。
参考链接:
https://www.cio.com/article/3540407/bain-warns-prepare-for-ai-chip-shortage.html
评论