随着人工智能(AI)在企业运营中的核心作用日益凸显,越来越多的企业开始将目光投向这一前沿技术,准备投入巨资以获取竞争优势。AI 芯片则成为推动这一切的关键。尽管过去 AI 芯片在一定程度上被忽视,但最近,OpenAI 的 Sam Altman 宣称,他计划筹集高达 7 万亿美元的资金,用于支持一项 “野心勃勃” 的科技项目,旨在大幅提升全球芯片产能。抛开地缘政治等因素不谈,关注 AI 芯片意味着要了解今天的挑战和明天的机遇。
根据 IMARC 最近的一项研究,到 2029 年,全球人工智能芯片市场预计将达到 8960 亿美元。这一预测基于多个因素,包括人工智能技术的持续进步、消费电子产品对 AI 芯片需求的不断增长,以及 AI 芯片领域的创新活动日益活跃。
在 AI 硬件领域,拥有丰富经验和深刻见解的专家并不多见,Alphawave 的首席执行官兼联合创始人 Tony Pialis 正是其中之一。在一次对话中,Pialis 分享了他对 AI 芯片领域的独到观点,其中涉及芯片技术的变革性发展、专用于训练和推理的硬件创新,以及模拟和光学计算等新兴方向的前景。
在半导体创业领域,Tony Pialis 的名字堪称传奇。他先后创立并成功出售了两家初创公司:Snowbush Microelectronics 和 V Semiconductor Inc。其中,V Semiconductor 在 2012 年被英特尔收购,Pialis 在此期间担任了模拟和混合信号 IP 的副总裁。
2017 年,Pialis 与合作伙伴共同创立了 AlphaWave,目标直指 “下一个伟大的半导体公司”。Alphawave 于 2021 年上市,市值达到 45 亿美元。该公司的核心产品包括硅 IP、芯片、定制硅和高速互连技术,专为谷歌、微软、亚马逊和 Meta 等主要超级扩展客户量身定制。
Alphawave 之所以能成为人工智能领域的幕后推手,背后离不开 Pialias 的前瞻性思考。他敏锐地观察到,如今推动数据中心和计算扩展的主要力量已不再是传统的网络设备供应商如思科,而是转向了谷歌、微软、亚马逊和 Meta 等超级扩展器。这些科技巨头不仅具备强大的内部设计能力,还自主构建服务器、网络、数据中心和校园基础设施。
在 Pialias 看来,人工智能发展的主要挑战并非计算本身。实际上,设计和实现计算的能力早已成熟。真正的挑战在于如何处理海量数据所需的连接技术。而这正是 AlphaWave 所专注的领域。
专用人工智能硬件的爆炸性增长
虽然像 ChatGPT 这样的消费者应用在 2023 年初引发了热潮,但有关企业采用的报告却褒贬不一。然而,据 Pialis 称,AI 半导体行业在 2023 年下半年在各行各业和地理位置都出现了巨大的投资和新的设计。
Pialis 指出,美国、加拿大、英国、法国、德国、韩国和日本等国家纷纷提出了建立国内 AI 芯片能力的主要国家倡议。这些国家长期以来依赖于 NVIDIA 等供应商,但现在各国政府正努力培育本土芯片产业,以减少对单一供应商的战略依赖。尽管 NVIDIA 首席执行官 Jensen Huang 也强调每个国家都需要主权 AI,但这似乎不包括硬件层面。
Pialis 认为,这种激增的需求不仅促进了初创企业的兴起,还推动了科技巨头开发专门的训练和推理硬件。在他看来,虽然并非每个组织都能或应该开发自己的 AI 模型,但这种情况注定会发生变化。
Pialis 预测:“随着时间的推移,AI 将不可避免地发展成为类似公用事业的东西,超级扩展器将提供所有计算能力的访问权,就像电力一样。我认为这将是价格合理的。任何人都将能够使用这种公用事业来训练、开发、优化和部署他们自己的模型。”
然而,他也承认,在达到这一状态之前,还有很多收益可以获取,而最终实现这种状态所需的时间仍充满不确定性。
人工智能芯片竞赛中的参与者
在 AI 加速器领域,NVIDIA 无疑是当前的领军者,这一点得到了包括 Pialis 在内的业界人士的广泛认可。同时,AMD 也被视为有力的竞争者,其 CEO Lisa Su 的领导能力受到了赞誉。此外,还有如 Ben Lorica 等行业观察者看好 AMD 在 GenAI 芯片市场上的潜力。
然而,Pialias 警告称,不应忽视英特尔在这个领域中的潜力。他特别提到,由 David Dahan 领导的英特尔 Habana 收购部门是该领域的一匹黑马,具有强大的实力。作为曾在英特尔工作过的人,Pialis 对 Habana 的工作给予了高度评价。
通过报道 Habana、与 Dahan 见面并追踪他们的 MLPerf 结果,我们倾向于同意这一观点。Dahan 帮助设计了新的英特尔处理器,在关键基准测试中展现出了超越 NVIDIA 最新 GPU 的性能。
尽管性能至关重要,但 Pialias 也指出,NVIDIA 在 AI 芯片领域的软件平台,包括 CUDA,为其带来了巨大的竞争优势。生态系统效应显著,众多工程师和研究人员为 NVIDIA 的架构开发了优化的框架和模型。
然而,这并不意味着没有替代的可能性。Pialis 认为,借鉴 AMD 的经验,AI 硬件公司需要配备足够的软件工程师来支持硬件工程师的工作。尽管目前关于 NVIDIA 和硬件的讨论很多,但实际上,大部分的投资都集中在软件上。
这一点得到了 NVIDIA 的 Dave Salvator 的证实。在 2023 年最后一次 MLPerf 结果简报会上,Salvator 表示,NVIDIA 拥有两倍于硬件工程师数量的软件工程师。他强调,这并非偶然,而是公司战略的重要组成部分。
Pialis 认为,在推理加速器市场上,挑战者具有更大的潜力,因为该领域的标准仍在形成中。例如,OctoML 的 Luis Ceze 分享了 vLLM、MLC-LLM、LoRAX 和 Punica 等创新解决方案,这些方案分别针对 LLM 服务、便携式部署、多路复用微调模型推理等不同需求。事实上,推理市场的规模比训练市场更为庞大,正如 Pialis 所指出的那样。
“人们往往更关注训练、大模型和训练成本,但我们都在推理端受益。这需要大规模部署,需要多样化的解决方案。推理端将销售更多的芯片,我相信随着销量的增加,商业计划也会得到相应的改善。”Pialis 说道。
初创公司如 Groq 和 Tenstorrent 正在吸引大量资金,而来自英国、韩国和中国等国家的公司也在努力减少对美国公司的依赖。在超级扩展器方面,Pialis 认为亚马逊和谷歌处于领先地位,微软展现出强劲的发展势头,而 Meta 则稍显落后,甚至有传言称他们可能会收购一家较小的初创公司来增强自身实力。
芯片组件引领技术革命
据 Pialis 所述,半导体行业正经历一场重大变革,即向芯片组件的转变。过去,技术进步的标志是将更多功能集成到单一芯片中。然而,随着晶体管尺寸缩小至约 5 个原子宽度,即便是微小的缺陷也可能导致整个芯片失效。
Pialis 通过自身经历进一步阐释了这一点。他提到,在某次访问 OpenAI 时,目睹了一群工程师跪在服务器前祈祷。他们的担忧并非源于 “对通用人工智能的敬畏”,而是害怕训练的模型因芯片缺陷而崩溃。
芯片组件在中美贸易战的背景下备受关注,成为两国科技战略的核心组成部分。对于中国和美国而言,芯片组件不仅是技术进步的象征,更是维护国家科技竞争力的关键。
Pialis 认为,“芯片组件是对抗技术极限的又一次革命性创新。”
这些挑战并非源于超自然力量,而是由纳米尺度下物理定律的复杂性所引发。
Pialis 解释道:“当我们制造晶体管 —— 集成电路的基本构件时,实际上是在操控原子。随着原子数量的减少,从数百个到仅两个,概率和平均法则不再适用。因此,我们更容易遇到缺陷问题。”
为了克服这些纳米尺度带来的物理挑战,芯片组件作为一种创新解决方案应运而生。这种设计方法将传统的单一大芯片拆分为更小的、类似乐高积木的芯片组件,并通过先进的封装技术将它们连接起来。这种模块化设计允许制造商避免因单个组件的缺陷而废弃整个设备,从而显著提高了生产效率。Pialis 表示,这种好处对制造商和买家都很重要。
Pialis 强调:“在这一变革中,硅的角色正在发生转变。它不再是领先半导体的核心,而是成为了封装技术中的一个组件。当前,关于半导体供应链的讨论如火如荼,硅的产能充足。然而,在封装方面,特别是利用芯片组件构建的设计方面,产能仍然捉襟见肘。”
芯片组件作为乐高积木般的构建块
在众多 AI 硬件公司中,Cerebras 以其独特的晶圆级硬件设计脱颖而出。尽管 Pialis 认为 Cerebras 同样会面临纳米尺度上的物理挑战和缺陷问题,但他也指出,Cerebras 的方法在于其冗余性设计。
在 Cerebras 的方案中,晶圆被视为一个整体面板,而不是被切割成单独的芯片。这意味着芯片之间的连接和交互在晶圆级别上得以实现,从而通过软件处理潜在的缺陷。这种方法的独特之处在于,它摒弃了传统的封装方式,而是将多个芯片在晶圆上直接连接。
然而,Pialias 也强调了切割芯片的优势。对于像英特尔这样的供应商来说,通过将硬件拆分成更小的部件,如 CPU、GPU、DPU 或网络设备,这些部件就像乐高积木一样,可以根据不同的需求进行组合和配置。
因此,你可以有一个处理器核心芯片组件,一个 PCI Express 连接性芯片组件,一个以太网网络芯片组件,一个 DDR 内存 I/O 芯片组件,一个内存 I/O 芯片组件。这些芯片组件可以混合搭配在一个封装中,构建出整个产品系列。Pialis 认为,从设计复杂性和前期投资的角度来看,这是一个成功的方案。
据 Pialis 估计,采用芯片组件的方法可以将成本降低 60% 以上,功耗降低 40%。这对于超大规模数据中心来说是一个巨大的激励因素。尽管目前苹果、AMD 和英特尔等公司在芯片组件领域处于领先地位,但 Pialias 认为,随着技术的不断进步和市场的竞争加剧,芯片组件将成为任何专注于领先硬件的公司的必备条件。
软件与芯片组件模块化、组合和可编程性
在软件工程中,模块化已成为一种标准的构建方式,这不禁让人思考,为何芯片组件的模块化概念没有早些时候在硬件领域得到普及。历史上,硬件领域的胜利者往往是那些能将最多功能集成到单片式设备中的厂商。
Pialis 指出,这背后的主要原因是成本考量。单片集成降低了制造成本,因此 “对集成的狂热关注” 成为了行业主流。然而,随着技术接近原子尺度,制造成本开始超过集成成本,这一传统观念开始受到挑战。
与此同时,软件领域也面临着过度模块化可能带来的过度开销问题。
Pialis 预计,一些硬件供应商可能会过度采用芯片组件的方法。如果功能被过度分解为微小的部分,整合这些部分的成本可能会受到限制。因此,他认为最终将是一种混合方法获得胜利。使用芯片组件进行分解有两种主要方式。
构建芯片组件的第一种方式是构建一种标准的、可镜像的芯片组件,这些组件具有相同的功能,并通过软件实现互相通信。这种方式在某种程度上与传统的硬件集成方法相似。然而,如何将这些相同的芯片组件积木组合在一起,则依赖于软件的设计和实现。
可以根据相同的芯片组件,使用软件为不同的需求组合不同的封装。例如,1、2、4 或 8 个芯片组件的多重。相同的硅,只是以不同的方式封装,价格不同,并且具有不同的软件来利用与这些设备相关的递增计算和内存带宽。
另一种构建芯片组件的方法是通过分割和切割,为不同类型的功能创建专门的芯片组件,类似于乐高积木。这可以创建出如计算芯片组件、训练 I/O 芯片组件、网络 I/O 芯片组件等多样化的构建块。Pialias 认为,这种方法背后的推动力更大,因为它不仅可以降低制造成本,还可以通过重用这些乐高积木来加速其他产品的开发。
模拟人工智能、光学计算和人工智能辅助硬件设计
在当前以 GPU 等数字加速器为主导的时代,尽管芯片组件提供了一种即时的前进方法,但 Pialias 强调,仍有其他根本性的技术分歧值得探索。
人工智能的核心在于大规模并行的算术处理,其中二进制计算是主导方法。在二进制体系中,数字被简化为 1 和 0,而浮点算术则依赖于精度和范围的设定。
然而,模拟算术处理提供了一种不同的视角。在这种方法中,浮点数可以通过电压或电流来表示,理论上具有无限的精度。尽管在现实世界的噪声干扰下,这种方法的精度可能会受限,但对于边缘人工智能应用来说,它可能是一种有效的解决方案。微小电流的利用使得设备能够在低功耗状态下运行。
还有另一种形式的计算,一些公司正在投资其中:光学计算也为算术运算带来了新的可能性。光学计算利用光学特性实现 MAC(乘积累加功能),这是任何算术单元的核心。这种方法有望降低功耗要求。
Pialias 指出,模拟和光学计算正在吸引数十亿美元的投资,以满足在计算规模、能源效率和精度方面的专业需求。然而,目前尚不清楚模拟技术是否能够有效地扩展,以匹配数字计算在尖端人工智能模型中的应用。这一问题在硬件界引发了激烈的辩论。
此外,利用人工智能来设计用于驱动人工智能的硬件也成为一个新兴议题。Pialias 表示,如今最有效的硬件设计者往往是那些具备丰富软件开发经验的专家。如果能够将他们的经验融入人工智能模型的训练中,可能会引发硬件设计领域的彻底变革。
虽然未来的道路充满挑战和不确定性,但 Pialias 坚信工程的基本原则是永恒的。我们期待这些新兴技术能够在不耗尽世界能源和资源的前提下,为人工智能和计算技术的发展带来新的突破。
作者简介:
George Anadiotis 在信息技术领域拥有丰富的经验。他的职业生涯涵盖了分析师、顾问、工程师、创始人和研究员等多个角色。目前在 Linked Data Orchestration 担任研究员和作家。George 在成为“一人乐队”和“乐队指挥”的过程中,有机会学习和掌握了许多技能。他曾在 Gigaom 担任分析师,为财富 500 强企业、初创公司和非政府组织提供咨询服务,负责建设和管理各种规模和形式的项目、产品和团队。George 热衷于研究、开发、应用和讨论前沿概念和技术。是企业应用集成和大规模数据集成领域的先驱之一。
原文链接:
https://dzone.com/articles/the-future-of-ai-chips-leaders-dark-horses-and-ris
评论