当地时间 9 月 19 日,英特尔 On 技术创新大会(Intel Innovation) 2023 在美国加州圣何塞拉开帷幕,InfoQ 有幸受邀参会并从现场发回报道。英特尔 On 技术创新大会是一场面向开发者的大会,更是一个了解过去一年英特尔在不同方向(包括端侧计算、数据中心、边缘计算和云计算)取得的最新进展的好方法。来自全球的上千位开发者、英特尔合作伙伴和客户亲临这场盛会,以期全面了解英特尔将以怎样的新策略、新产品应对生成式 AI 大爆发带来的机遇和挑战。
图:InfoQ 记者拍摄于现场
AI 毫无疑问是贯穿大会首日主题演讲全程的重要关键词。围绕“让 AI 无处不在”这一主题,英特尔 CEO 帕特·基辛格在主题演讲中展示了英特尔如何在其各种硬件产品中加入 AI 能力,并通过开放、多架构的软件解决方案推动 AI 应用的普及。
AI 推动“芯经济”崛起
基辛格在主题演讲开场表示:“AI 代表着新时代的到来。AI 正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来。对开发者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为世界上的重大挑战打造解决方案,并造福地球上每一个人。”
基辛格提到,如今芯片形成了规模达 5740 亿美元的行业,并驱动着全球约 8 万亿美元的技术经济。世界对计算的需求呈指数级增长,而且这种需求与芯片的面积、成本和功耗成反比。简而言之,这就是摩尔定律。随后他提出了“芯经济”(Siliconomy)这一概念:“芯经济”是一个由可持续、开放、安全的算力需求所驱动的经济增长新时代。
更充足、更强大、更具性价比的处理能力,是经济增长的关键组成。而人工智能代表着计算的新时代,促进了“芯经济”的崛起。基辛格表示,五大超级技术力量——计算、连接、基础设施、人工智能、传感和感知,由“芯经济”推动。随后他分享了一系列 AI 相关的软硬件产品方案新进展和技术路线图。
英特尔开发者云全面上线
基辛格宣布英特尔开发者云平台自今日起全面上线。英特尔开发者云平台能够帮助开发者利用最新的英特尔软硬件创新来进行 AI 开发(包括用于深度学习的英特尔 Gaudi2 加速器),并授权他们使用英特尔最新的硬件平台,如即将在未来几周内上线的第五代英特尔至强可扩展处理器(代号为 Emerald Rapids),以及将在 12 月 14 日上线的英特尔数据中心 GPU Max 系列 1100 和 1550。
在使用英特尔开发者云平台时,开发者可以构建、测试并优化 AI 以及 HPC 应用程序,他们还可以运行从小规模到大规模的 AI 训练、模型优化和推理工作负载,以实现高性能和高效率。
英特尔开发者云平台建立在支持多架构、多厂商硬件的 oneAPI 开放编程模型基础之上,为开发者提供硬件选择,并摆脱了专有编程模型,以支持加速计算、代码重用和满足可移植性需求。
据 InfoQ 了解,已经有不少客户基于英特尔开发者云构建自己的 AI 应用,埃森哲是其中之一。
此外,基辛格还在会上发布了英特尔发行版 OpenVINO 工具套件 2023.1 版,并表示 Arm 也将参与到 OpenVINO 工作中。OpenVINO 是英特尔的 AI 推理和部署运行工具套件,在客户端和边缘平台上为开发人员提供了优质选择。该版本包括针对跨操作系统和各种不同云解决方案的集成而优化的预训练模型,包括多个生成式 AI 模型,例如 Meta 的 Llama 2 模型。
为了更好地将 AI 扩展到边缘侧,英特尔还将推出 Strata 项目以及边缘原生软件平台。其中边缘原生软件平台平台将于 2024 年推出,提供模块化构件、优质服务和产品支持。这是一种横向扩展智能边缘(intelligent edge)和混合人工智能(hybrid AI)所需基础设施的方式,并将英特尔和第三方的垂直应用程序整合在一个生态系统内。该解决方案将使开发人员能够构建、部署、运行、管理、连接和保护分布式边缘基础设施和应用程序。
AI 芯片路线图、下一代至强处理器亮相
自今年 7 月英特尔发布 Gaudi 2 训练加速器以来,其性能表现一直备受关注。最近的 MLPerf AI 推理性能测试结果进一步证明了 Gaudi 2 性能在市场上的竞争力,其是目前市场上满足 AI 计算需求的唯一可行替代方案。基辛格披露了一台完全基于英特尔至强处理器和 4000 个英特尔 Gaudi2 AI 硬件加速器构建的大型 AI 超级计算机。这台 AI 超级计算机将跻身全球 TOP15 超算,而 AI 独角兽企业 Stability AI 是其主要客户。
作为第四代英特尔至强处理器的早期采用者,阿里巴巴也被邀请来为英特尔站台。阿里云首席技术官周靖人阐述了阿里巴巴如何将内置 AI 加速器的第四代英特尔至强可扩展处理器用于其生成式 AI 和大语言模型,即“阿里云通义千问大模型”。周靖人表示,英特尔技术“大幅缩短了模型响应时间,平均加速可达 3 倍”。
面向 AI 计算,基辛格亮出了英特尔最新的三代 AI 芯片路线图,其中采用 5nm 制程的 Gaudi 3 将于 2024 年推出,再下一代 AI 芯片代号为 Falcon Shores,计划于 2025 年推出。
其中 Gaudi 3 的算力将达到 Gaudi 2 的两倍,网络带宽、HBM 容量将达到 Gaudi 2 的 1.5 倍。
基辛格还在演讲中预览了下一代英特尔至强处理器,并透露第五代英特尔至强处理器将于 12 月 14 日发布,届时,将在相同的功耗下为全球数据中心提高性能和存储速度。此外,具备高能效的能效核(E-core)处理器 Sierra Forest 将于 2024 年上半年上市。与第四代至强相比,拥有 288 核的该处理器预计将使机架密度提升 2.5 倍,每瓦性能提高 2.4 倍。紧随 Sierra Forest 发布的是具备高性能的性能核(P-core)处理器 Granite Rapids,与第四代至强相比,其 AI 性能预计将提高 2 到 3 倍。
展望 2025 年,代号为 Clearwater Forest 的下一代至强能效核处理器将基于 Intel 18A 制程节点制造。
迈向 AI PC 新时代
为了让 AI 的使用更加普及化,英特尔也将目光放到了个人 PC 上。基辛格在演讲中表示:“AI 将通过云与 PC 的紧密协作,进而从根本上改变、重塑和重构 PC 体验,释放人们的生产力和创造力。我们正迈向 AI PC 的新时代。”
这一全新的 PC 体验,即将在接下来推出的产品代号为 Meteor Lake 的英特尔酷睿 Ultra 处理器上得到展现。该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在 PC 上带来高能效的 AI 加速和本地推理体验。基辛格透露,酷睿 Ultra 将在 12 月 14 日发布。
酷睿 Ultra 处理器
基辛格将酷睿 Ultra 处理器称作英特尔客户端处理器路线图的一个转折点:该款处理器是首个采用 Foveros 封装技术的客户端芯粒设计。除了 NPU 以及 Intel 4 制程节点在性能功耗比上的重大进步外,这款处理器还通过集成英特尔锐炫显卡,带来独立显卡级别的性能。
基辛格展示了全新 AI PC 的众多使用场景,并邀请宏碁首席运营官高树国上台介绍了搭载酷睿 Ultra 处理器的宏碁笔记本电脑。高树国表示:“我们与英特尔团队合作,通过 OpenVINO 工具包共同开发了一套宏碁 AI 库,以充分利用英特尔酷睿 Ultra 平台,还共同开发了 AI 库,最终将这款产品带给用户。”
AI 创业公司 Rewind AI 也来到现场,演示在断网的情况下,由英特尔 OpenVINO 驱动在 PC 本地运行大语言模型,与 AI 聊天机器人进行实时问答。
制程、封装最新进展
在 2022 年英特尔投资者大会上,英特尔公布了接下来几年间的制程发展规划。按照英特尔的计划,未来的四年间,英特尔将跨过五个制程节点。此后一年间,这个计划的进展颇受关注。
在今天的主题演讲中,基辛格表示,英特尔的“四年五个制程节点”计划进展顺利,Intel 7 已经实现大规模量产,Intel 4 已经生产准备就绪,Intel 3 也在按计划推进中,目标是 2023 年年底。
基辛格还展示了基于 Intel 20A 制程节点打造的英特尔 Arrow Lake 处理器的首批测试芯片。他表示,Arrow Lake 将于 2024 年面向客户端市场推出。Intel 20A 将是首个应用 PowerVia 背面供电技术和新型全环绕栅极晶体管 RibbonFET 的制程节点。同样将采用这两项技术的 Intel 18A 制程节点也在按计划推进中,将于 2024 年下半年生产准备就绪。
此前英特尔已经官宣 Intel 18A 进程的多项进展。今年 4 月,英特尔代工服务事业部(IFS)和 Arm 宣布签署协议,旨在使芯片设计公司能够利用 Intel 18A 制程工艺来开发低功耗计算系统级芯片(SoC)。今年 7 月,爱立信宣布与英特尔达成战略合作协议,将采用英特尔 18A 制程和制造技术为爱立信的下一代 5G 基础设施优化提供支持。
除制程外,英特尔向前推进摩尔定律的另一路径是使用新材料和新封装技术,如玻璃基板(glass substrates)。这是英特尔刚于本周宣布的一项突破。玻璃基板将于 2020 年代后期推出,继续增加单个封装内的晶体管数量,助力满足 AI 等数据密集型高性能工作负载的需求,并在 2030 年后继续推进摩尔定律。
基辛格展示玻璃基板材料
英特尔还展示了基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装。基辛格表示,摩尔定律的下一波浪潮将由多芯粒封装技术所推动,如果开放标准能够解决 IP 集成的障碍,它将很快变成现实。发起于去年的 UCIe 标准将让来自不同厂商的芯粒能够协同工作,从而以新型芯片设计满足不同 AI 工作负载的扩展需求。目前,UCIe 开放标准已经得到了超过 120 家公司的支持。
该测试芯片集成了基于 Intel 3 制程节点的英特尔 UCIe IP 芯粒,和基于 TSMC N3E 制程节点的 Synopsys UCIe IP 芯粒。这些芯粒通过 EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。英特尔代工服务(Intel Foundry Services)、TSMC 和 Synopsys 携手推动 UCIe 的发展,体现了三者支持基于开放标准的芯粒生态系统的承诺。
先进计算和前沿研究
除了大众关注更多的软硬件进展,英特尔研究院还在诸多前沿技术方向上展开探索,包括神经拟态计算、量子计算等。在主题演讲的最后,基辛格也对这些前沿研究方向的最新进展做了介绍。
基于 Loihi 2 第二代研究芯片和开源 Lava 软件框架,英特尔研究院正在推动神经拟态计算的发展。Loihi 2 是性能业界领先的神经拟态研究芯片,基于 Intel 4 制程节点开发,每个芯片最多可包含 100 万个神经元。
Loihi 2 还具有可扩展性,8 芯片 Loihi 2 开发板 Kapoho Point,可通过堆叠满足大规模工作负载的需求。英特尔还提供开源、模块化、可扩展的 Lava 软件框架,助力神经拟态应用的开发。
量子计算方面,今年 6 月,英特尔发布了包含 12 个硅自旋量子比特(silicon spin qubit)的全新量子芯片 Tunnel Falls,继续探索量子实用性。
在英特尔的晶圆厂里,Tunnel Falls 是在 300 毫米的硅晶圆上生产的,利用了英特尔领先的晶体管工业化制造能力,如极紫外光刻技术(EUV),以及栅极和接触层加工技术。
虽然这次在主题演讲中并未提及,但也有部分开发者对于英特尔在 RISC-V 方向的动态十分关注。英特尔近几年一直在投资 RISC-V,去年英特尔加入了全球开放硬件标准组织 RISC-V International,该组织成员包括阿里云、谷歌、IBM、Nvidia、三星等;旗下的 Mobileye 还推出了基于 RISC-V 的 EyeQ Ultra 芯片。但今年 1 月份,英特尔停止 Intel Pathfinder for RISC-V 项目,引发了 RISC-V 社区对于英特尔是否会继续投入的担忧。根据 InfoQ 获知的最新消息,英特尔只是停止了一个针对 RISC-V 的前期探路项目,并没有停止对 RISC-V 的支持,而是转而继续正式支持 RISC-V,相关研究工作英特尔中国团队将会重点投入。
写在最后
在生成式 AI 这波大潮之下,更多人只关注到了 GPU 的成功和抢手程度,但 GPU 可能并这波浪潮唯一的受益者。随着大模型热潮爆发,未来将有海量潜在的 AI 应用需求,业内有观点认为,未来运行大模型所消耗的计算量(即推理的算力规模),将超过用于训练模型的计算量。从硬件层面来看,这意味着 AI 研究的重点将转向如何降低推理成本,而这恰恰是英特尔的优势所在。在本次活动现场与英特尔高层的交流中,我们也听到了类似的观点。
训练并非生成式 AI 的全部,我们可以看到,英特尔正试图在 AI 工作流的各个环节全面发力,从训练到 Fine-tuning,再到部署和推理,英特尔都有软硬件层面对应的产品和技术布局。这些布局能否帮助英特尔在生成式 AI 浪潮下继续取得成功,归根结底还是在于其能否很好地匹配客户需求、给客户带来足够的商业价值,这也是英特尔当前仍然面临的挑战,让我们一起拭目以待。
评论