速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

“芯经济”崛起,英特尔加速 AI 抢位战

  • 2023-09-20
    北京
  • 本文字数:4706 字

    阅读完需:约 15 分钟

大小:2.64M时长:15:23
“芯经济”崛起,英特尔加速AI抢位战

 当地时间 9 月 19 日,英特尔 On 技术创新大会(Intel Innovation) 2023 在美国加州圣何塞拉开帷幕,InfoQ 有幸受邀参会并从现场发回报道。英特尔 On 技术创新大会是一场面向开发者的大会,更是一个了解过去一年英特尔在不同方向(包括端侧计算、数据中心、边缘计算和云计算)取得的最新进展的好方法。来自全球的上千位开发者、英特尔合作伙伴和客户亲临这场盛会,以期全面了解英特尔将以怎样的新策略、新产品应对生成式 AI 大爆发带来的机遇和挑战。


图:InfoQ 记者拍摄于现场

 

AI 毫无疑问是贯穿大会首日主题演讲全程的重要关键词。围绕“让 AI 无处不在”这一主题,英特尔 CEO 帕特·基辛格在主题演讲中展示了英特尔如何在其各种硬件产品中加入 AI 能力,并通过开放、多架构的软件解决方案推动 AI 应用的普及。

AI 推动“芯经济”崛起


基辛格在主题演讲开场表示:“AI 代表着新时代的到来。AI 正在催生全球增长的新时代,在新时代中,算力起着更为重要的作用,让所有人迎来更美好的未来。对开发者而言,这将带来巨大的社会和商业机遇,以创造更多可能,为世界上的重大挑战打造解决方案,并造福地球上每一个人。”

 

基辛格提到,如今芯片形成了规模达 5740 亿美元的行业,并驱动着全球约 8 万亿美元的技术经济。世界对计算的需求呈指数级增长,而且这种需求与芯片的面积、成本和功耗成反比。简而言之,这就是摩尔定律。随后他提出了“芯经济”(Siliconomy)这一概念:“芯经济”是一个由可持续、开放、安全的算力需求所驱动的经济增长新时代。



 更充足、更强大、更具性价比的处理能力,是经济增长的关键组成。而人工智能代表着计算的新时代,促进了“芯经济”的崛起。基辛格表示,五大超级技术力量——计算、连接、基础设施、人工智能、传感和感知,由“芯经济”推动。随后他分享了一系列 AI 相关的软硬件产品方案新进展和技术路线图。

英特尔开发者云全面上线


基辛格宣布英特尔开发者云平台自今日起全面上线。英特尔开发者云平台能够帮助开发者利用最新的英特尔软硬件创新来进行 AI 开发(包括用于深度学习的英特尔 Gaudi2 加速器),并授权他们使用英特尔最新的硬件平台,如即将在未来几周内上线的第五代英特尔至强可扩展处理器(代号为 Emerald Rapids),以及将在 12 月 14 日上线的英特尔数据中心 GPU Max 系列 1100 和 1550。



 在使用英特尔开发者云平台时,开发者可以构建、测试并优化 AI 以及 HPC 应用程序,他们还可以运行从小规模到大规模的 AI 训练、模型优化和推理工作负载,以实现高性能和高效率。

 

英特尔开发者云平台建立在支持多架构、多厂商硬件的 oneAPI 开放编程模型基础之上,为开发者提供硬件选择,并摆脱了专有编程模型,以支持加速计算、代码重用和满足可移植性需求。

 

据 InfoQ 了解,已经有不少客户基于英特尔开发者云构建自己的 AI 应用,埃森哲是其中之一。

 

此外,基辛格还在会上发布了英特尔发行版 OpenVINO 工具套件 2023.1 版,并表示 Arm 也将参与到 OpenVINO 工作中。OpenVINO 是英特尔的 AI 推理和部署运行工具套件,在客户端和边缘平台上为开发人员提供了优质选择。该版本包括针对跨操作系统和各种不同云解决方案的集成而优化的预训练模型,包括多个生成式 AI 模型,例如 Meta 的 Llama 2 模型。

 


为了更好地将 AI 扩展到边缘侧,英特尔还将推出 Strata 项目以及边缘原生软件平台。其中边缘原生软件平台平台将于 2024 年推出,提供模块化构件、优质服务和产品支持。这是一种横向扩展智能边缘(intelligent edge)和混合人工智能(hybrid AI)所需基础设施的方式,并将英特尔和第三方的垂直应用程序整合在一个生态系统内。该解决方案将使开发人员能够构建、部署、运行、管理、连接和保护分布式边缘基础设施和应用程序。

AI 芯片路线图、下一代至强处理器亮相

 

自今年 7 月英特尔发布 Gaudi 2 训练加速器以来,其性能表现一直备受关注。最近的 MLPerf AI 推理性能测试结果进一步证明了 Gaudi 2 性能在市场上的竞争力,其是目前市场上满足 AI 计算需求的唯一可行替代方案。基辛格披露了一台完全基于英特尔至强处理器和 4000 个英特尔 Gaudi2 AI 硬件加速器构建的大型 AI 超级计算机。这台 AI 超级计算机将跻身全球 TOP15 超算,而 AI 独角兽企业 Stability AI 是其主要客户。

 


作为第四代英特尔至强处理器的早期采用者,阿里巴巴也被邀请来为英特尔站台。阿里云首席技术官周靖人阐述了阿里巴巴如何将内置 AI 加速器的第四代英特尔至强可扩展处理器用于其生成式 AI 和大语言模型,即“阿里云通义千问大模型”。周靖人表示,英特尔技术“大幅缩短了模型响应时间,平均加速可达 3 倍”。

 

面向 AI 计算,基辛格亮出了英特尔最新的三代 AI 芯片路线图,其中采用 5nm 制程的 Gaudi 3 将于 2024 年推出,再下一代 AI 芯片代号为 Falcon Shores,计划于 2025 年推出。



其中 Gaudi 3 的算力将达到 Gaudi 2 的两倍,网络带宽、HBM 容量将达到 Gaudi 2 的 1.5 倍。



基辛格还在演讲中预览了下一代英特尔至强处理器,并透露第五代英特尔至强处理器将于 12 月 14 日发布,届时,将在相同的功耗下为全球数据中心提高性能和存储速度。此外,具备高能效的能效核(E-core)处理器 Sierra Forest 将于 2024 年上半年上市。与第四代至强相比,拥有 288 核的该处理器预计将使机架密度提升 2.5 倍,每瓦性能提高 2.4 倍。紧随 Sierra Forest 发布的是具备高性能的性能核(P-core)处理器 Granite Rapids,与第四代至强相比,其 AI 性能预计将提高 2 到 3 倍。




展望 2025 年,代号为 Clearwater Forest 的下一代至强能效核处理器将基于 Intel 18A 制程节点制造。

迈向 AI PC 新时代

 

为了让 AI 的使用更加普及化,英特尔也将目光放到了个人 PC 上。基辛格在演讲中表示:“AI 将通过云与 PC 的紧密协作,进而从根本上改变、重塑和重构 PC 体验,释放人们的生产力和创造力。我们正迈向 AI PC 的新时代。”



这一全新的 PC 体验,即将在接下来推出的产品代号为 Meteor Lake 的英特尔酷睿 Ultra 处理器上得到展现。该处理器配备英特尔首款集成的神经网络处理器(NPU),用于在 PC 上带来高能效的 AI 加速和本地推理体验。基辛格透露,酷睿 Ultra 将在 12 月 14 日发布。

 

酷睿 Ultra 处理器

 

基辛格将酷睿 Ultra 处理器称作英特尔客户端处理器路线图的一个转折点:该款处理器是首个采用 Foveros 封装技术的客户端芯粒设计。除了 NPU 以及 Intel 4 制程节点在性能功耗比上的重大进步外,这款处理器还通过集成英特尔锐炫显卡,带来独立显卡级别的性能。

 

基辛格展示了全新 AI PC 的众多使用场景,并邀请宏碁首席运营官高树国上台介绍了搭载酷睿 Ultra 处理器的宏碁笔记本电脑。高树国表示:“我们与英特尔团队合作,通过 OpenVINO 工具包共同开发了一套宏碁 AI 库,以充分利用英特尔酷睿 Ultra 平台,还共同开发了 AI 库,最终将这款产品带给用户。”

 

AI 创业公司 Rewind AI 也来到现场,演示在断网的情况下,由英特尔 OpenVINO 驱动在 PC 本地运行大语言模型,与 AI 聊天机器人进行实时问答。

制程、封装最新进展


在 2022 年英特尔投资者大会上,英特尔公布了接下来几年间的制程发展规划。按照英特尔的计划,未来的四年间,英特尔将跨过五个制程节点。此后一年间,这个计划的进展颇受关注。

 

在今天的主题演讲中,基辛格表示,英特尔的“四年五个制程节点”计划进展顺利,Intel 7 已经实现大规模量产,Intel 4 已经生产准备就绪,Intel 3 也在按计划推进中,目标是 2023 年年底。



基辛格还展示了基于 Intel 20A 制程节点打造的英特尔 Arrow Lake 处理器的首批测试芯片。他表示,Arrow Lake 将于 2024 年面向客户端市场推出。Intel 20A 将是首个应用 PowerVia 背面供电技术和新型全环绕栅极晶体管 RibbonFET 的制程节点。同样将采用这两项技术的 Intel 18A 制程节点也在按计划推进中,将于 2024 年下半年生产准备就绪。

 

此前英特尔已经官宣 Intel 18A 进程的多项进展。今年 4 月,英特尔代工服务事业部(IFS)和 Arm 宣布签署协议,旨在使芯片设计公司能够利用 Intel 18A 制程工艺来开发低功耗计算系统级芯片(SoC)。今年 7 月,爱立信宣布与英特尔达成战略合作协议,将采用英特尔 18A 制程和制造技术为爱立信的下一代 5G 基础设施优化提供支持。

 

除制程外,英特尔向前推进摩尔定律的另一路径是使用新材料和新封装技术,如玻璃基板(glass substrates)。这是英特尔刚于本周宣布的一项突破。玻璃基板将于 2020 年代后期推出,继续增加单个封装内的晶体管数量,助力满足 AI 等数据密集型高性能工作负载的需求,并在 2030 年后继续推进摩尔定律。


基辛格展示玻璃基板材料

 

英特尔还展示了基于通用芯粒高速互连开放规范(UCIe)的测试芯片封装。基辛格表示,摩尔定律的下一波浪潮将由多芯粒封装技术所推动,如果开放标准能够解决 IP 集成的障碍,它将很快变成现实。发起于去年的 UCIe 标准将让来自不同厂商的芯粒能够协同工作,从而以新型芯片设计满足不同 AI 工作负载的扩展需求。目前,UCIe 开放标准已经得到了超过 120 家公司的支持。

 

该测试芯片集成了基于 Intel 3 制程节点的英特尔 UCIe IP 芯粒,和基于 TSMC N3E 制程节点的 Synopsys UCIe IP 芯粒。这些芯粒通过 EMIB(嵌入式多芯片互连桥接)先进封装技术互连在一起。英特尔代工服务(Intel Foundry Services)、TSMC 和 Synopsys 携手推动 UCIe 的发展,体现了三者支持基于开放标准的芯粒生态系统的承诺。

先进计算和前沿研究


除了大众关注更多的软硬件进展,英特尔研究院还在诸多前沿技术方向上展开探索,包括神经拟态计算、量子计算等。在主题演讲的最后,基辛格也对这些前沿研究方向的最新进展做了介绍。

 

基于 Loihi 2 第二代研究芯片和开源 Lava 软件框架,英特尔研究院正在推动神经拟态计算的发展。Loihi 2 是性能业界领先的神经拟态研究芯片,基于 Intel 4 制程节点开发,每个芯片最多可包含 100 万个神经元。

 


Loihi 2 还具有可扩展性,8 芯片 Loihi 2 开发板 Kapoho Point,可通过堆叠满足大规模工作负载的需求。英特尔还提供开源、模块化、可扩展的 Lava 软件框架,助力神经拟态应用的开发。

 

量子计算方面,今年 6 月,英特尔发布了包含 12 个硅自旋量子比特(silicon spin qubit)的全新量子芯片 Tunnel Falls,继续探索量子实用性。



在英特尔的晶圆厂里,Tunnel Falls 是在 300 毫米的硅晶圆上生产的,利用了英特尔领先的晶体管工业化制造能力,如极紫外光刻技术(EUV),以及栅极和接触层加工技术。

 

虽然这次在主题演讲中并未提及,但也有部分开发者对于英特尔在 RISC-V 方向的动态十分关注。英特尔近几年一直在投资 RISC-V,去年英特尔加入了全球开放硬件标准组织 RISC-V International,该组织成员包括阿里云、谷歌、IBM、Nvidia、三星等;旗下的 Mobileye 还推出了基于 RISC-V 的 EyeQ Ultra 芯片。但今年 1 月份,英特尔停止 Intel Pathfinder for RISC-V 项目,引发了 RISC-V 社区对于英特尔是否会继续投入的担忧。根据 InfoQ 获知的最新消息,英特尔只是停止了一个针对 RISC-V 的前期探路项目,并没有停止对 RISC-V 的支持,而是转而继续正式支持 RISC-V,相关研究工作英特尔中国团队将会重点投入。

写在最后


在生成式 AI 这波大潮之下,更多人只关注到了 GPU 的成功和抢手程度,但 GPU 可能并这波浪潮唯一的受益者。随着大模型热潮爆发,未来将有海量潜在的 AI 应用需求,业内有观点认为,未来运行大模型所消耗的计算量(即推理的算力规模),将超过用于训练模型的计算量。从硬件层面来看,这意味着 AI 研究的重点将转向如何降低推理成本,而这恰恰是英特尔的优势所在。在本次活动现场与英特尔高层的交流中,我们也听到了类似的观点。


训练并非生成式 AI 的全部,我们可以看到,英特尔正试图在 AI 工作流的各个环节全面发力,从训练到 Fine-tuning,再到部署和推理,英特尔都有软硬件层面对应的产品和技术布局。这些布局能否帮助英特尔在生成式 AI 浪潮下继续取得成功,归根结底还是在于其能否很好地匹配客户需求、给客户带来足够的商业价值,这也是英特尔当前仍然面临的挑战,让我们一起拭目以待。

2023-09-20 09:334177
用户头像
蔡芳芳 InfoQ主编

发布了 801 篇内容, 共 557.0 次阅读, 收获喜欢 2790 次。

关注

评论

发布
暂无评论
发现更多内容

centos 7.6安装sealos和单机集群

麦兜

Wi-Fi 6 vs. Wi-Fi 6E: The differences between IPQ6018, IPQ6010 and IPQ5018

wallysSK

web3钱包进阶!从入门到精通,Bitget实现逆袭

股市老人

开源时代:极狐GitLab如何保证软件供应链安全

极狐GitLab

顶级加密混淆混淆工具测评:ipagurd

杭州悦数成立「悦数图技术陆家嘴数据智能研究院」,入驻上海陆家嘴金融城「双城辉映」平台

最新动态

使用 Taro 开发鸿蒙原生应用 —— 探秘适配鸿蒙 ArkTS 的工作原理 | 京东云技术团队

京东科技开发者

脉脉宣布全员下调,华为莫名奇妙躺枪。。。

Jackpop

倒计时3天|开源开发者的技术年末盛典即将开启

开放原子开源基金会

开源

#issue 111538 MySQL 8.0 instant add/drop column 性能回退问题

ba0tiao

MySQL InnoDB

[译]优秀的URL设计

南城FE

前端 后端 url

诚邀报名|来开源项目维护者论坛,为项目可持续发展贡献您的声音

开放原子开源基金会

开源

软件开发

Geek_8da502

唯品会商品列表数据接口(Vip.item_search)丨唯品会API接口

tbapi

唯品会商品列表数据接口 关键词搜索唯品会接口 唯品会API接口 唯品会商品数据接口 唯品会商品API接口

宏 | AI工程化部署

AIWeker

c AI AI工程化部署

即时通讯技术文集(第28期):IM开发技术合集(Part1) [共18篇]

JackJiang

网络编程 即时通讯 IM

诚邀报名|与你同行——开源教育晨雾中的早行者

开放原子开源基金会

开源

TDengine 创始人陶建辉出席 CIAS 2023 年会,为新能源汽车数据处理带来新思路

TDengine

tdengine 时序数据库

支付宝 v3 自签名如何实现

盐焗代码虾

Java 支付宝 签名 加签

现代 CPU 技术发展 | 京东云技术团队

京东科技开发者

软件开发 cpu 性能提升

用JS实现简单的屏幕录像机 | 京东云技术团队

京东科技开发者

JavaScript 前端 屏幕录制

全球知名的五款JavaScript混淆加密工具详解

雪奈椰子

如何写好Prompt,让GPT 的回答更加精准

Bob Lin

人工智能 openai ChatGPT GPT-4 langchain

一起学Elasticsearch系列-深度分页问题

Java随想录

Java 大数据 elastic

强大的数据库管理:Valentina Studio Pro终端激活版最新

胖墩儿不胖y

Mac软件 数据库软件 Mac管理数据库

华为终于开奖了,结果有点可笑

Jackpop

5G和云渲染将如何快速推进XR和元宇宙?

3DCAT实时渲染

云渲染 元宇宙解决方案

vivo 容器平台资源运营实践

vivo互联网技术

容器平台 资源运营 利用率提升

拆解低代码平台核心功能:八大关键点解析

天津汇柏科技有限公司

低代码

诚邀报名|探寻AI融合的前端开发之道:解除焦虑,构建核心竞争力

开放原子开源基金会

开源

“芯经济”崛起,英特尔加速AI抢位战_英特尔_蔡芳芳_InfoQ精选文章