FCon7折倒计时最后一周:日程已上线70%!查看详情>>> 了解详情
写点什么

面向 CPU、GPU 和 IPU,英特尔发布重大技术架构的改变和创新

  • 2021-08-20
  • 本文字数:1692 字

    阅读完需:约 6 分钟

面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新

8 月 20 日消息,在2021年英特尔架构日上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理 Raja Koduri 连同多位英特尔架构师,介绍了面向 CPU、GPU 及 IPU 的重大技术架构改变和创新细节。



其中,英特尔第一次深入介绍了其首个性能混合架构 CPU Alder Lake,它不是简单地提供下一代更强大的 CPU 内核,而是重构了多核架构,集成了两款不同的 x86 内核(能效核和性能核)以及硬件线程调度器(在合适的时间把合适的线程分配给合适的内核),基于 Intel 7 制程工艺打造。据悉,基于 Alder Lake 的系列产品将在今年开始出货。



新的 x86 性能核(曾用代号 “Golden Cove”),是英特尔迄今为止性能最高的 CPU 内核,内置 AI 加速技术,用于学习推理和训练。与第 11 代酷睿架构(Cypress Cove 内核)相比,相同频率下,性能核在一系列工作负载上平均提升了约 19%。


而新的 x86 能效核(曾用代号“Gracemont”)为规模化处理而设计,旨在推动每瓦多核性能突破极限。对比英特尔迄今为止最多产的 CPU 微架构——Skylake,能效核在提供同样的单线程性能时,功耗仅为 Skylake 的 40%不到。与运行四个线程的两个 Skylake 内核相比,四个能效核在性能提升 80%的同时功耗更低。


值得一提的是,英特尔通过与微软合作,专门优化了新的 Alder Lake CPU 和硬件线程调度器在 Windows11 上的性能。


“在整个 Windows 11 的开发周期中,我的团队一直与英特尔同事合作,改进并优化我们即将推出的操作系统,使其充分利用‘性能混合’架构的优势,尤其是硬件线程调度器。大部分工作围绕操作系统线程调度程序展开,内核组件决定运行哪些线程在哪里运行。”微软 Windows 内核团队开发经理 Mehmet Iyigun 介绍道,除了线程调度之外,Windows 11 还利用硬件线程调度器的提示决定挂起或唤醒哪些内核,以节省电量。


在 GPU 方面,英特尔很早就与开发者和游戏引擎厂商展开合作,共同为游戏发烧友设计新的独立 GPU。本次架构日英特尔发布了全新的独立显卡微架构 Xe HPG,专为游戏和创作工作负载提供发烧级的高性能。基于 Xe HPG 的 Alchemist Soc(之前代号为 DG2)将于明年第一季度上市,并采用新的品牌名英特尔®锐炫™。


而另一个面向百亿亿次计算的 GPU——Ponte Vecchio,是英特尔至今最复杂的 SoC,基于 Xe HPC 微架构,并采用多种先进的半导体制程工艺、英特尔的 EMIB 技术以及 Foveros 3D 封装技术,包含 1000 亿个晶体管,提供业界领先的浮点运算和计算密度。英特尔官方甚至将其比喻为“堪比登月难度创新后的一款产品”。



在架构日上,英特尔表示,早期的 Ponte Vecchio 芯片展示了领先的性能,在流行的 AI 基准测试中创造了推理和训练吞吐量的行业记录。比如 A0 芯片性能提供了高于 45 TFLOPS 的 FP32 吞吐量,高于 5 TBps 的内存结构带宽,以及高于 2 TBps 的连接带宽。同时,英特尔分享了一段演示视频,展示了 ResNet 推理性能超过 43000 张图像/秒和超过每秒 3400 张图像/秒的 ResNet 训练,并且这两项性能都有望实现行业领先。


Ponte Vecchio 已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio 预计将于 2022 年面向 HPC 和 AI 市场发布。


此外,英特尔还发布了专为数据中心设计的下一代处理器 Sapphire Rapids,它的核心是一个模块化的分区 SoC 架构,具有异构计算基础设施的架构基础,并搭配最高的计算密度和内存带宽。Sapphire Rapids 也是基于 Intel 7 制程工艺技术,并采用新的性能核微架构。


IPU 方面,英特尔与一家云服务提供商合作架构了 Mount Evans 来减轻基础设施负载。Mount Evans 也是英特尔首款专用 ASIC IPU,融合了多代 FPGA SmartNIC 的经验。


最后,英特尔还提及了oneAPI,这是英特尔在 2019 年推出的开源软件解决方案,它可以提供单一、开放和统一的编程模型,能够简化跨不同架构的开发工作。除此之外,英特尔也提供了商用部署的完整 oneAPI 堆栈,包括基本的 oneAPI 基础工具包,它在规范语言和库之外增加了编译器、分析器、调试器和移植工具。据 Raja 介绍,自从 2020 年 12 月发布第一个版本以来,超过 20 万名开发者在获得 Xe HPC 之前就已经安装了英特尔的 oneAPI 产品,市场上有超过 300 个采用 oneAPI 统一编程模型的应用软件。今年 5 月份发布的 1.1 版临时规范为深度学习工作负载和高级光线追踪库添加了新的图形接口,预计正式的 1.1 版将在年底完成。

2021-08-20 13:464430
用户头像
罗燕珊 InfoQ中文站编辑

发布了 384 篇内容, 共 204.0 次阅读, 收获喜欢 715 次。

关注

评论 1 条评论

发布
用户头像
AMD,Yes
2021-08-20 16:06
回复
没有更多了
发现更多内容

一份283页pdf,五大核心内容,熬夜“啃完”,竟拿下了阿里offer

Java 程序员 架构 面试

管理者如何避免主观偏见

石云升

职场经验 管理经验 6月日更

网络态势感知是什么?

郑州埃文科技

5分钟速读之Rust权威指南(二十七)Rc<T>

wzx

rust

字节跳动亿级视频处理系统高可用架构实践

火山引擎开发者社区

架构 后端 音视频

为什么大家都在用WebRTC?

anyRTC开发者

音视频 WebRTC 语音通话 视频通讯

网络为本,博睿数据NPMD用20%的投入实现80%的功能

博睿数据

博睿数据 数据链DNA NPMD

1小时学会不打代码制作一个网页精美简历(1)

1_bit

大前端 低代码 iVX 低代码开发平台

多云部署又添新「云」,EMQ X Cloud 正式支持腾讯云部署

EMQ映云科技

阿里云 IoT 华为云 云平台 #腾讯云

银行业运维指标体系建设实战

云智慧AIOps社区

智能运维

新版发布|ShardingSphere 5.0.0-beta 来了!

SphereEx

ShardingSphere

剪视频一点都不难,多款超实用剪辑软件全方位评测!

懒得勤快

短视频 视频剪辑 视频制作

前端 JavaScript 复制粘贴的奥义——Clipboard 对象概述

编程三昧

JavaScript 大前端

工作年限、成长路线、进阶技术。怎样才能成为架构师?

Linux服务器开发

Linux服务器开发 Linux后台开发 软件架构师 服务器架构师 C++架构师

【Linux】使用 systemd 管理 frp 服务

赖猫

Linux 后端

云开发是啥?看看它在编程导航项目的实践

程序员鱼皮

Java JavaScript 大前端 后端 云开发

小红书 x StarRocks:实现数据服务平台统一化,简化数据链路,提升高并发极速查询能力

StarRocks

数据库 数据分析 广告系统 小红书 StarRocks

自从有了这个工具,一键代码迁移不在话下

华为云开发者联盟

代码迁移 鲲鹏DevKit 汇编翻译 汇编语言 Kunpeng

基于jira的需求交付效率统计

好孩子

Jira

2021年,想要成为年薪百万的Java架构师需要掌握哪些技术?

Java架构师迁哥

高寿命NVMe SSD应用场景探讨

怀瑾握瑜

区块链 数据库 云计算 SSD 虚拟货币

Flink 和 Iceberg 如何解决数据入湖面临的挑战

Apache Flink

flink

腾讯安全姬生利:《数据安全法》下,云上数据安全最佳实践

腾讯安全云鼎实验室

数据安全 云安全 数据安全法

体验为先,博睿数据打造以用户会话为中心的监测体系

博睿数据

博睿数据 数据链DNA DEM

【签约计划】百位签约创作者名单公布

InfoQ写作社区官方

签约计划

如何用视频云技术,搞一个爆红的 “反应视频” 项目?

阿里云视频云

阿里云 RTC 英特尔 视频处理 视频制作

Rust从0到1-泛型-生命周期

rust 泛型 生命周期 generic lifetimes

ROS CDK | 云上资源自动化部署新模式

郭旭东

阿里云 ROS 基础设施即代码 IaC

唯品会:在 Flink 容器化与平台化上的建设实践

Apache Flink

flink

机器数及特点

若尘

计算机组成原理 6月日更

墨奇,以“一手之力” 证明你就是你

E科讯

  • 扫码添加小助手
    领取最新资料包
面向CPU、GPU和IPU,英特尔发布重大技术架构的改变和创新_AI_罗燕珊_InfoQ精选文章