写点什么

英伟达发布中国特供版 RTX 4090D:砍掉部分核心功能后,速度降低 11%,性能只差 5%

  • 2023-12-29
    北京
  • 本文字数:2643 字

    阅读完需:约 9 分钟

大小:1.26M时长:07:19
英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%

受美国今年 10 月份颁布的最新限令影响,一夜之间,英伟达顶级旗舰显卡 RTX 4090 全面下架。如今,事情似乎有了转机。

英伟达发布中国特供版 RTX 4090D

 

12 月 28 日,英伟达中文网站上线了一款名为 RTX 4090D 的显卡,这是英伟达顶级旗舰显卡 RTX 4090 的低性能版本,可以在不违背美国最新出口管制规定的前提下,出口中国。据悉,字母“D”意为 Dragon,代表 2024 年农历龙年。该显卡将于明年 1 月正式上市。

 

与 RTX 4090 相比,RTX 4090D 性能降低约 10.94%,具体差异为核心数量较少、共 14592 个 CUDA 核心,低于中国境外销售的 16384 核心版本。

 

英伟达日前在采访中表示,4090D 这张 GPU 的张量核心数也有类似幅度的削减,从 512 个减少至 456 个。除此之外,其他设计基本没有变化,峰值时钟速率仍为 2.52 GHz、内存为 24 GB GDDR6x,内存总线也继续保持 384 位。

 

尽管有所“阉割”,英伟达坚称这款显卡的性能并没有受到太大影响。

 

英伟达公司一位发言人在邮件采访中表示,“在启用光线追踪和深度学习超采样(DLSS)的 4K 分辨率游戏当中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且运行方式与全系 GeForce GPU 没有区别,所以最终用户仍可进行超频。”

 

这已经不是英伟达第一次为了遵守美国出口管制条例而主动削弱显卡性能。2022 年底,在限制对中国 AI 加速器销售风波之后,这家美国芯片巨头就降低了广受欢迎的 A100 GPU 的互连速度,由此衍生出的新版本被命名为 A800。下一代 H100 也有同样的低性能版本,预计将定名为 H800。

 

英伟达的举动也很快引起了美国商务部长 Gina Raimondo 的注意,她警告各芯片制造商不要触碰禁令的底线。“我可以告诉大家,如果你们沿着划定的边界重新设计芯片、让这些产品用于 AI 场景,那我第二天就会收紧控制。”

 

Raimondo 随后向路透社解释称,美国商务部正在与英伟达密切合作,确保不会把可能对美国国家安全构成威胁的 GPU 和 AI 加速器出售给中国。当然,这家芯片大厂可以、也应该获准在中国开展正常业务。

受“新限令”影响,RTX 4090 曾全面下架

 

此前,出口到中国的 GPU 和 AI 加速器的主要性能上限,体现在互连带宽之上——也就是处理器之间相互通信的速度。2022 年 10 月,美国商务部工业和安全局(BIS)公布对中国出口管制新规,主要针对先进芯片和芯片制造设备领域,限制了双向互连带宽为 600 GB/秒芯片的出口,规格在此之下的 GPU 无需额外申请许可。

 

作为回应,英伟达和英特尔都调整了自家最新 GPU,主动下调互连速度以回避美国商务部的限制。比如 H800 就是典型的特供版本。

 

2023 年 10 月 17 日,拜登政府更进一步,对性能密度采取了新一轮管控政策。据悉,新的政策将限制 Nvidia A800 和 H800 芯片的出口,此外,新规将豁免笔记本电脑、智能手机和游戏设备中使用的大多数消费级芯片,但其中部分芯片仍须受到美国官员的批准和专项管控。相关规定将在未来 30 天内生效。

 

根据商务部工业和安全局(BIS)提交的文件,新规则第一条、也是其中最重要的条款,限制了以下产品的对中出口:

 

“拥有一个或多个数字处理单元,且具备以下任一特征的集成电路产品:(1)「总处理性能」(TPP)为 4800 或者以上;或者(2)「总处理性能」为 1600 或更高,且「性能密度」为 5.92 或以上。”

 

其实 GPU 和加速器的总处理性能(TPP)分数计算非常简单。只需要将设备的每秒密集万亿次运算(浮点或整数)的最大数字加倍,再乘以运算的位长度。对于涉及不同精度的多项性能指标(例如 INT4、FP8、FP16 和 FP32 等),则使用最高 TPP 得分。

 

受这一新规影响,RTX 4090 成为唯一一款被禁止在中国销售的消费级显卡产品。

 

据悉,RTX 4090 的总处理性能(TPP)超过了 4800,略高于规定的消费级显卡性能上限。所谓 4800,是指先将 GPU 每秒所能运行的最大万亿次运算数字(浮点或整数运算)加倍,再乘以运算的位长度。

 

初版 4090 的 TPP 性能为 5285,也就是说英伟达必须获得美国政府颁发的许可证才能在中国合法销售这款高人气游戏显卡。需要注意的是,消费级显卡不受性能密度指标的限制,这项指标主要用于约束英伟达 L4 等性能较弱的数据中心用显卡的销售活动。

 

一时间,在京东搜索 “RTX 4090 显卡”只有少数第三方售卖,但需要预约等待到货。 同样,在淘宝搜索也是如此,标注价格基本 2 万起步,最高甚至接近 4 万元。而在二手平台咸鱼上,RTX4090 售价基本 1.2 万起步。华硕、微星、影驰等英伟达合作商也同样纷纷下架该型号的非公显卡,官方旗舰店均已显示无货状态。

 

对于“新限令”,英伟达方面曾回应称:“我们遵守所有适用的法规,同时努力提供支持不同行业的数千种应用产品。鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。”

受影响的不只有英伟达

 

虽然作为 AI 芯片市场上份额占比最高的巨头,英伟达肯定会首当其冲受到此项新规的影响,但英特尔和 AMD 的情况恐怕也好不到哪里去。

 

虽然 AMD 当前的最高规格 GPU MI250X 已经受到去年出口政策的限制,但 MI210 从技术角度讲其实低于 600 GB/秒的带宽限制。不过根据估算,该卡的 TPP 得分为 5792、功率密度为 8,所以随着新规的出台生效,MI210 恐怕也将告别中国市场。不过,AMD 曾公开表示他们正在开发一款类似于英伟达 A800 和 H800 的特殊加速器,专门面向中国销售。

 

来自 TrendForce 的行业观察师们表示,这些规定可能会抑制中国市场对英伟达高端 AI 服务器的需求,导致其全球需求份额从目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 预计字节跳动、百度、阿里巴巴和腾讯等大型 Web 和云服务商将在新规生效之前积极储备 GPU 资源。TrendForce 在一份研究报告中表示,“英伟达可能也会努力将当前稀缺的资源(例如 H800)优先交付给中国客户。”

 

从长远来看,TrendForce 预计中国企业将加快芯片自主研发力度,目前阿里巴巴打造的平头哥 ASIC 和华为投资的昇腾计算平台就是典型案例。与此同时,分析师们认为中国企业还可能调整 AI 开发思路,转而租用服务商提供的资源。

 

参考链接:

https://www.theregister.com/2023/12/28/nvidia_4090_returns_to_china/

https://www.infoq.cn/article/QJ73po4wuwTvLKcpK1Fw?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

https://www.infoq.cn/article/0AbAmTSduzAuVFFu29Nq?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

 

2023-12-29 15:149786

评论

发布
暂无评论
发现更多内容

GaussDB(DWS)迁移实践丨row_number输出结果不一致

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 5 月 PK 榜

AIGC背后的技术分析 | 通过EBG学习概念cup

TiAmo

机器学习 AIGC 解释学习

软件测试/测试开发丨学习笔记之用户端App自动化测试

测试人

程序员 软件测试 自动化测试 测试开发 app自动化测试

微服务之流量控制

Disaster

微服务

让初学者读懂代码的入门书

博文视点Broadview

软件测试/测试开发丨学习笔记之接口自动化测试

测试人

程序员 软件测试 自动化测试 接口测试 测试开发

艾媒金榜|2023年中国信创数据库企业TOP15

亚信AntDB数据库

数据库 AntDB AntDB数据库

市场规模超百亿 低代码与传统IT开发有何不同

力软低代码开发平台

微服务系列之初探“微服务架构”

Disaster

微服务

微服务系列之远程服务调用

Disaster

微服务

微服务之事务处理

Disaster

微服务

了不起的互联网老男孩,在创业路上不掉队

HarmonyOS SDK

HMS Core

spring系列之IOC容器结构

Disaster

spring ioc

深度解析如何通过财务共享建设助推企业数智化转型

用友BIP

财务共享

财务共享服务中心建设流程是什么样的?

用友BIP

财务共享

微服务之服务容错

Disaster

微服务

数字化转型,低代码开发真的靠谱?

引迈信息

低代码 数字化 JNPF

通义千问预体验,如何让 AI 模型应用“奔跑”在函数计算上?

Serverless Devs

喜报!云智慧王海虎荣获中国信通院突出贡献专家奖

云智慧AIOps社区

大前端 低代码 数据可视化

文件传输只是第一步,文件同步和备份的关键是

镭速

“Fabarta 数据血缘治理解决方案”荣获“2023 鑫智奖”双料奖项

Fabarta

数据挖掘 数据分析 数据治理 图智能 血缘治理

微服务系列之微服务架构

Disaster

微服务

微服务之异步消息通信

Disaster

微服务

携手共创开源新格局|2023开放原子全球开源峰会将于6月11日在京隆重开幕

开放原子开源基金会

大数据 开源 开放原子开源基金会 开放原子全球开源峰会 开放原子

惊!掌握通义千问的关键,从这些必知内容开始!

加入高科技仿生人

人工智能 低代码 ChatGPT 数字转型 通义千问

微服务系列之单体架构

Disaster

微服务

23种设计模式详解

Disaster

设计模式

软件测试 | 软件危机的几个体现

测吧(北京)科技有限公司

测试

Musl libc 库成功适配到 openEuler Embedded,推动欧拉嵌入式生态发展

openEuler

Linux 操作系统 嵌入式 openEuler risc-v

全球化企业应如何统筹规划财务共享中心?

用友BIP

财务共享

英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%_AI&大模型_凌敏_InfoQ精选文章