开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

英伟达发布中国特供版 RTX 4090D:砍掉部分核心功能后,速度降低 11%,性能只差 5%

  • 2023-12-29
    北京
  • 本文字数:2643 字

    阅读完需:约 9 分钟

大小:1.26M时长:07:19
英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%

受美国今年 10 月份颁布的最新限令影响,一夜之间,英伟达顶级旗舰显卡 RTX 4090 全面下架。如今,事情似乎有了转机。

英伟达发布中国特供版 RTX 4090D

 

12 月 28 日,英伟达中文网站上线了一款名为 RTX 4090D 的显卡,这是英伟达顶级旗舰显卡 RTX 4090 的低性能版本,可以在不违背美国最新出口管制规定的前提下,出口中国。据悉,字母“D”意为 Dragon,代表 2024 年农历龙年。该显卡将于明年 1 月正式上市。

 

与 RTX 4090 相比,RTX 4090D 性能降低约 10.94%,具体差异为核心数量较少、共 14592 个 CUDA 核心,低于中国境外销售的 16384 核心版本。

 

英伟达日前在采访中表示,4090D 这张 GPU 的张量核心数也有类似幅度的削减,从 512 个减少至 456 个。除此之外,其他设计基本没有变化,峰值时钟速率仍为 2.52 GHz、内存为 24 GB GDDR6x,内存总线也继续保持 384 位。

 

尽管有所“阉割”,英伟达坚称这款显卡的性能并没有受到太大影响。

 

英伟达公司一位发言人在邮件采访中表示,“在启用光线追踪和深度学习超采样(DLSS)的 4K 分辨率游戏当中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且运行方式与全系 GeForce GPU 没有区别,所以最终用户仍可进行超频。”

 

这已经不是英伟达第一次为了遵守美国出口管制条例而主动削弱显卡性能。2022 年底,在限制对中国 AI 加速器销售风波之后,这家美国芯片巨头就降低了广受欢迎的 A100 GPU 的互连速度,由此衍生出的新版本被命名为 A800。下一代 H100 也有同样的低性能版本,预计将定名为 H800。

 

英伟达的举动也很快引起了美国商务部长 Gina Raimondo 的注意,她警告各芯片制造商不要触碰禁令的底线。“我可以告诉大家,如果你们沿着划定的边界重新设计芯片、让这些产品用于 AI 场景,那我第二天就会收紧控制。”

 

Raimondo 随后向路透社解释称,美国商务部正在与英伟达密切合作,确保不会把可能对美国国家安全构成威胁的 GPU 和 AI 加速器出售给中国。当然,这家芯片大厂可以、也应该获准在中国开展正常业务。

受“新限令”影响,RTX 4090 曾全面下架

 

此前,出口到中国的 GPU 和 AI 加速器的主要性能上限,体现在互连带宽之上——也就是处理器之间相互通信的速度。2022 年 10 月,美国商务部工业和安全局(BIS)公布对中国出口管制新规,主要针对先进芯片和芯片制造设备领域,限制了双向互连带宽为 600 GB/秒芯片的出口,规格在此之下的 GPU 无需额外申请许可。

 

作为回应,英伟达和英特尔都调整了自家最新 GPU,主动下调互连速度以回避美国商务部的限制。比如 H800 就是典型的特供版本。

 

2023 年 10 月 17 日,拜登政府更进一步,对性能密度采取了新一轮管控政策。据悉,新的政策将限制 Nvidia A800 和 H800 芯片的出口,此外,新规将豁免笔记本电脑、智能手机和游戏设备中使用的大多数消费级芯片,但其中部分芯片仍须受到美国官员的批准和专项管控。相关规定将在未来 30 天内生效。

 

根据商务部工业和安全局(BIS)提交的文件,新规则第一条、也是其中最重要的条款,限制了以下产品的对中出口:

 

“拥有一个或多个数字处理单元,且具备以下任一特征的集成电路产品:(1)「总处理性能」(TPP)为 4800 或者以上;或者(2)「总处理性能」为 1600 或更高,且「性能密度」为 5.92 或以上。”

 

其实 GPU 和加速器的总处理性能(TPP)分数计算非常简单。只需要将设备的每秒密集万亿次运算(浮点或整数)的最大数字加倍,再乘以运算的位长度。对于涉及不同精度的多项性能指标(例如 INT4、FP8、FP16 和 FP32 等),则使用最高 TPP 得分。

 

受这一新规影响,RTX 4090 成为唯一一款被禁止在中国销售的消费级显卡产品。

 

据悉,RTX 4090 的总处理性能(TPP)超过了 4800,略高于规定的消费级显卡性能上限。所谓 4800,是指先将 GPU 每秒所能运行的最大万亿次运算数字(浮点或整数运算)加倍,再乘以运算的位长度。

 

初版 4090 的 TPP 性能为 5285,也就是说英伟达必须获得美国政府颁发的许可证才能在中国合法销售这款高人气游戏显卡。需要注意的是,消费级显卡不受性能密度指标的限制,这项指标主要用于约束英伟达 L4 等性能较弱的数据中心用显卡的销售活动。

 

一时间,在京东搜索 “RTX 4090 显卡”只有少数第三方售卖,但需要预约等待到货。 同样,在淘宝搜索也是如此,标注价格基本 2 万起步,最高甚至接近 4 万元。而在二手平台咸鱼上,RTX4090 售价基本 1.2 万起步。华硕、微星、影驰等英伟达合作商也同样纷纷下架该型号的非公显卡,官方旗舰店均已显示无货状态。

 

对于“新限令”,英伟达方面曾回应称:“我们遵守所有适用的法规,同时努力提供支持不同行业的数千种应用产品。鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。”

受影响的不只有英伟达

 

虽然作为 AI 芯片市场上份额占比最高的巨头,英伟达肯定会首当其冲受到此项新规的影响,但英特尔和 AMD 的情况恐怕也好不到哪里去。

 

虽然 AMD 当前的最高规格 GPU MI250X 已经受到去年出口政策的限制,但 MI210 从技术角度讲其实低于 600 GB/秒的带宽限制。不过根据估算,该卡的 TPP 得分为 5792、功率密度为 8,所以随着新规的出台生效,MI210 恐怕也将告别中国市场。不过,AMD 曾公开表示他们正在开发一款类似于英伟达 A800 和 H800 的特殊加速器,专门面向中国销售。

 

来自 TrendForce 的行业观察师们表示,这些规定可能会抑制中国市场对英伟达高端 AI 服务器的需求,导致其全球需求份额从目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 预计字节跳动、百度、阿里巴巴和腾讯等大型 Web 和云服务商将在新规生效之前积极储备 GPU 资源。TrendForce 在一份研究报告中表示,“英伟达可能也会努力将当前稀缺的资源(例如 H800)优先交付给中国客户。”

 

从长远来看,TrendForce 预计中国企业将加快芯片自主研发力度,目前阿里巴巴打造的平头哥 ASIC 和华为投资的昇腾计算平台就是典型案例。与此同时,分析师们认为中国企业还可能调整 AI 开发思路,转而租用服务商提供的资源。

 

参考链接:

https://www.theregister.com/2023/12/28/nvidia_4090_returns_to_china/

https://www.infoq.cn/article/QJ73po4wuwTvLKcpK1Fw?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

https://www.infoq.cn/article/0AbAmTSduzAuVFFu29Nq?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

 

2023-12-29 15:149869

评论

发布
暂无评论
发现更多内容

Hazelcast IMDG 概览

数新网络官方账号

数据库 #数据库

第18期 | GPTSecurity周报

云起无垠

数字化转型如何落地?

优秀

数字化转型 数字化业务转型

全球业务 | 用友废钢智能判级系统在日本成功通过验收

用友BIP

废钢智能判级

多模态对比语言图像预训练CLIP:打破语言与视觉的界限

汀丶人工智能

人工智能 自然语言处理 计算机视觉 GPT 多模态大模型

超2000个大模型应用,支持文心4.0!AI Studio星河大模型社区升级上新

飞桨PaddlePaddle

飞桨 AI Studio 星河社区 文心大模型4.0

如何为模型添加光照效果?

3D建模设计

材质 纹理 光照贴图

Hadoop RPC简介

数新网络官方账号

大数据 hadoop hadoop rpc

企业通关必备,iPaaS应该这样搭建

RestCloud

应用集成 ipaas 应用与数据集成

Databend 开源周报第 117 期

Databend

苹果mac电脑矢量插画设计推荐 Illustrator 2024 补丁激活版中文

mac大玩家j

Mac软件 矢量设计 Mac软件矢量工具

写出一个复杂的SQL步骤

程序员万金游

#数据库 #java #Mysql #SQL

40 + 专家齐聚共谋数据未来,StarRocks Summit 2023 议程公布!更多精彩议题等你探索...

StarRocks

数据库 OLAP StarRocks

企业内部外网向内网传输文件如何实现高效安全?

镭速

内外网数据交换 内部外网隔离

中企出海 | 中建材、红狮、华润、华新都在做的事儿!

用友BIP

中企出海

如何选择最适合你的香港服务器服务?五大优势你不可不知

一只扑棱蛾子

香港服务器

专业好用的多媒体播放器Infuse 最新版中文

胖墩儿不胖y

Mac软件 多媒体播放器

独家特性 | 腾讯云大数据ES:一站式索引全托管,自治索引大揭秘!

腾讯云大数据

3D模型如何添加金属贴图?

3D建模设计

材质 纹理 金属贴图

EVE-NG的环境导入IOL组件

小魏写代码

用友BIP,IoT在光伏行业的应用

用友BIP

物联网 智能制造

ElasticSearch深度解析入门篇:高效搜索解决方案的介绍与实战案例讲解,带你避坑

汀丶人工智能

Elastic Search 搜索系统

HDFS架构介绍

数新网络官方账号

大数据 hdfs 架构-

后期云端制作:激发影视行业创新力的新时代

Finovy Cloud

影视制作 云渲染 后期制作

面向Three.js开发者的3D自动纹理化开发包

3D建模设计

AI 3D模型 three.js AI自动纹理

QCN9024 with IPQ4019|Wallys Dual Band Card DR9074E: Unleash the Power of Open Source Networking

wallyslilly

IPQ4019 QCN9074

可视化(Visual) SQL初探

数新网络官方账号

数据库 sql #数据库

如何选择安全又可靠的文件数据同步软件?

镭速

数据实时同步

百度AICA首席AI架构师培养计划第七期毕业,大模型深入产业见成果

飞桨PaddlePaddle

架构师 大模型 AICA

英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%_AI&大模型_凌敏_InfoQ精选文章