AICon上海|与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用 了解详情
写点什么

英伟达发布中国特供版 RTX 4090D:砍掉部分核心功能后,速度降低 11%,性能只差 5%

  • 2023-12-29
    北京
  • 本文字数:2643 字

    阅读完需:约 9 分钟

大小:1.26M时长:07:19
英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%

受美国今年 10 月份颁布的最新限令影响,一夜之间,英伟达顶级旗舰显卡 RTX 4090 全面下架。如今,事情似乎有了转机。

英伟达发布中国特供版 RTX 4090D

 

12 月 28 日,英伟达中文网站上线了一款名为 RTX 4090D 的显卡,这是英伟达顶级旗舰显卡 RTX 4090 的低性能版本,可以在不违背美国最新出口管制规定的前提下,出口中国。据悉,字母“D”意为 Dragon,代表 2024 年农历龙年。该显卡将于明年 1 月正式上市。

 

与 RTX 4090 相比,RTX 4090D 性能降低约 10.94%,具体差异为核心数量较少、共 14592 个 CUDA 核心,低于中国境外销售的 16384 核心版本。

 

英伟达日前在采访中表示,4090D 这张 GPU 的张量核心数也有类似幅度的削减,从 512 个减少至 456 个。除此之外,其他设计基本没有变化,峰值时钟速率仍为 2.52 GHz、内存为 24 GB GDDR6x,内存总线也继续保持 384 位。

 

尽管有所“阉割”,英伟达坚称这款显卡的性能并没有受到太大影响。

 

英伟达公司一位发言人在邮件采访中表示,“在启用光线追踪和深度学习超采样(DLSS)的 4K 分辨率游戏当中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且运行方式与全系 GeForce GPU 没有区别,所以最终用户仍可进行超频。”

 

这已经不是英伟达第一次为了遵守美国出口管制条例而主动削弱显卡性能。2022 年底,在限制对中国 AI 加速器销售风波之后,这家美国芯片巨头就降低了广受欢迎的 A100 GPU 的互连速度,由此衍生出的新版本被命名为 A800。下一代 H100 也有同样的低性能版本,预计将定名为 H800。

 

英伟达的举动也很快引起了美国商务部长 Gina Raimondo 的注意,她警告各芯片制造商不要触碰禁令的底线。“我可以告诉大家,如果你们沿着划定的边界重新设计芯片、让这些产品用于 AI 场景,那我第二天就会收紧控制。”

 

Raimondo 随后向路透社解释称,美国商务部正在与英伟达密切合作,确保不会把可能对美国国家安全构成威胁的 GPU 和 AI 加速器出售给中国。当然,这家芯片大厂可以、也应该获准在中国开展正常业务。

受“新限令”影响,RTX 4090 曾全面下架

 

此前,出口到中国的 GPU 和 AI 加速器的主要性能上限,体现在互连带宽之上——也就是处理器之间相互通信的速度。2022 年 10 月,美国商务部工业和安全局(BIS)公布对中国出口管制新规,主要针对先进芯片和芯片制造设备领域,限制了双向互连带宽为 600 GB/秒芯片的出口,规格在此之下的 GPU 无需额外申请许可。

 

作为回应,英伟达和英特尔都调整了自家最新 GPU,主动下调互连速度以回避美国商务部的限制。比如 H800 就是典型的特供版本。

 

2023 年 10 月 17 日,拜登政府更进一步,对性能密度采取了新一轮管控政策。据悉,新的政策将限制 Nvidia A800 和 H800 芯片的出口,此外,新规将豁免笔记本电脑、智能手机和游戏设备中使用的大多数消费级芯片,但其中部分芯片仍须受到美国官员的批准和专项管控。相关规定将在未来 30 天内生效。

 

根据商务部工业和安全局(BIS)提交的文件,新规则第一条、也是其中最重要的条款,限制了以下产品的对中出口:

 

“拥有一个或多个数字处理单元,且具备以下任一特征的集成电路产品:(1)「总处理性能」(TPP)为 4800 或者以上;或者(2)「总处理性能」为 1600 或更高,且「性能密度」为 5.92 或以上。”

 

其实 GPU 和加速器的总处理性能(TPP)分数计算非常简单。只需要将设备的每秒密集万亿次运算(浮点或整数)的最大数字加倍,再乘以运算的位长度。对于涉及不同精度的多项性能指标(例如 INT4、FP8、FP16 和 FP32 等),则使用最高 TPP 得分。

 

受这一新规影响,RTX 4090 成为唯一一款被禁止在中国销售的消费级显卡产品。

 

据悉,RTX 4090 的总处理性能(TPP)超过了 4800,略高于规定的消费级显卡性能上限。所谓 4800,是指先将 GPU 每秒所能运行的最大万亿次运算数字(浮点或整数运算)加倍,再乘以运算的位长度。

 

初版 4090 的 TPP 性能为 5285,也就是说英伟达必须获得美国政府颁发的许可证才能在中国合法销售这款高人气游戏显卡。需要注意的是,消费级显卡不受性能密度指标的限制,这项指标主要用于约束英伟达 L4 等性能较弱的数据中心用显卡的销售活动。

 

一时间,在京东搜索 “RTX 4090 显卡”只有少数第三方售卖,但需要预约等待到货。 同样,在淘宝搜索也是如此,标注价格基本 2 万起步,最高甚至接近 4 万元。而在二手平台咸鱼上,RTX4090 售价基本 1.2 万起步。华硕、微星、影驰等英伟达合作商也同样纷纷下架该型号的非公显卡,官方旗舰店均已显示无货状态。

 

对于“新限令”,英伟达方面曾回应称:“我们遵守所有适用的法规,同时努力提供支持不同行业的数千种应用产品。鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。”

受影响的不只有英伟达

 

虽然作为 AI 芯片市场上份额占比最高的巨头,英伟达肯定会首当其冲受到此项新规的影响,但英特尔和 AMD 的情况恐怕也好不到哪里去。

 

虽然 AMD 当前的最高规格 GPU MI250X 已经受到去年出口政策的限制,但 MI210 从技术角度讲其实低于 600 GB/秒的带宽限制。不过根据估算,该卡的 TPP 得分为 5792、功率密度为 8,所以随着新规的出台生效,MI210 恐怕也将告别中国市场。不过,AMD 曾公开表示他们正在开发一款类似于英伟达 A800 和 H800 的特殊加速器,专门面向中国销售。

 

来自 TrendForce 的行业观察师们表示,这些规定可能会抑制中国市场对英伟达高端 AI 服务器的需求,导致其全球需求份额从目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 预计字节跳动、百度、阿里巴巴和腾讯等大型 Web 和云服务商将在新规生效之前积极储备 GPU 资源。TrendForce 在一份研究报告中表示,“英伟达可能也会努力将当前稀缺的资源(例如 H800)优先交付给中国客户。”

 

从长远来看,TrendForce 预计中国企业将加快芯片自主研发力度,目前阿里巴巴打造的平头哥 ASIC 和华为投资的昇腾计算平台就是典型案例。与此同时,分析师们认为中国企业还可能调整 AI 开发思路,转而租用服务商提供的资源。

 

参考链接:

https://www.theregister.com/2023/12/28/nvidia_4090_returns_to_china/

https://www.infoq.cn/article/QJ73po4wuwTvLKcpK1Fw?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

https://www.infoq.cn/article/0AbAmTSduzAuVFFu29Nq?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

 

2023-12-29 15:1410042

评论

发布
暂无评论
发现更多内容

Java面向对象编程中级

timerring

Java

Hyperledger(超级账本)的worldstate和SAP CRM的CRMD_CUMULAT_H

汪子熙

超级账本 hyperledger 三周年连更

JS字符串的截取出现的bug

格斗家不爱在外太空沉思

JavaScript ES6 三周年连更

浅谈你对单例类中使用volatile关键字的理解 | 超级详细,建议收藏

bug菌

volatile volatile原理 三周年征文 三周年连更

AI日课@20230415:Stable Diffusion入门学习;ChatGPT的成本计算

无人之路

ChatGPT

这一次,带你玩转gRPC框架

闫同学

gRPC Go 语言 三周年连更

消息队列常见的使用场景

程序员大彬

Java、 消息队列

软件测试/测试开发丨接口测试用例之间参数调用

测试人

软件测试 自动化测试 接口测试 测试开发 测试用例

挑战 30 天学完 Python:Day7 数据类型 - 集合 set

MegaQi

Python 挑战30天学完Python 三周年连更

跨平台应用开发进阶(四十六)webview方式嵌套H5应用加载慢解决方案

No Silver Bullet

webview 解决方案 跨平台应用开发 三周年连更

Java房屋出租系统

timerring

Java

如何成为一名数据分析师(二)——统计学之描述性统计

Data 探险实验室

数据分析 数据 数据分析师

Vue3 响应式语法糖

程序员海军

Vue 3 三周年连更

To B第六年,腾讯过分温柔

脑极体

腾讯

Unity 之 后处理实现界面灰度效果(PostProcessing实现 | Shader实现)

陈言必行

Unity 三周年连更

【坚果派-坚果】OpenHarmony Native开发【一】

坚果

OpenHarmony 三周年连更 napi

企业过等保不再难,华为云提供一站式安全解决方案

秃头也爱科技

架构实战营-模块2-作业

Geek_e948d4

分布式事务的21种武器 - 2

俞凡

架构

一文上手文档智能Document Mind

六月的雨在InfoQ

OCR 文档理解 文档转换 三周年连更 Document Mind

软件测试丨Selenium 自动侦测浏览器版本并下载对应的浏览器驱动

测试人

软件测试 自动化测试 测试开发 selenium

软件测试/测试开发丨Python 算法与数据结构面试题

测试人

Python 软件测试 面试题 自动化测试 测试开发

【云原生】Docker—Dockerfile写法与用法以及dockerfile简介与构建镜像详解【附加实战】

A-刘晨阳

Linux Dockerfile 三周年连更

Claude,一个可以无需魔法访问的ChatGPT

派大星

ChatGPT Claude

为数据安全保驾护航,华为云助力企业快速安全过“等保”

秃头也爱科技

软件测试/测试开发/接口测试丨Android 高版本无法抓取 HTTPS

测试人

软件测试 自动化测试 接口测试 测试开发

Spring Data开发手册|手摸手教你简化持久层开发工作

浅羽技术

Java spring springdata 框架 三周年连更

麻了,不要再动不动就BeanUtil.copyProperties

JAVA旭阳

Java 架构设计

3d渲染和动画制作:KeyShot Pro mac中文版

真大的脸盆

Mac Mac 软件 渲染器 动画制作 渲染工具

是什么影响了MySQL索引B+树的高度?

架构精进之路

MySQL 数据库 三周年连更

网站SEO排名不稳定怎么办?

海拥(haiyong.site)

三周年连更

英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%_AI&大模型_凌敏_InfoQ精选文章