速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

英伟达发布中国特供版 RTX 4090D:砍掉部分核心功能后,速度降低 11%,性能只差 5%

  • 2023-12-29
    北京
  • 本文字数:2643 字

    阅读完需:约 9 分钟

大小:1.26M时长:07:19
英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%

受美国今年 10 月份颁布的最新限令影响,一夜之间,英伟达顶级旗舰显卡 RTX 4090 全面下架。如今,事情似乎有了转机。

英伟达发布中国特供版 RTX 4090D

 

12 月 28 日,英伟达中文网站上线了一款名为 RTX 4090D 的显卡,这是英伟达顶级旗舰显卡 RTX 4090 的低性能版本,可以在不违背美国最新出口管制规定的前提下,出口中国。据悉,字母“D”意为 Dragon,代表 2024 年农历龙年。该显卡将于明年 1 月正式上市。

 

与 RTX 4090 相比,RTX 4090D 性能降低约 10.94%,具体差异为核心数量较少、共 14592 个 CUDA 核心,低于中国境外销售的 16384 核心版本。

 

英伟达日前在采访中表示,4090D 这张 GPU 的张量核心数也有类似幅度的削减,从 512 个减少至 456 个。除此之外,其他设计基本没有变化,峰值时钟速率仍为 2.52 GHz、内存为 24 GB GDDR6x,内存总线也继续保持 384 位。

 

尽管有所“阉割”,英伟达坚称这款显卡的性能并没有受到太大影响。

 

英伟达公司一位发言人在邮件采访中表示,“在启用光线追踪和深度学习超采样(DLSS)的 4K 分辨率游戏当中,GeForce RTX 4090D 的性能只比 GeFOrce RTX 4090 低 5% 左右,而且运行方式与全系 GeForce GPU 没有区别,所以最终用户仍可进行超频。”

 

这已经不是英伟达第一次为了遵守美国出口管制条例而主动削弱显卡性能。2022 年底,在限制对中国 AI 加速器销售风波之后,这家美国芯片巨头就降低了广受欢迎的 A100 GPU 的互连速度,由此衍生出的新版本被命名为 A800。下一代 H100 也有同样的低性能版本,预计将定名为 H800。

 

英伟达的举动也很快引起了美国商务部长 Gina Raimondo 的注意,她警告各芯片制造商不要触碰禁令的底线。“我可以告诉大家,如果你们沿着划定的边界重新设计芯片、让这些产品用于 AI 场景,那我第二天就会收紧控制。”

 

Raimondo 随后向路透社解释称,美国商务部正在与英伟达密切合作,确保不会把可能对美国国家安全构成威胁的 GPU 和 AI 加速器出售给中国。当然,这家芯片大厂可以、也应该获准在中国开展正常业务。

受“新限令”影响,RTX 4090 曾全面下架

 

此前,出口到中国的 GPU 和 AI 加速器的主要性能上限,体现在互连带宽之上——也就是处理器之间相互通信的速度。2022 年 10 月,美国商务部工业和安全局(BIS)公布对中国出口管制新规,主要针对先进芯片和芯片制造设备领域,限制了双向互连带宽为 600 GB/秒芯片的出口,规格在此之下的 GPU 无需额外申请许可。

 

作为回应,英伟达和英特尔都调整了自家最新 GPU,主动下调互连速度以回避美国商务部的限制。比如 H800 就是典型的特供版本。

 

2023 年 10 月 17 日,拜登政府更进一步,对性能密度采取了新一轮管控政策。据悉,新的政策将限制 Nvidia A800 和 H800 芯片的出口,此外,新规将豁免笔记本电脑、智能手机和游戏设备中使用的大多数消费级芯片,但其中部分芯片仍须受到美国官员的批准和专项管控。相关规定将在未来 30 天内生效。

 

根据商务部工业和安全局(BIS)提交的文件,新规则第一条、也是其中最重要的条款,限制了以下产品的对中出口:

 

“拥有一个或多个数字处理单元,且具备以下任一特征的集成电路产品:(1)「总处理性能」(TPP)为 4800 或者以上;或者(2)「总处理性能」为 1600 或更高,且「性能密度」为 5.92 或以上。”

 

其实 GPU 和加速器的总处理性能(TPP)分数计算非常简单。只需要将设备的每秒密集万亿次运算(浮点或整数)的最大数字加倍,再乘以运算的位长度。对于涉及不同精度的多项性能指标(例如 INT4、FP8、FP16 和 FP32 等),则使用最高 TPP 得分。

 

受这一新规影响,RTX 4090 成为唯一一款被禁止在中国销售的消费级显卡产品。

 

据悉,RTX 4090 的总处理性能(TPP)超过了 4800,略高于规定的消费级显卡性能上限。所谓 4800,是指先将 GPU 每秒所能运行的最大万亿次运算数字(浮点或整数运算)加倍,再乘以运算的位长度。

 

初版 4090 的 TPP 性能为 5285,也就是说英伟达必须获得美国政府颁发的许可证才能在中国合法销售这款高人气游戏显卡。需要注意的是,消费级显卡不受性能密度指标的限制,这项指标主要用于约束英伟达 L4 等性能较弱的数据中心用显卡的销售活动。

 

一时间,在京东搜索 “RTX 4090 显卡”只有少数第三方售卖,但需要预约等待到货。 同样,在淘宝搜索也是如此,标注价格基本 2 万起步,最高甚至接近 4 万元。而在二手平台咸鱼上,RTX4090 售价基本 1.2 万起步。华硕、微星、影驰等英伟达合作商也同样纷纷下架该型号的非公显卡,官方旗舰店均已显示无货状态。

 

对于“新限令”,英伟达方面曾回应称:“我们遵守所有适用的法规,同时努力提供支持不同行业的数千种应用产品。鉴于全球对我们产品的需求,我们预计(新规)短期内不会对我们的财务业绩产生实质性的影响。”

受影响的不只有英伟达

 

虽然作为 AI 芯片市场上份额占比最高的巨头,英伟达肯定会首当其冲受到此项新规的影响,但英特尔和 AMD 的情况恐怕也好不到哪里去。

 

虽然 AMD 当前的最高规格 GPU MI250X 已经受到去年出口政策的限制,但 MI210 从技术角度讲其实低于 600 GB/秒的带宽限制。不过根据估算,该卡的 TPP 得分为 5792、功率密度为 8,所以随着新规的出台生效,MI210 恐怕也将告别中国市场。不过,AMD 曾公开表示他们正在开发一款类似于英伟达 A800 和 H800 的特殊加速器,专门面向中国销售。

 

来自 TrendForce 的行业观察师们表示,这些规定可能会抑制中国市场对英伟达高端 AI 服务器的需求,导致其全球需求份额从目前的 5% 到 6% 降低至 3% 到 4%。此外,TrendForce 预计字节跳动、百度、阿里巴巴和腾讯等大型 Web 和云服务商将在新规生效之前积极储备 GPU 资源。TrendForce 在一份研究报告中表示,“英伟达可能也会努力将当前稀缺的资源(例如 H800)优先交付给中国客户。”

 

从长远来看,TrendForce 预计中国企业将加快芯片自主研发力度,目前阿里巴巴打造的平头哥 ASIC 和华为投资的昇腾计算平台就是典型案例。与此同时,分析师们认为中国企业还可能调整 AI 开发思路,转而租用服务商提供的资源。

 

参考链接:

https://www.theregister.com/2023/12/28/nvidia_4090_returns_to_china/

https://www.infoq.cn/article/QJ73po4wuwTvLKcpK1Fw?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

https://www.infoq.cn/article/0AbAmTSduzAuVFFu29Nq?utm_campaign=geek_search&utm_content=geek_search&utm_medium=geek_search&utm_source=geek_search&utm_term=geek_search

 

2023-12-29 15:149703

评论

发布
暂无评论
发现更多内容

3d建筑软件:Vectorworks 2023激活版

真大的脸盆

Mac Mac 软件 3D建筑动画

关于 SysOM 2.0 网络/存储相关诊断功能介绍及案例展示 | 第 72-73 期

OpenAnolis小助手

开源 直播 系统运维 技术分享 龙蜥大讲堂

十问babel

虎妞先生

前端工程化 babel 前端‘’

使用Nginx作为MySQL的TCP负载均衡器

Janwee

nginx 负载均衡 :MySQL 数据库

关于服务器数据迁移,介绍在服务器数据迁移计划中的7个步骤

镭速

Tapdata Cloud 基础课:新功能详解之「授权系统自动分析」,一键定位任务报错原因,快速获取修复建议

tapdata

大数据

EFCore之CodeFirst

青柚1943

ORM SqlServer NET6 EFCore

尚硅谷Node.js实战教程发布

小谷哥

工业数字孪生:西门子工业网络与设备虚拟调试案例

Openlab_cosmoplat

工业互联网 开源社区 数字孪生

天工人巧日争新:昇腾AI的绚丽今日

脑极体

AI

DSC:数仓SQL脚本迁移的神奇工具

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

Rust的安全性和稳健型

非凸科技

研发效能度量从 0 到 1 的『六脉神剑』

思码逸研发效能

研发效能 效能度量 研发效能度量

vue项目中babel的最佳实践

虎妞先生

前端 Vue 3 vue cli babel

AREX-携程无代码侵入的自动化回归测试平台

AREX 中文社区

开源 自动化测试 回归测试

2023主流系统 固资管理助力转型升级一步到位

加入高科技仿生人

低代码 企业数字化转型 资产管理

为什么CMS和G1都改用三色标记法,是可达性分析不香吗?

Java全栈架构师

Java 程序员 后端 JVM 架构师

DBA必备的Mysql知识点:数据类型和运算符

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

盘点10款优秀的工作任务进度管理软件

爱吃小舅的鱼

项目管理 项目进度管理 项目进度管理软件

低代码平台的流程引擎设计指南

Baidu AICLOUD

低代码 爱速搭

Java中让两个线程交替执行的实现方式

Janwee

并发 信号量 java 多线程、

最新Blender 3.3安装包+详细安装教程

Finovy Cloud

blender 3D软件

办公要有新享法,「MIAOYUN生活梦想家」焕新升级!

MIAOYUN

搬迁公告 乔迁 办公升级

MySQL创建用户与授权

源字节1号

软件开发 前端开发 后端开发 小程序开发

活动推荐 | 博睿数据数智领航营火热报名中

博睿数据

保险 博睿数据 活动报名 数智领航营

MQTT 5.0新特性:属性与载荷

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 载荷

Sugar BI 增强分析能力全场景解析

Baidu AICLOUD

BI

Seata-go 1.1.0 发布,补齐 AT 模式支持

SOFAStack

开源 互联网 开发者 开发 Seata框架

我在京东做研发第五期:京东云自研服务器,如何将开发成本降低 60% 的同时还更低碳环保?

京东科技开发者

cpu 服务器 环保 节能 企业号 3 月 PK 榜

倒计时2天:百度“文心一言”即将上线!

引迈信息

人工智能 低代码 AIGC ChatGPT 文心一言

英伟达发布中国特供版RTX 4090D:砍掉部分核心功能后,速度降低11%,性能只差5%_AI&大模型_凌敏_InfoQ精选文章