QCon 演讲火热征集中,快来分享你的技术实践与洞见! 了解详情
写点什么

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄 CES 亮相全球最小超算 GPU

  • 2025-01-07
    北京
  • 本文字数:2139 字

    阅读完需:约 7 分钟

大小:888.20K时长:05:03
920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU

自英伟达发布其上一款旗舰桌面 GPU 以来,已经过去了两年多的时间,外界对英伟达的新动作期待已久。

 

北京时间 1 月 7 日(周二)上午 10:30,老黄不负众望,在 CES 2025 上发表了 90 分钟的主题演讲,拉开了英伟达一系列发布的序幕,所涉及的领域包括自动驾驶汽车、机器人和 AI Agent。

 

黄仁勋表示:“人工智能始于感知人工智能,即理解图像、文字和声音。然后是生成人工智能,即创造文本、图像和声音。”现在,我们正在进入“物理人工智能,即可以进行、推理、计划和行动的人工智能”的时代。他解释道,NVIDIA GPU 和平台是这一转变的核心,推动了游戏、机器人和自动驾驶汽车(AV)等各个行业的突破。

 

黄仁勋在演讲中回顾了 NVIDIA 三十年的历程。1999 年,英伟达发明了可编程 GPU。他说,从那时起,现代人工智能从根本上改变了计算的工作原理。“在短短 12 年的时间里,技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”

GeForce RTX 50 系列正在改变图形技术

 

“GeForce 让 AI 走进大众,现在 AI 正在回归 GeForce,”黄仁勋表示。

 

他同时推出了 NVIDIA GeForce RTX 5090 GPU,这是迄今为止最强大的 GeForce RTX GPU,拥有 920 亿个晶体管,每秒可进行 3352 万亿次 AI 运算 (TOPS)。

 

“这就是我们全新的 GeForce RTX 50 系列,Blackwell 架构,”黄仁勋高举着黑色的 GPU 说道,并指出它如何能够利用先进的 AI 来实现突破性的图形处理。“GPU 简直就是一头猛兽。”

 

 

黄仁勋表示:“即使是机械设计也是一个奇迹”,并指出该显卡有两个冷却风扇。

 

GPU 系列的更多系列即将推出。GeForce RTX 5090 和 GeForce RTX 5080 台式机 GPU 计划于 1 月 30 日上市。GeForce RTX 5070 Ti 和 GeForce RTX 5070 台式机计划于 2 月开始上市。笔记本电脑 GPU 预计将于 3 月上市。

 

得益于 Blackwell 架构的创新和 DLSS 4,GeForce RTX 5090 的性能比 GeForce RTX 4090 提高了 2 倍。

 

GeForce RTX 5090 拥有 32GB GDDR7 内存、1792 GB/秒的总内存带宽、21760 个 CUDA 核心、680 个第五代 Tensor 核心和 170 个第四代光线追踪核心,是终极 GeForce GPU,拥有比英伟达之前制造的任何产品都要多的硬件和更强大的功能。 

 

DLSS 4 多帧生成技术首次亮相,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。多帧生成技术可与全套 DLSS 技术协同运行,与传统渲染技术相比,性能提升至高可达 8 倍,同时通过 NVIDIA Reflex 技术保证响应速度。

 

DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。基于 Transformer 架构的 DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。GeForce RTX 50 系列 GPU 支持 DLSS 4,发布之日即有超过 75 款游戏和应用支持该技术。

 

在游戏中,具有多帧生成的 DLSS 4 有助于在《赛博朋克 2077》、《心灵杀手 2》和《黑神话:悟空》中成倍提高性能,使 GeForce RTX 5090 用户能够以 4K 240Hz/FPS 的速度玩游戏,并启用完整的光线追踪功能并将其他所有设置都调至最高,以获得终极体验。

 

 

英伟达还推出了 NVIDIA Reflex 2。

 

黄仁勋解释道,最新一代 DLSS 可以为我们计算的每一帧生成三帧。“因此,我们能够以极高的性能进行渲染,因为 AI 的计算量要少得多。”

 

RTX 神经着色器使用小型神经网络来改善实时游戏中的纹理、材质和光照。RTX 神经人脸和 RTX 头发可提高实时面部和头发渲染,使用生成式 AI 来制作有史以来最逼真的数字角色动画。RTX Mega Geometry 将光线追踪三角形的数量增加了 100 倍,从而提供更多细节。

 

NVIDIA Reflex 2 支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。 

利用 Cosmos 推进物理 AI

除了图形方面的进步外,黄仁勋还介绍了 NVIDIA Cosmos 世界基础模型平台,称其为机器人和工业 AI 领域的游戏规则改变者。

 

黄仁勋解释道,人工智能的下一个前沿是物理人工智能。他将这一时刻比作大型语言模型对生成式人工智能的变革性影响。

 

他解释道:“通用机器人技术的 ChatGPT 时刻即将到来。”

 

黄仁勋表示,与大型语言模型一样,世界基础模型对于推动机器人和 AV 开发至关重要,但并非所有开发人员都具备训练自己模型的专业知识和资源。

 

Cosmos 集成了生成模型、标记器和视频处理管道,为 AV 和机器人等物理 AI 系统提供支持。Cosmos 旨在将远见和多元宇宙模拟的能力引入人工智能模型,使其能够模拟每一种可能的未来并选择最佳行动。

 

老黄解释说,Cosmos 模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。“Cosmos 生成优先考虑 AV 和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”

 

首批采用 Cosmos 的公司包括领先的机器人和汽车公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘车巨头 Uber。

 

此外,现代汽车集团正在采用 NVIDIA AI 和 Omniverse 来打造更安全、更智能的汽车,增强制造能力并部署尖端机器人技术。

2025-01-07 16:43144
用户头像
李冬梅 加V:busulishang4668

发布了 977 篇内容, 共 578.3 次阅读, 收获喜欢 1129 次。

关注

评论

发布
暂无评论

TON链代币DApp开发:TON币目前表现强劲,未来TON币的前景

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

IAM中的“跨生态纳管”

芯盾时代

身份安全 iam 生态链 统一身份管理平台

测试开发比,能代表质效平衡吗?

老张

软件测试 研发效能 质量保障

和平台融合做套件,是SaaS厂商掘金的新趋势吗

ToB行业头条

Java Chassis 3技术解密,流式响应如何简化AI应用开发

华为云开发者联盟

Java 人工智能 华为云 华为云开发者联盟 企业号2024年7月PK榜

逆天排版神器:Affinity Publisher 2 for Mac/win版

你的猪会飞吗

Mac Dock mac破解软件下载

小浣熊写代码,让我每天摸鱼时间增加2h

landred

Vue3 前端‘’

【论文解读】大模型的有效探索

合合技术团队

人工智能 LLM

解决卡顿发热,超帧技术焕发中重载游戏动力

HarmonyOS SDK

HarmonyOS

探秘数据库中的并行计算技术应用

华为云开发者联盟

MySQL 数据库 华为云 华为云开发者联盟 企业号2024年7月PK榜

科大讯飞:说说零拷贝技术和多路复用技术?

王磊

Java

【HDC.2024】华为云致力推进全域Serverless时代,引领技术创新,赋能行业实践

华为云PaaS服务小智

云计算 Serverless 华为云

全面升级!GPT-4o 第一时间体验、疑问解答、福利揭秘

蓉蓉

openai GPT-4 gpt4o

【HDC.2024】全球销量领先车企基于Serverless服务构建数据实时处理的千万级车联网业务

华为云PaaS服务小智

云计算 软件开发 华为云

AI系统:未来科技的驱动力

天津汇柏科技有限公司

人工智能 未来以来

2024软博会

AIOTE智博会

青岛软博会

Sermant自定义插件开发上手体验

华为云开源

开源 微服务 云原生 微服务治理

性能测试介绍

测试人

软件测试 性能测试

Outlook 2021 LTSC for Mac v16.86.2中文正式版

你的猪会飞吗

mac软件下载 mac破解软件下载

Gin 教程:构建优雅的 Web 应用(一)

Felix

golang gin框架

文献解读-长读长测序-第十三期|《PrecisionFDA真相挑战第二版:利用短读长和长读长在难比对区域进行变异检测》

INSVAST

基准测试 基因数据分析 生信服务

森马基于MaxCompute+Hologres+DataWorks构建数据中台

阿里云大数据AI技术

数据挖掘 大数据 阿里云 实时数仓 hologres

HDC Cloud 2024 | CodeArts加速软件智能化开发,携手HarmonyOS重塑企业应用创新体验

华为云PaaS服务小智

云计算 软件开发 华为云

920 亿晶体管、每秒 3000 多万亿次 AI 运算,老黄CES亮相全球最小超算GPU_英伟达_李冬梅_InfoQ精选文章