GPU

关注
收录了GPU频道下的 38 篇内容
GPU是一种专门在计算机上运行绘图运算工作的微处理器。
  • 全部
  • 文章
  • 话题
阿里云发布云数据中心处理器CIPU,替代CPU成为云时代IDC的处理核心
阿里云发布云数据中心处理器 CIPU,替代 CPU 成为云时代 IDC 的处理核心

CIPU 与计算结合,快速接入不同类型资源的服务器,带来算力的“0”损耗

英特尔的XPU计划:Falcon Shores项目为超级计算机融合x86与Xe技术
英特尔的 XPU 计划:Falcon Shores 项目为超级计算机融合 x86 与 Xe 技术

Falcon Shores 项目主要针对超级计算 /HPC 市场,其核心是一个新的处理器架构,可以将英特尔的 x86 CPU 和 Xe GPU 硬件置入同一颗 Xeon 芯片中。它计划在 2024 年发布,且英特尔预计它将提供 5 倍以上的每瓦性能和 5 倍于该公司当前平台的内存容量。

黄仁勋谈GPU大战:每年都有“英伟达杀手”跳出来,但无人成功
黄仁勋谈 GPU 大战:每年都有“英伟达杀手”跳出来,但无人成功

在这场对话中,黄仁勋谈到了英伟达 Omniverse 平台所承载的元宇宙蓝图,探讨了数据中心业务如何保持增长,他还对显卡领域激烈的市场竞争发表了看法,他认为,尽管每年都有所谓的“英伟达杀手出现”,但 15 年来,英伟达在超级计算机 GPU 加速领域几乎无敌手。

OpenAI发布Triton,一款用于神经网络的类Python GPU开源编程语言
OpenAI 发布 Triton,一款用于神经网络的类 Python GPU 开源编程语言

OpenAI 声称这款语言让开发人员无需太多努力即可挖掘硬件的最大潜能,从而比以往更轻松地创建更复杂的工作流程。

GPU在计算机架构的新黄金时代还会继续闪耀吗?
GPU 在计算机架构的新黄金时代还会继续闪耀吗?

GPU 能否保住人工智能世界“CPU”的宝座?

突发!美商务部将7个中国超算实体列入实体清单,制裁或许没有华为严重
突发!美商务部将 7 个中国超算实体列入实体清单,制裁或许没有华为严重

美国再“拉黑”7 个中国超算实体,这是拜登政府上任后,美国政府第一次增加对华实体清单名单。

缺了黄仁勋的GTC China,还有什么惊喜?
缺了黄仁勋的 GTC China,还有什么惊喜?

“黄氏定律”开启新时代?

FPGA在深度学习应用中或将取代GPU
FPGA 在深度学习应用中或将取代 GPU

随着可编程性等问题在 FPGA 上的解决,FPGA 将成为市场人工智能应用的选择。

性能提升最高达25倍!新型分布式机器学习训练加速方案RAT技术解读
性能提升最高达 25 倍!新型分布式机器学习训练加速方案 RAT 技术解读

DNN 训练性能瓶颈正在从计算部分转移至通信部分。

GPU选购指南:训练ML模型,我必须买RTX3080吗?
GPU 选购指南:训练 ML 模型,我必须买 RTX3080 吗?

如果你想购买一块新 GPU,主要看哪些特性呢?GPU 内存、内核、张量核?如何做出有成本效益的选择?

终下决心!中国龙芯决定放弃所有美国技术,做真正的纯国产指令集
终下决心!中国龙芯决定放弃所有美国技术,做真正的纯国产指令集

曾支撑 2015 年中国发射的北斗卫星,龙芯是近年来国产自主程度相对较高的芯片

英特尔前雇员讲述:50年老厂是如何走上“挤牙膏”之路的?
英特尔前雇员讲述:50 年老厂是如何走上“挤牙膏”之路的?

芯片外包台积电背后的十年沉浮和无奈

突破算力束缚:阿里提出智能算力引擎DCAF, 节省20%GPU算力
突破算力束缚:阿里提出智能算力引擎 DCAF, 节省 20%GPU 算力

未来,计算力可能从过去算法进化的推力,变成阻力。

计算架构“新黄金十年”已来,Intel设立了一个兴趣小组等你!
计算架构“新黄金十年”已来,Intel 设立了一个兴趣小组等你!

年代我们做研究那时一样,新的架构设计将会带来更低的成本,更优的能耗、安全和性能。计算架构的“新黄金十年”已经开启。

失去华为,寒武纪IPO“芯”事重重
失去华为,寒武纪 IPO“芯”事重重

4 岁的寒武纪面临着不少成长中的烦恼,它能赶考科创板成功,成为“AI 芯片第一股”吗?

英特尔承认落后AMD 7nm,直到2021年才能赶上对手
英特尔承认落后 AMD 7nm,直到 2021 年才能赶上对手

对于英特尔来说,2020 年和 2021 年将是竞争压力时刻环绕的漫长两年。

Imagination老矣?最新GPU架构IMG A系列,性能提升2.5倍,有史以来最快
Imagination 老矣?最新 GPU 架构 IMG A 系列,性能提升 2.5 倍,有史以来最快

15 年来,Imagination Technologies 最重要的一次发布。

一台CS-1性能顶1000个GPU?史上最大AI芯片Cerebras WSE正式投入使用
一台 CS-1 性能顶 1000 个 GPU?史上最大 AI 芯片 Cerebras WSE 正式投入使用

Cerebras Systems 的首席执行官 Andrew Feldman 表示,CS-1 是目前“最快的 AI 计算机”。

定义未来应用程序开发的十年?英特尔正式推出统一跨架构编程模型oneAPI
定义未来应用程序开发的十年?英特尔正式推出统一跨架构编程模型 oneAPI

英特尔或许能够凭借 oneAPI,对整个芯片设计行业进行一次“大规模的洗牌”。

英特尔推出首款通用GPU ,英伟达却表示并不担心
英特尔推出首款通用 GPU ,英伟达却表示并不担心

英伟达黄仁勋表示:我们重视竞争对手,但我们有自己的技术。

基于UAI-Train平台的分布式训练
基于 UAI-Train 平台的分布式训练

在大型数据集上进行训练的现代神经网络架构,可以跨广泛的多种领域获取可观的结果,涵盖从图像识别、自然语言处理到欺诈检测和推荐系统等各个方面,但训练这些神经网络模型需要大量浮点计算能力。

英特尔终于实现10nm芯片量产,7nm芯片还要多久?
英特尔终于实现 10nm 芯片量产,7nm 芯片还要多久?

经过数年的拖延,英特尔终于交付了首批 10nm 处理器。

比Horovod/NCCL 快8倍!伯克利与微软联合发布最优GPU通信库Blink
比 Horovod/NCCL 快 8 倍!伯克利与微软联合发布最优 GPU 通信库 Blink

随着 GPU 的算力不断提升,GPU 间的数据聚合(即模型同步)成为了大规模分布式模型训练的瓶颈。

CPU并行编程概述(上)
CPU 并行编程概述(上)

一个自然而然的问题是:为什么要用并行编程?

我们距离纯粹的中国“芯”还有多远?| 话题
我们距离纯粹的中国“芯”还有多远?| 话题

业界人士常谈,随着后摩尔时代的到来,中国的半导体行业会获得更多的机遇,芯片领域也会迎来春天。

阿里云智能总裁行癫:做芯片,我们喜欢走前人没走过的路
阿里云智能总裁行癫:做芯片,我们喜欢走前人没走过的路

阿里巴巴的几位专家重点讨论了阿里在云和 AI 上的思考,以下为 InfoQ 整理的本次对话的关键信息。

苹果最新A13仿生芯片可还行?
苹果最新 A13 仿生芯片可还行?

除了“智能手机有史以来最好的机器学习性能”宣称外,“能效”或许可以被称作苹果 A13 仿生芯片的最大亮点之一。

全球首个软硬件推理平台NVDLA编译器正式开源,可在云端自主设计推理用AI芯片
全球首个软硬件推理平台 NVDLA 编译器正式开源,可在云端自主设计推理用 AI 芯片

近期,英伟达在 GitHub 上开源了 NVDLA 编译器的源代码,这是世界上首个软硬件推理平台的完整开源代码。

    太极 Angel 助力生成式大模型高效落地
    太极 Angel 助力生成式大模型高效落地

    刘凯 | 腾讯 高级工程师

    立即下载
    图和向量融合技术在大模型架构的应用和探索

    徐瑶 | Fabarta 向量引擎研发专家、Apache Kudu PMC Member

    立即下载
    SmartEV 和 AI,蔚来的思考与实践

    李斌 | 蔚来 创始人、董事长、CEO

    立即下载