产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

NVIDIA 发布新的 C++ 数值计算库:支持 GPU 加速

  • 2023-11-15
    北京
  • 本文字数:843 字

    阅读完需:约 3 分钟

大小:385.53K时长:02:11
NVIDIA发布新的C++数值计算库:支持GPU加速

 MatX 是一个 C++ 库由 Nvidia 为其自有的 GPU 开发,,旨在使用高级语法在数值计算中实现接近本地性能,不遑多让于 Python 的 scipy 或 MATLAB。它的最新版本引入了许多新功能,包括可以将变换作为运算符,以及新的运算符,如上采样、下采样、pwelch 等等。

 

现在,可以在任何运算符表达式中使用变换,以使用运算符融合来进行延迟评估。运算符融合是 MatX 中的一个特殊功能,旨在提高性能,通过减少内存访问,从而避免内存访问成本相对寄存器访问昂贵数个数量级的问题。

 

旨在通过减少内存访问来提高性能,内存访问的成本可能比寄存器访问高出几个数量级。使用运算符融合,一个表达式不会立即计算,而是转换为表示该表达式的 C++ 类型,该类型将在需要其值时进行评估。换句话说,不是立即计算表达式的结果,比如:

 

(A = B * (cos(C) / D)).run();
复制代码

 

你可以将其值存储在一个中间表达式中:

 

auto op = (B * (cos(C) / D));
复制代码

 

将其与其他表达式组合,并在需要时进行延迟评估。这一特性是通过重载 C++ 运算符实现的。MatX 的最新版本将这一功能扩展到了变换中,例如在以下表达式中:

 

(A = B * fft(C)).run();
复制代码

 

编译器能够理解乘法运算符的右侧是 FFT 变换,而左侧是另一个表达式,可以在编译时与前者的结果进行融合

 

值得注意的是,将变换用作运算符的这种新语法与以前的变换使用方式存在一些不兼容。具体而言,以前你可能会写成matmul(C, A, B, stream),而现在应该使用(C = matmul(A,B)).run(stream)

 

MatX 0.6.0 引入的另一个新功能是新的多相通道化运算符,它可以将输入信号分成一组通道。例如,它可用于将高采样率的宽带信号转换为多个低采样率的窄带信号。

 

新的运算符包括 `upsample`,用于通过插入零来上采样信号;downsample,用于通过丢弃样本来下采样信号;pwelch,用于可视化信号的频谱,而无需进行预处理。

 

MatX 的最新版本拥有更多功能,此处无法详尽列出。如果你对完整细节感兴趣,不要错过官方发布说明。

 

原文链接:

https://www.infoq.com/news/2023/10/Nvidia-matx-cpp-numerical-lib/

2023-11-15 08:004710

评论

发布
暂无评论
发现更多内容

硬核出击,只为守护你的秘密!

亚马逊云科技 (Amazon Web Services)

Redis不是一直号称单线程效率也很高吗,为什么又采用多线程了?

Linux服务器开发

redis 后端 多线程 Linux服务器开发 网络io

看德威学校如何通过亚马逊云科技开启青少年AI探索之旅

亚马逊云科技 (Amazon Web Services)

5分钟速读之Rust权威指南(十)

wzx

rust

FIL矿池挖矿算力分发系统开发搭建

薇電13242772558

数字货币 算力

SUSECON 2021首日重点新闻:SLES 15 SP3和SUSE Rancher 2.6全新发布

Rancher

太为难我了,阿里面试了7轮(5年经验,拿下P7岗offer)

Java 程序员 架构 面试

Docgeni,开箱即用的 Angular 组件文档工具

PingCode研发中心

开源 研发工具

Flink的流数据SQL

五分钟学大数据

flink 5月日更

原来,GitHub标星90K+的Leetcode刷题手册长这样

Java架构师迁哥

用 Java 实现坦克大战,这个有点强了!

Java架构师迁哥

打造生态“朋友圈”,英特尔以生态之道培育AI创新“大气候”

E科讯

工业绿色发展可视化管理——高炉炼铁厂可视化系统

一只数据鲸鱼

数据可视化 工业物联网 智慧工厂 三维可视化 高炉炼铁

极狐GitLab 13.11功能回顾,含Kubernetes Agent和流水线合规性

极狐GitLab

系统运维 安全监控审计 #on-call #GitLab 极狐GitLabs

5G加油站,需要中频段

脑极体

中台反思:云原生下API网关的选择

孤岛旭日

网关 api 网关 平台 技术中台

helm-kubernetes的包管理器

片风

云原生 Helm 包管理工具

hive的DDL语法基本操作

大数据技术指南

hive 5月日更

团队项目进度跟踪难?延期风险高?国内企服排行榜第一的通用项目管理工具在这里了

爱吃小舅的鱼

进度条 PMP Certification 项目经理 项目管理工具

阿里云黄博远:AI工程化是发挥算法及数据价值的效能中枢

阿里云大数据AI技术

Flutter 混合开发基础

网易云信

flutter 框架

GitHub上下载量突破100000+阿里巴巴的这份开源项目如此牛逼

阿里巴巴 开源 编程 Java 25 周年

Python3 Note 浮点类型误差问题

awen

Python 浮点型 decimal

AI医疗发展中的机遇与有效监管

CECBC

膜拜!多次霸榜Github的springboot 实战派文档到底有多强?

Java 程序员 架构 面试

5.29 相约杭州!云原生 Meetup 第二期杭州站报名开启!

青云技术社区

云原生

PingCode 3.0 发布,开启国产研发自动化时代

爱吃小舅的鱼

敏捷开发 研发管理 开发 研发工具 项目经理

直播点播窄带高清之 JND 感知编码技术

网易云信

音视频 视频编码

Python3 Note 如何合理使用assert

awen

Python assert

如何入门数据分析?

数据社

大数据 数据分析 5月日更

打破固有思维(十九)

Changing Lin

NVIDIA发布新的C++数值计算库:支持GPU加速_编程语言_Sergio De Simone_InfoQ精选文章