写点什么

NVIDIA 发布新的 C++ 数值计算库:支持 GPU 加速

  • 2023-11-15
    北京
  • 本文字数:843 字

    阅读完需:约 3 分钟

大小:385.53K时长:02:11
NVIDIA发布新的C++数值计算库:支持GPU加速

 MatX 是一个 C++ 库由 Nvidia 为其自有的 GPU 开发,,旨在使用高级语法在数值计算中实现接近本地性能,不遑多让于 Python 的 scipy 或 MATLAB。它的最新版本引入了许多新功能,包括可以将变换作为运算符,以及新的运算符,如上采样、下采样、pwelch 等等。

 

现在,可以在任何运算符表达式中使用变换,以使用运算符融合来进行延迟评估。运算符融合是 MatX 中的一个特殊功能,旨在提高性能,通过减少内存访问,从而避免内存访问成本相对寄存器访问昂贵数个数量级的问题。

 

旨在通过减少内存访问来提高性能,内存访问的成本可能比寄存器访问高出几个数量级。使用运算符融合,一个表达式不会立即计算,而是转换为表示该表达式的 C++ 类型,该类型将在需要其值时进行评估。换句话说,不是立即计算表达式的结果,比如:

 

(A = B * (cos(C) / D)).run();
复制代码

 

你可以将其值存储在一个中间表达式中:

 

auto op = (B * (cos(C) / D));
复制代码

 

将其与其他表达式组合,并在需要时进行延迟评估。这一特性是通过重载 C++ 运算符实现的。MatX 的最新版本将这一功能扩展到了变换中,例如在以下表达式中:

 

(A = B * fft(C)).run();
复制代码

 

编译器能够理解乘法运算符的右侧是 FFT 变换,而左侧是另一个表达式,可以在编译时与前者的结果进行融合

 

值得注意的是,将变换用作运算符的这种新语法与以前的变换使用方式存在一些不兼容。具体而言,以前你可能会写成matmul(C, A, B, stream),而现在应该使用(C = matmul(A,B)).run(stream)

 

MatX 0.6.0 引入的另一个新功能是新的多相通道化运算符,它可以将输入信号分成一组通道。例如,它可用于将高采样率的宽带信号转换为多个低采样率的窄带信号。

 

新的运算符包括 `upsample`,用于通过插入零来上采样信号;downsample,用于通过丢弃样本来下采样信号;pwelch,用于可视化信号的频谱,而无需进行预处理。

 

MatX 的最新版本拥有更多功能,此处无法详尽列出。如果你对完整细节感兴趣,不要错过官方发布说明。

 

原文链接:

https://www.infoq.com/news/2023/10/Nvidia-matx-cpp-numerical-lib/

2023-11-15 08:004846

评论

发布
暂无评论
发现更多内容

强大的跨平台的SSH、Telnet和SFTP客户端 Termius for mac直装激活版

Rose

流式细胞分析 FlowJo 10 for Mac 破解安装教程

Rose

GreptimeDB v0.10 重磅上线:日志场景增强、功能性能双重升级

Greptime 格睿科技

数据库 日志 版本

基于PP-ShiTuv2新增PaddleX图像识别模型产线,显著提升商品识别等细粒度开放域产业场景检索性能

百度Geek说

易点天下与火山引擎ByteHouse共建高性能数仓,助力智能营销效率跃升

字节跳动数据平台

DevOps帮助数字化转型的5种方式

禅道项目管理

项目管理 程序员 DevOps 数字化转型 项目管理软件

文件同步工具 Beyond Compare永久密钥分享-mac/win

Rose

macOS剪切板管理工具 Paste for Mac 中文免激活版

Rose

人工智能的应用现状

天津汇柏科技有限公司

AI 人工智能

测试右移之——监控告警中心优化与建设策略

京东科技开发者

超详细!!传统NLP算法结合大模型私有化部署简易知识问答体系工程实践

京东科技开发者

如何打包CST仿真结果

思茂信息

cst cst使用教程 cst操作 cst电磁仿真 CST软件

Minitab Express 助力,让数据统计变得轻而易举

Rose

专访丨大模型存储新王牌,焱融科技如何引爆AI竞争力

焱融科技

人工智能 文件存储 大模型 全闪存储

数据飞轮:互联网企业降本增效的数智化新范式

字节跳动数据平台

一分钟带你了解LED全彩显示屏

Dylan

科技 LED显示屏 全彩LED显示屏 户外LED显示屏 led显示屏厂家

山西运城等保测评机构地址在哪里?电话多少?

行云管家

网络安全 等保 堡垒机 等保测评 运城

浙江企业采购堡垒机品牌就选行云!

行云管家

堡垒机 等保测评 浙江

Xcode:mac开发工具下载

Rose

教你一招,轻松玩转HyperWorks网格变形

智造软件

仿真 CAE软件 Hypermesh

java小知识-纳秒

京东科技开发者

Java分析工具 JProfiler mac破解版+安装教程

Rose

DICT项目支撑的破局之道,提升之路

鲸品堂

提效降本 企业号 2024年11月PK榜

最好用的mac效率工具 Alfred 4 for mac汉化版安装包

Rose

NVIDIA发布新的C++数值计算库:支持GPU加速_编程语言_Sergio De Simone_InfoQ精选文章