最新发布《数智时代的AI人才粮仓模型解读白皮书(2024版)》,立即领取! 了解详情
写点什么

OpenAI 发布 Triton,一款用于神经网络的类 Python GPU 开源编程语言

  • 2021-09-03
  • 本文字数:793 字

    阅读完需:约 3 分钟

OpenAI发布Triton,一款用于神经网络的类Python GPU开源编程语言

近期,OpenAI 发布了他们的最新语言 Triton。这种开源编程语言让研究人员能够为 AI 负载编写高效的 GPU 代码。



它与 Python 兼容,并且用户只需编写最少 25 行代码,就能实现专家级的效果。OpenAI 声称这款语言让开发人员无需太多努力即可挖掘硬件的最大潜能,从而比以往更轻松地创建更复杂的工作流程。



http://www.eecs.harvard.edu/~htk/publication/2019-mapl-tillet-kung-cox.pdf


深度学习领域的研究人员通常依赖于原生框架操作符。然而这可能会带来一些问题,因为它需要许多临时张量才能工作,这可能会影响大规模神经网络的性能发挥。


编写专门的 GPU 内核是一种更便利的解决方案,但由于对 GPU 编程的复杂性,这种方案实践起来会有意想不到的困难。找到一种既能提供所需的灵活性和速度,又能让开发人员轻松理解的系统是一项挑战。这促使 OpenAI 的研究人员改进了 Triton,Triton 最初是由他们的一位队友创建的。


现代 GPU 的架构可以分解为三大组件——DRAM、SRAM 和 ALU。在优化 CUDA 代码时必须考虑每一个组件;开发人员不能忽视 GPU 编程带来的诸多挑战,包括:来自 DRAM 的内存传输应该充分合并,以利用当今内存接口上更大的总线宽度。数据在再次使用之前需要手动存储在 SRAM 中,以免在检索时与其他共享内存块发生冲突。



https://openai.com/blog/triton/


Triton 简化了专用内核的开发过程,这些内核比通用库中的内核要快得多。编译器会自动对其进行优化和并行化,将其转换为在最新的 Nvidia GPU 上执行的代码。Triton 起源于 2019 年提交给机器学习和编程语言国际研讨会的一篇论文,其创建者现在是 OpenAI 团队的一员。


论文:http://www.eecs.harvard.edu/~htk/publication/2019-mapl-tillet-kung-cox.pdf


Github:https://github.com/openai/triton


来源:https://openai.com/blog/triton/


原文链接:


https://www.marktechpost.com/2021/07/28/openai-releases-triton-an-open-source-python-like-gpu-programming-language-for-neural-networks

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2021-09-03 11:265739
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 493.2 次阅读, 收获喜欢 1966 次。

关注

评论

发布
暂无评论
发现更多内容

架构实战营1期模块9作业——毕业设计

tt

架构实战营

中秋图关系构建

6979阿强

图算法 GraphScope 中秋节

12种 vo2dto 方法,就 BeanUtils.copyProperties 压测最拉胯!【快双11了,别用错喽】

小傅哥

Java 小傅哥 MapStruct vo2dto JMapper

成本直降50% | 阿里云发布云原生网关,开启下一代网关新进程

阿里巴巴中间件

阿里云 微服务 云原生 中间件 网关

专场预告 | DTCC数据库技术大会云溪数据库专场

浪潮云

云计算

CSS架构之setting层

Augus

CSS 10月月更

模块九 电商秒杀系统设计

小牧ah

架构实战营

11. python入门复习教程之命名空间与作用域,再谈异常,标准库,持久化与序列化

梦想橡皮擦

10月月更

第 14 章 -《Linux 一学就会》- RAID磁盘阵列的原理与搭建

学神来啦

Linux linux运维 linux云计算

云计算改变企业的传统思考方式

低代码小观

云计算 创新 企业 企业管理 传统观念

百分点大数据技术团队:低代码平台实践

百分点科技技术团队

为绿色而生:智慧矿山可视化数治监管

一只数据鲸鱼

数据可视化 智慧矿山 煤矿 矿山

模块九作业

秀聪

架构实战营

【LeetCode】删除链表的倒数第 N 个结点Java题解

Albert

算法 LeetCode 10月月更

直播回顾|蒋烁淼:《下一代企业级应用软件论坛》可观测性主题精彩分享

观测云

可观测性

Prometheus 数据模型

耳东@Erdong

Prometheus 10月月更

模块九作业

老实人Honey

【Vuex 源码学习】第十篇 - Vuex 命名空间的实现

Brave

源码 vuex 10月月更

架构实战训练营模块 4 作业

Sonichen

【Flutter 专题】32 图解自定义 View 之 Paint

阿策小和尚

Flutter 小菜 0 基础学习 Flutter Android 小菜鸟 10月月更

低代码BPM平台

低代码小观

低代码 企业 企业管理 BPM 低代码平台

今天的你幸福吗?

卢卡多多

幸福 10月月更

模块9毕业设计

柱林

DCI架构是如何解决DDD战术建模缺点的?

华为云开发者联盟

领域驱动设计 对象 建模 对象编程 DCI架构

极客时间架构实战营作业五

jjn0703

架构实战营

Pandas高级教程之:时间处理

程序那些事

Python 大数据 数据分析 pandas 程序那些事

梦幻西游H5游戏超详细图文架设教程

echeverra

H5游戏

授人以渔,华为“开源雨林”计划致力推动开源生态发展

Facebook宕机背后,我们该如何及时发现DNS问题

阿里巴巴云原生

阿里云 产品 云原生

013 云原生之容器技术

穿过生命散发芬芳

云原生 10月月更

多图详解万星 Restful 框架原理与实现

万俊峰Kevin

微服务 RESTful Web框架 go-zero Go 语言

OpenAI发布Triton,一款用于神经网络的类Python GPU开源编程语言_AI&大模型_Asif Razzaq_InfoQ精选文章