开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

Facebook 开源在 Torch 上进行更快速机器学习的模块

  • 2015-01-20
  • 本文字数:527 字

    阅读完需:约 2 分钟

Facebook 开源了一些用于在 Torch(一个广泛支持机器学习算法的科学计算框架)上更快速地训练神经网络的模块。

不久之前, Nvidia 发布了 cuDNN ,这是一个基于 CUDA 的库,用于深度神经网络。 Facebook 人工智能实验室(FAIR)近日发布了一些 Torch 上的模块,供公开使用。这些模块合称为 fbcunn ,而且“比默认模块快得多”。它们主要面向卷积神经网络(convolutional nets),针对 GPU 做了优化,构建在 Nvidia 的 cuFFT 库之上。其中包括:

  • 使用 FFT 加速卷积的空间卷积模块
  • 用于并行化多 GPU 上的训练数据和模型的容器
  • FFT/IFFT 的包装器
  • 一个更快速的临时卷积层(比 cuDNN 快 1.5 到 10 倍)
  • 用于神经语言模型和单词嵌入(word embedding)的查找表

Facebook 基于 Fast Training of Convolutional Networks through FFTs 这篇论文中的想法构建了这些模块,FAIR 的主任 Yann LeCun 是论文的合著者之一。根据发布说明,与cuDNN 相比,在卷积核较小的情况下(3x3),fbcunn 的速度提升可达1.84 倍;而在卷积核较大的情况下(5x5),速度提升可达23.5 倍。

Torch 和 fbcunn 最早的用途之一就是更快速的图像识别,一个例子就是分类来自ImageNet 的120 万幅图片

查看英文原文: Facebook Open Sources Modules for Faster Deep Learning on Torch

2015-01-20 11:413348
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 137.5 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

QCN974/QCN6274 Chip multi-band network adapter configuration details - Innovation in the age of Wi-Fi 7

wifi6-yiyi

WiFi7

LeetCode题解:1797. 设计一个验证系统,哈希表,JavaScript,详细注释

Lee Chen

探索Web3:十大全新项目如何颠覆行业未来

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

“AI+Security”系列第2期(二):人工智能风险治理机遇与挑战

云起无垠

超越传统:观测云的监控功能与 AI 集成

可观测技术

人工智能

大模型加持,火山引擎数据飞轮转入消费行业

字节跳动数据平台

大数据 数字化转型 云服务 数据平台 火山引擎

科大讯飞学习机s30和p30区别对比

妙龙

科大讯飞 学习机

关键字搜索新视角:API返回值中的商品热度分析

技术冰糖葫芦

API Explorer平台 API Explorer API 接口 API 测试 pinduoduo API

汽车配件行业MES系统:驱动高效生产与智能管理的新引擎

万界星空科技

mes 汽车行业 云mes 万界星空科技 汽车零配件行业

Remote Write:观测云数据存储的新篇章

可观测技术

Prometheus

企业如何通过数据虚拟化,构建逻辑数据编织平台?

Aloudata

数据虚拟化 Data Fabric 逻辑数据编织

大咖公开课 | AI自动化应用开发,让创意与效率并驾齐驱!

测试人

软件测试

财务规划中创新科技带来的变革力量

智达方通

全面预算管理 财务管理 财务规划

AI自动化应用开发,让创意与效率并驾齐驱!

测吧(北京)科技有限公司

测试

构建业务可观测性:统一数据结构的重要性

可观测技术

数据结构

ETL数据集成丨PostgreSQL数据迁移至Hive数据库

RestCloud

数据库 postgresql hive ETL 数据集成

【实战分享】如何获取天猫商品评论数据接口及解析方法

tbapi

天猫商品评论数据接口 天猫评论API 天猫商品评论数据采集 天猫商品评论API

基于飞桨框架的稀疏计算使用指南

百度Geek说

百度飞桨

持续更新与技术领先:保持监控系统的先进性

可观测技术

产品迭代

观测云的成本效益分析:开源工具在企业监控中的应用

可观测技术

开源

2024英特尔中国学术峰会:聚焦绿色计算,推动产学融合

E科讯

LeetCode题解:1234. 替换子串得到平衡字符串,滑动窗口,详细注释

Lee Chen

LeetCode题解:1250. 检查「好数组」,裴蜀定理,详细注释

Lee Chen

没有它,你的Scrum无法实现!

敏捷开发

Scrum 敏捷开发

Visio文件编辑查看工具:Visio Viewer for Mac 激活版

你的猪会飞吗

mac软件下载

支付域——收单业务

庄小焱

支付系统 金融 收单 跨境收单

MVP案例分享:绿野仙踪 - Zappos

ShineScrum

大咖公开课 | AI自动化应用开发,让创意与效率并驾齐驱!

霍格沃兹测试开发学社

初识 TON:账号、Token、交易与资产安全

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

厦门等保测评机构有几家?在哪里?

行云管家

等保 等级保护 厦门

GOGC招聘集市开始啦

非凸科技

招聘 GOGT 全球开源技术峰会 全球开源极客嘉年华

Facebook开源在Torch上进行更快速机器学习的模块_开源_Abel Avram_InfoQ精选文章