写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-01-18 18:005304
用户头像

发布了 22 篇内容, 共 61956 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

Spring 应用合并之路(二):峰回路转,柳暗花明 | 京东云技术团队

京东科技开发者

好用的思维导图软件MindNode for mac中文版 支持mac14系统

南屿

Mac软件 MindNode破解版下载 思维导图软件MindNode

流式湖仓增强,Hologres + Flink构建企业级实时数仓

阿里云大数据AI技术

工业 4.0 和数字孪生

3D建模设计

智慧城市 智慧园区 3D场景建模 3D数字孪生场景编辑器

零代码集成自动化的实现逻辑是什么?

谷云科技RestCloud

零代码 APPlink

文心一言 VS 讯飞星火 VS chatgpt (172)-- 算法导论13.3 1题

福大大架构师每日一题

福大大架构师每日一题

Calendar 366 II for Mac日历软件 最新版下载安装

南屿

Mac日历软件 菜单栏日历提醒工具 Calendar 366 II mac版 Calendar 366 II 下载

国企财务管控模式的创新思路

智达方通

国企 国有企业 财务管控 国企财务管控

Solidity之旅十七-库 [library]

BSN研习社

【Mac/win】Imagenomic Portraiture-PS磨皮插件-支持Ps2024 直装激活版

南屿

Imagenomic Professional PS磨皮滤镜降噪插件套装

小红书笔记详情数据接口(smallredbook.item_get_video)丨小红书API接口

tbapi

小红书笔记详情接口 小红书API接口

适用于ipad/iphone的虚拟定位工具:FonesGo Location Changer

南屿

GPS Mac软件 FonesGo Location Changer

解决Lightroom无法使用修改照片的问题

南屿

Lightroom无法使用

苹果Mac Finder 文件管理器替代工具:Path Finder

南屿

Path Finder破解 Path Finder下载 Mac文件管理

嘘!马斯克的话别全信

ZA技术社区

云服务 科技

如何推动智能制造 - 数字孪生示例

3D建模设计

智慧城市 智慧园区 3D场景建模 3D数字孪生场景编辑器

我的效率自救之路:大胆对低效的会议说“不!”

LigaAI

高效工作 经验分享 会议管理 研发提效 高绩效团队

K-最近邻算法(KNN)是什么法?

小齐写代码

速卖通商品列表数据接口(aliexpress.item_search)丨速卖通API接口

tbapi

速卖通API接口 速卖通商品数据接口 速卖通商品列表数据接口 关键词搜索速卖通商品接口

功能强大的专业扫描套装:ExactScan Enterprise中文下载

胖墩儿不胖y

Mac软件 扫描工具

实践零信任(Zero Trust):步骤详解

Apifox

程序员 安全 API 接口安全 零信任

3D 纹理的综合指南

3D建模设计

3D渲染 3D材质编辑 3D材质纹理贴图

苹果电脑音乐制作工具有哪些?分享几款Mac端好用的音乐制作工具!

南屿

mac软件下载 mac音乐制作工具

mac VM虚拟机中文版 VMware Fusion Pro 13 密钥激活 附 安装教程

南屿

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章