写点什么

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL

  • 2017-01-18
  • 本文字数:785 字

    阅读完需:约 3 分钟

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算,并简化存储在 Hadoop 中的大数据集的数据加载。

Xeon 服务器上运行的测试结果表明,BigDL 比其他开源框架 Caffe Torch TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌,而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本,并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法,并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练,BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD( Stochastic Gradient Descent )。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中,所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发,并参考了 Torch 的模型。像 Torch 一样,它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL(Math Kernel Library)是由一系列为计算优化过的小程序所组成的库,这些小程序从 FFT (快速傅立叶变换)到矩阵乘法均有涉及,常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念,它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table Criterion

BigDL 提供了一个 AWS EC2 镜像和一些示例,比如使用卷积神经网络进行文本分类,还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN (MKL 的深度学习扩展)。

查看英文原文 Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark


感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2017-01-18 18:005291
用户头像

发布了 22 篇内容, 共 61770 次阅读, 收获喜欢 3 次。

关注

评论

发布
暂无评论
发现更多内容

怎么用OpenAI Sora?最全分析-新手小白必看

蓉蓉

openai ChatGPT sora

你的代码是干的还是湿的?

敏捷开发

项目管理 敏捷开发 代码 代码人生 bug管理

阿里云ACK One GitOps:轻松实现多团队多集群应用交付

阿里巴巴云原生

阿里云 云原生 容器服务

避雷指南:11个常见 Kubernetes 误区详解

SEAL安全

Kubernetes 容器 云原生

ChatGPT加持,需求分析再无难题

测吧(北京)科技有限公司

测试

AI智能尺码引导未来决策 推动品牌业绩飙升

第七在线

2024 年 3 月 Web3 游戏报告:市场趋势与投资动态

Footprint Analytics

gamefi\

AutoMQ 1.1.0-RC0 重磅更新:内核升级到 Apache Kafka 3.7.0

AutoMQ

大数据 云原生 AutoMQ

不惜血本、重金打造的数据平台为何效果平平?

feng

数据平台 企业数据化运营

《射雕》热度不减!英特尔锐炫A750亮眼帧率展现高性价比优势!

E科讯

捷途山海T2预售开启,安全动力更卓越,仅需18.49万元起

极客天地

Kafka痛点专题:AutoMQ 如何实现分区持续重平衡?

AutoMQ

云计算 大数据 kafka AutoMQ

为什么测试要了解系统架构

老张

软件测试 系统架构 质量保障

RocketMQ 之 IoT 消息解析:物联网需要什么样的消息技术?

阿里巴巴云原生

阿里云 RocketMQ 云原生

2024 AutoMQ 布道师计划启动!

AutoMQ

大数据 云原生 布道师 AutoMQ

Linux设备树解析:桥接硬件与操作系统的关键架构

GousterCloud

Linux Kenel 设备信息

淘宝/天猫按图搜索淘宝商品(拍立淘) API接口(商品标题、价格、销量、链接)

技术冰糖葫芦

API Explorer api 货币化 API 文档

中国科技少年的英雄梦想,从一场ICT大赛启程

脑极体

ICT

奥哲·云枢All in One,“掌舵”数字原生2.0

ToB行业头条

Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章