Intel开源了基于Apache Spark的分布式深度学习框架BigDL_亚马逊云科技_Alexandre Rodrigues_InfoQ精选文章



 写点什么

登录/注册

Intel 开源了基于 Apache Spark 的分布式深度学习框架 BigDL 。BigDL 借助现有的 Spark 集群来运行深度学习计算，并简化存储在 Hadoop 中的大数据集的数据加载。

在 Xeon 服务器上运行的测试结果表明，BigDL 比其他开源框架 Caffe 、 Torch 和 TensorFlow 有显著的性能提升。BigDL 速度可与主流 GPU 匹敌，而且能够扩展到数十个 Xeon 服务器。

BigDL 库支持 Spark 1.5、1.6 和 2.0 版本，并容许将深度学习嵌入在现有的 Spark 程序中。BigDL 库中有把 Spark RDDs 转换为 BigDL DataSet 的方法，并且可以直接与 Spark ML Pipelines 一起使用。

对于模型训练，BigDL 使用了在多个执行器中执行单个 Spark 任务的同步小批量 SGD（ Stochastic Gradient Descent ）。每个执行器运行一个多线程引擎并处理一部分微批次数据。在当前版本中，所有的训练和验证数据都存储到存储器中。

BigDL 使用 Scala 开发，并参考了 Torch 的模型。像 Torch 一样，它有一个使用 Intel MKL 库进行计算的 Tensor 类。Intel MKL（Math Kernel Library）是由一系列为计算优化过的小程序所组成的库，这些小程序从 FFT （快速傅立叶变换）到矩阵乘法均有涉及，常用于深度学习模型训练。Module 是另一个从 Torch 借鉴而来的概念，它的灵感来自 Torch 的 nn package 。Module 代表单独的神经网络层、 Table 和 Criterion 。

BigDL 提供了一个 AWS EC2 镜像和一些示例，比如使用卷积神经网络进行文本分类，还有图像分类以及如何将在Torch 或Caffe 中预训练过的模型加载到 Spark 中进行预测计算。来自社区的请求主要包括提供对 Python 的支持和 MKL-DNN （MKL 的深度学习扩展）。

查看英文原文： Intel Open-Sources BigDL, Distributed Deep Learning Library for Apache Spark

感谢薛命灯对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

评论

发布

暂无评论

数据库产品层出不穷，金融行业如何选择？｜FCon 专访

数据库大数据数据仓库数据分析 apache doris

海外云手机在跨境外贸中的作用

云计算跨境电子商务跨境电商电子商务

博睿数据参与支持2023年度证券期货业标准研究课题获评“优秀”

item_get-1688商品详情在跨境电商中的营销策略创新

技术冰糖葫芦

叮，你有一份来自2023开放原子开发者大会的邀请函，请查收！

开放原子开源基金会

Java 开源程序员开发者算法

一分钟了解人工神经网络（ANN）

小魏写代码

云原生的实践探索和深入学习

Apache Doris 在某工商信息商业查询平台的湖仓一体建设实践

数据库大数据数据仓库数据分析 apache doris

天猫商品评论数据接口（Tmall.item_review）

天猫API接口天猫商品评论接口天猫评论接口天猫商品评论内容接口天猫评论API接口

使用TikTok云手机轻松拓展全球市场

云计算 TikTok 手机云服务

精细经营：为 Web3 游戏长期卓越奠定基石

Footprint Analytics

区块链 Web3 游戏加密攻略

一文教你提高写代码效率，程序员别错过！

伤感汤姆布利柏

效率程序员敏捷开发低代码

速度与稳定性的完美结合：深入横测ToDesk、TeamViewer和AnyDesk

远程办公 ToDesk TeamViewer AnyDesk

华为云Astro，让业务专家秒变“技术大拿”

低代码华为云

「代码舞者」2023开放原子开发者大会——开源大侠秘闻

开放原子开源基金会

开源开发者算法

千万用户的人群过滤，做好这几个点，竟然支持亿级流量

架构后端高并发

在极狐GitLab 上使用 DVC 实现简单机器学习

Machine Learning MLOps

热热热！开放原子开发者大会议题征集火爆！

开放原子开源基金会

Java 开源程序员开发者算法

虾皮商品评论接口（Shopee.item_review）｜虾皮API接口指南

shopee API 虾皮商品评论接口虾皮商品评价接口虾皮评论接口 shopee 商品评论接口

“基于inBuilder低代码平台开源社区版的应用开发”创新赛获奖队伍公示

inBuilder低代码平台

海外云手机怎么帮助您运营facebook？

云计算 facebook 弹性云手机手机云服务

权威认可，天翼云云原生一体机iStack斩获“2023云原生企业TOP50”第一名