写点什么

深度学习框架 SINGA 升级为 Apache 顶级项目

  • 2019-12-13
  • 本文字数:1194 字

    阅读完需:约 4 分钟

深度学习框架SINGA升级为Apache顶级项目

Apache软件基金会(ASF)最近宣布,分布式深度学习框架SINGA升级为顶级项目(TLP,top-level project)。这表明了 SINGA 项目所达到的成熟度和稳定性。SINGA 已经得到了银行、医疗健康等多行业中企业的应用。


SINGA 最早由新加坡国立大学研究人员开发,并于2015年三月 进入 ASF 孵化器。SINGA 提供了一种在机器集群中分布式训练深度学习模型的计算框架,降低了模型训练所需的时间。SINGA 不仅仅是一种学术研究平台,而且已在花旗集团、世邦魏理仕等多家企业得到了商业应用,并在健康医疗行业得到多处应用,例如为糖尿病前期患者提供帮助的应用


深度学习模型所取得的成功,是由大规模数据集的使用所驱动的。例如包括成千上万图像的ImageNet、具有上百万参数的复杂模型等。谷歌的自然语言模型BERT具有近 3 亿个参数,是在近 30 亿个单词上训练得到的。但是,完成这种训练通常需要数个小时,甚至数天时间。为加速训练过程,研究人员引入了并行处理技术,将计算任务分布到计算集群的多台设备上。SINGA 研究团队负责人黄铭钧教授指出:


深度学习必须扩展到分布式计算,因为…深度学习模型通常规模巨大,并需要在大型数据集上训练。如果使用单个 GPU,通常需要数百天时间。


分布式深度学习有两种并行策略。一种是数据并行,即多台机器分别处理不同的输入数据子集;另一种是模型并行,即多台机器分别训练神经网络模型的不同部分。SINGA 同时支持上述两种策略,也支持两种策略的组合使用。为协调集群机器间的工作,并行策略将引入额外的通信和同步开销。SINGA 实现了多种优化技术,力图降低上述开销。


SINGA 升级为 TLP 项目,表明该项目已经通过了包括软件质量和社区等在内的多个里程碑 。理论上看,成为 TLP 项目将会得到更多解决方案的考虑。但采纳该软件的一个可能障碍,就是 SINGA 设计人员选择了实现自身的 API,并未基于 Kera 等现有 API 去建模神经网络。与之不同,Uber 开源的Horovod计算框架支持开发人员导出现有模型到目前广为使用的两个深度学习框架,即TensorFlowPyTorch。尤其是 PyTorch,近期得到大量研究论文采用。


ASF 还支持了多个顶级分布式机器学习数据处理项目,例如SparkIgnite。SINGA 的独特之处在于,它是专门针对大规模神经学习模型而设计的。同时,ASF 也是另一个深度学习框架MXNet的孵化器。和 TensorFlow 和 PyTorch 一样,MXNet 依然在孵化器阶段。尽管AWS在2016下半年就内定其深度学习框架为MXNet,但是 MXNet 依然并未得到广泛使用。据KDNugget调查显示,MXNet 的使用率仅在不高于2%左右波动


Apache SINGA 2.0版于 2019 年四月发布,源代码SINGA Jira项目的可追踪问题列表提供在 GitHub 上。据 ASF 介绍,SINGA 即将推出的特性包括“实现 5G 边缘设备上深度学习的 SINGA-lite,以及易于非深度 AI 背景领域专家开展 AI 计算的 SINGA-easy”。


原文链接:


Deep-Learning Framework SINGA Graduates to Top-Level Apache Project


2019-12-13 15:002972

评论

发布
暂无评论
发现更多内容

2022 全球 AI 模型周报

Zilliz

深度学习 计算机视觉 Transformer 多模态

OceanBase CEO杨冰:小就是大,构建企业核心竞争力

OceanBase 数据库

轻量化服务,大道至简,触手可及

鼎道智联

微服务 云服务 PWA 轻应用 原子化服务

QCN9074 WiFi 6E Card OpenWRT, IPQ6010,802.11ax,wallys,QCN9074 802.11ax 4x4 MU-MIMO 6GHz wifi6E

wallys-wifi6

IPQ6010 QCN9074

兆骑科创创业大赛,线上直播路演,高层次人才引进服务平台

兆骑科创凤阁

VPN是什么?VPN与堡垒机有啥区别?

源字节1号

软件开发 小程序开发

Bundle-less 的思考和实践分享

字节跳动终端技术

bundle 字节跳动 前端 构建工具 拆包

Java:在Word文档中添加或删除页眉页脚

Geek_249eec

Java word 页眉页脚

演进式架构从不缺设计方法,最大的阻力在于「人」

万事ONES

高僧斗法(博弈-Nim博弈)

Five

算法竞赛 算法题 8月月更

3D可视化在智慧园区的应用

3DCAT实时渲染

华为云安全云脑,让企业云化运营更放心

IT资讯搬运工

毕业设计

Asha

蓝桥杯历届试题 蚂蚁感冒(模拟版+非模拟版)

Five

算法 算法竞赛 8月月更

专访通过 OBCP V3 首位考生:V3 让知识更加结构化、体系化

OceanBase 数据库

开源一夏 | Java 覆盖jar包内的方法

六月的雨在InfoQ

开源 钉钉 Java core 8月月更

leetcode 225. Implement Stack using Queues 用队列实现栈(简单)

okokabcd

LeetCode 数据结构与算法

基于 Impala 的高性能数仓建设实践之虚拟数仓

网易数帆

大数据 impala 数仓架构

定制开发APP——怎样吸引更多用户?

开源直播系统源码

软件开发 直播系统源码 定制开发 app定制开发

软件测试100天上岸3-测试有哪些最高原则

和牛

测试 8月月更

7大特征交互模型,最好的深度学习推荐算法总结

博文视点Broadview

身价百亿的Zendesk:创业,从一个小目标开始

ToB行业头条

金融和科创深化合作,常熟农商银行与博云签署战略合作协议

BoCloud博云

云计算 容器 云原生

华为云主机安全助力企业种出“金葫芦”

IT资讯搬运工

缓存穿透、缓存击穿、缓存雪崩及解决方案

Steven

​五大不良 coding 习惯,你占了几样?

SEAL安全

Code 代码规范 CODING

在Rust和C之间传递字符串,有 7 种方法!

非凸科技

c rust

OceanBase 4.0发布:首次实现单机分布式一体化架构、全面上云

OceanBase 数据库

开源一夏 | Node.js实战之Node多进程与JXcore 打包深入运用

恒山其若陋兮

开源 8月月更

观测云产品更新|观测云计费更新;新增场景仪表板/笔记/查看器的查看权限;优化监控器和事件等

观测云

万物皆可集成系列:低代码释放用友深度价值(1)—系统对接集成

葡萄城技术团队

深度学习框架SINGA升级为Apache顶级项目_AI&大模型_Anthony Alford_InfoQ精选文章