速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

深度学习框架 SINGA 升级为 Apache 顶级项目

  • 2019-12-13
  • 本文字数:1194 字

    阅读完需:约 4 分钟

深度学习框架SINGA升级为Apache顶级项目

Apache软件基金会(ASF)最近宣布,分布式深度学习框架SINGA升级为顶级项目(TLP,top-level project)。这表明了 SINGA 项目所达到的成熟度和稳定性。SINGA 已经得到了银行、医疗健康等多行业中企业的应用。


SINGA 最早由新加坡国立大学研究人员开发,并于2015年三月 进入 ASF 孵化器。SINGA 提供了一种在机器集群中分布式训练深度学习模型的计算框架,降低了模型训练所需的时间。SINGA 不仅仅是一种学术研究平台,而且已在花旗集团、世邦魏理仕等多家企业得到了商业应用,并在健康医疗行业得到多处应用,例如为糖尿病前期患者提供帮助的应用


深度学习模型所取得的成功,是由大规模数据集的使用所驱动的。例如包括成千上万图像的ImageNet、具有上百万参数的复杂模型等。谷歌的自然语言模型BERT具有近 3 亿个参数,是在近 30 亿个单词上训练得到的。但是,完成这种训练通常需要数个小时,甚至数天时间。为加速训练过程,研究人员引入了并行处理技术,将计算任务分布到计算集群的多台设备上。SINGA 研究团队负责人黄铭钧教授指出:


深度学习必须扩展到分布式计算,因为…深度学习模型通常规模巨大,并需要在大型数据集上训练。如果使用单个 GPU,通常需要数百天时间。


分布式深度学习有两种并行策略。一种是数据并行,即多台机器分别处理不同的输入数据子集;另一种是模型并行,即多台机器分别训练神经网络模型的不同部分。SINGA 同时支持上述两种策略,也支持两种策略的组合使用。为协调集群机器间的工作,并行策略将引入额外的通信和同步开销。SINGA 实现了多种优化技术,力图降低上述开销。


SINGA 升级为 TLP 项目,表明该项目已经通过了包括软件质量和社区等在内的多个里程碑 。理论上看,成为 TLP 项目将会得到更多解决方案的考虑。但采纳该软件的一个可能障碍,就是 SINGA 设计人员选择了实现自身的 API,并未基于 Kera 等现有 API 去建模神经网络。与之不同,Uber 开源的Horovod计算框架支持开发人员导出现有模型到目前广为使用的两个深度学习框架,即TensorFlowPyTorch。尤其是 PyTorch,近期得到大量研究论文采用。


ASF 还支持了多个顶级分布式机器学习数据处理项目,例如SparkIgnite。SINGA 的独特之处在于,它是专门针对大规模神经学习模型而设计的。同时,ASF 也是另一个深度学习框架MXNet的孵化器。和 TensorFlow 和 PyTorch 一样,MXNet 依然在孵化器阶段。尽管AWS在2016下半年就内定其深度学习框架为MXNet,但是 MXNet 依然并未得到广泛使用。据KDNugget调查显示,MXNet 的使用率仅在不高于2%左右波动


Apache SINGA 2.0版于 2019 年四月发布,源代码SINGA Jira项目的可追踪问题列表提供在 GitHub 上。据 ASF 介绍,SINGA 即将推出的特性包括“实现 5G 边缘设备上深度学习的 SINGA-lite,以及易于非深度 AI 背景领域专家开展 AI 计算的 SINGA-easy”。


原文链接:


Deep-Learning Framework SINGA Graduates to Top-Level Apache Project


2019-12-13 15:002930

评论

发布
暂无评论
发现更多内容

AI 流媒体音乐平台 Melodio 发布;多模态模型 VITA 可打断无需唤醒词丨 RTE 开发者日报

声网

精选:适合中小企业的7款文档管理工具

爱吃小舅的鱼

文档管理 文档管理工具 文档管理系统

10分钟构建服务监控工具

coxi_vv

监控 Prometheus 1Panel

数据安全与合规性:观测云在保护企业数据中的角色

可观测技术

数据安全

10分钟构建Web 应用防火墙-uuWAF

coxi_vv

开源 waf 1Panel

案例分享 | 八爪鱼RPA在社区医疗流程自动化系统中的应用

八爪鱼采集器︱RPA机器人

RPA 自动化 流程

实时监控的力量:观测云如何提升业务响应速度

可观测技术

实时监控

别再被坑了! JavaScript类型检测的最佳实践

Immerse

JavaScript 数据结构 数据类型

一次JVM GC长暂停的排查过程

京东科技开发者

Go 语言 viper 库上手实践

FunTester

用户体验的优化:观测云在用户行为分析中的应用

可观测技术

用户体验

HarmonyOS应用程序访问控制探究

白晓明

HarmonyOS NEXT

图像编辑软件Pixelmator Pro for Mac激活版

Mac相关知识分享

图像编辑软件

如何在Python中使用免费的DeepL翻译API

幂简集成

Python 翻译 API 免费API

网络安全警钟:Windows TCP/IP协议出现高危漏洞

郑州埃文科技

TCP IP 漏洞

PromQL:观测云中的监控数据分析利器

可观测技术

数据分析

每个Moka招聘系统用户都需要一套八爪鱼RPA

八爪鱼采集器︱RPA机器人

RPA 自动化 招聘 智能化

Mobpush 标签推送

MobTech袤博科技

10分钟构建业务数据大屏

coxi_vv

服务器 数据可视化 开源软件 DataEase 1Panel

全功能本地服务器软件MAMP PRO for Mac激活版

Mac相关知识分享

10分钟构建运维安全审计系统

coxi_vv

开源 运维 1Panel jumpserver

10分钟构建内网邮件服务器

coxi_vv

开源软件 1Panel 开源邮件服务器 邮件服务器

专业音频控制软件SoundSource 5 for Mac

Mac相关知识分享

本地部署马斯克开源Grok-1大模型,贝锐花生壳3步实现远程访问

贝锐

AI 内网穿透 Stable Diffusion

Dubbo源码浅析(一)—RPC框架与Dubbo

京东科技开发者

【后台体验】运营后台订单详情设计分享

京东科技开发者

数据驱动决策:观测云在企业战略中的作用

可观测技术

数据结构

AI+仿真,助力工业智能化变革:面向仿真工程师的机器学习工具

Altair RapidMiner

人工智能 AI 设计 仿真 altair

区块链合约系统开发一站式服务

V\TG【ch3nguang】

区块链技术开发 合约系统开发

20分钟构建企业知识库

coxi_vv

开源 halo 1Panel 开源知识库

代理IP为什么很难达到100%的利用率?

IPIDEA全球HTTP

深度学习框架SINGA升级为Apache顶级项目_AI&大模型_Anthony Alford_InfoQ精选文章