QCon北京|3天沉浸式学习,跳出信息茧房。 了解详情
写点什么

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架

  • 2019-11-05
  • 本文字数:1592 字

    阅读完需:约 5 分钟

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架

今天,AWS 很高兴地宣布 Amazon EMR 将支持 Apache MXNet 和新一代 GPU 实例类型,让您可以在进行机器学习工作流程和大数据处理的同时运行分布式深度神经网络。此外,您还可以在采用 GPU 硬件的 EMR 群集上安装并运行自定义深度学习库。通过使用深度学习框架,您可以使用新工具包来处理多种使用案例,包括无人驾驶车辆、人工智能、个性化医疗和计算机视觉。


Amazon EMR 提供一个 Hadoop 托管框架,可以让您轻松、快速且经济高效地使用 Apache Spark、Apache Hive、PrestoApache HBase 和 Apache Flink 等框架处理 Amazon S3 中的大量数据。您可以低成本安全、高效地处理大量大数据使用案例,包括日志分析、Web 索引、数据转换 (ETL)、财务分析、科学模拟、实时处理和生物信息。


多年来,EMR 一直致力于帮助您运行可扩展的机器学习工作负载。2013 年,我们增加了对 Apache Mahout 的支持,以帮助您使用 Apache Hadoop MapReduce 来运行分布式机器学习工作负载。2014 年,客户开始利用 Apache Spark (我们在 2015 年增加了官方支持),以便利用 Spark ML 中提供的各种开源机器学习库来轻松构建可扩展的机器学习管道。


在过去 2 年内,我们还增加了对 Apache Zeppelin 笔记本、易于安装的 Jupyter 笔记本以及适用于交互式 Spark 工作负载的 Apache Livy 的支持,从而让数据科学家可以轻松快速地开发、培训以及将机器学习模型投入生产。EMR 的按秒计费方式以及使用 Amazon EC2 竞价型实例可实现的高达 80% 的成本节约,使您可以低成本轻松运行大规模的机器学习管道。


现在,您可以更轻松地在 Amazon EMR 上实施深度学习。我们增加了对 Apache MXNet (0.12.0) (一种可扩展的深度学习框架)、Amazon EC2 P3P2 实例、EC2 计算优化型 GPU 实例的支持,并预先加载了所需的 GPU 驱动程序。现在借助最新的 GPU 硬件,您只需单击几下即可快速轻松地创建适用于分布式培训的可扩展式安全群集。此外,您还可以安装并使用 BigDL 或 CaffeOnSpark 等自定义深度学习库,方法是在自定义 Amazon Linux AMI 上预加载这些库或使用引导操作来自定义群集。此外,EMR 将很快增加对 TensorFlow (另一个热门的深度学习框架) 的支持。


借助 EMR,您可以在开发工作的数据探索和预处理阶段轻松开发和培训深度学习模型。首先,您可以轻松且经济高效地使用各种开源大数据框架 (包括 Apache Spark、Apache Hadoop 和 Apache Hive) 来探索和处理 S3 中的大量数据集。


其次,除了使用 S3 或群集上 HDFS 中存储的预处理数据来开发、培训和运行深度学习模型以外,您还可以使用 MXNet 和 Spark 预测或执行推理。您将按秒付费,并且可以设置自已愿意为 EC2 竞价型实例支付的最高价,还可以使用 Auto Scaling。然后,您可以在完成工作负载后关闭群集并停止付费,从而进一步降低实验和生产的成本。


在 EMR 控制台中,您只需单击几下即可使用 Spark、MXNet、Ganglia 监控和 Zeppelin 笔记本快速创建一个拥有一到数千个节点的 EMR 群集。



启动群集后,即可打开 Zeppelin 笔记本并开始使用 Spark 和 MXNet 探索数据和构建模型。



借助 EMR,您可以通过以下任一操作轻松监控和调试应用程序:



我们计划在不久的将来发布更多文章,并提供基于 EMR 利用 MXNet 和其他框架进行大规模深度学习的示例和最佳实践。有关如何入门的更多信息,请参阅 Amazon EMR 文档


作者介绍:



Jonathan Fritz 是 Amazon EMR 的首席产品经理。他领导团队的产品管理,并致力于使针对海量数据的分析和机器学习更加轻松。他在闲暇时喜欢去陌生城市旅行、参加现场音乐会和进行户外探索。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/run-deep-learning-frameworks-with-gpu-instance-types-on-amazon-emr/


2019-11-05 08:00850

评论

发布
暂无评论
发现更多内容

学生管理系统架构设计

Geek_e8bfe4

Fruity Loops Studio20.9中文版水果软件

茶色酒

FL STUDIO20.9 FL Studio

强化 WordPress 的 11 种有效方法

海拥(haiyong.site)

安全 WordPress 5月月更

正则表达式知识点梳理

真嗣

正则表达式

极客训练营模块一作业

Geek__猫猫头

LSM-Tree - LevelDb 源码解析

懒时小窝

Lsm LSM树 LSM-Tree level

代码之外:关于校招 Offer 选择的问题

宇宙之一粟

offer 代码之外 5月月更

Mindmanager2022绿色版本

茶色酒

Mindmanager Mindmanager2022

基于Keras的视觉结算平台构想

工程师日月

人工智能 keras 5月月更

ffmpeg命令参数类型

Loken

音视频 5月月更

【刷题第13天】剑指 Offer 06. 从尾到头打印链表

白日梦

5月月更

druid 源码阅读(九)Druid removeAbandoned参数

爱晒太阳的大白

5月月更

亚马逊AWS特约评委揭秘FinClip黑客松获胜秘诀

Geek_99967b

hackathon 小程序开发

设计模式之学习命令模式

乌龟哥哥

5月月更

[模块一作业]

wuli洋

JavaWeb MyBatis

Emperor_LawD

mybatis javaWeb 5月月更

架构实战营 - 第 6 期 模块六课后作业

乐邦

「架构实战营」

FinClip SaaS 版本重磅上线,打开全行业技术普惠大门

Geek_99967b

SaaS 小程序容器 小程序开发

从Flutter浅谈跨平台移动开发框架

Geek_99967b

flutter 移动开发 小程序开发

Docker下Java文件上传服务三部曲之一:准备环境

程序员欣宸

Java Docker 5月月更

贝叶斯网络

5月月更

[ kitex 源码解读 ] 限流

baiyutang

Go 微服务 云原生 5月月更 kitex

Java Optional 初始为空

HoneyMoose

Druid 连接池源码阅读 08

石小天

架构实战营 7 期「模块一」为何架构设计能力难以提升

Steve_bot

Nacos源码系列—订阅机制的前因后果(下)

牧小农

源码 nacos

微信业务架构图和学生管理系统架构设计

Geek_7a789a

在FinClip Hackathon中夺冠是一种什么样的体验?

Geek_99967b

hackathon 小程序开发

架构实战营模块 1 作业

Naoki

架构实战营

Spring Boot 输出 Web 请求响应报文

TRAMP

Spring Boot

【C 语言】指针 Four 之[" * & 的应用"、通过指针交换变量值、指针变量的说明、 指针类型的意义(1)、指针类型的意义(2)]

謓泽

5月月更

在 Amazon EMR 上运行带有多种 GPU 实例类型的深度学习框架_其他_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章