GMTC全球大前端技术大会(北京站)门票9折特惠截至本周五,点击立减¥480 了解详情
写点什么

EC2 P3dn GPU,加快机器学习速度并下调 P3 实例价格

2019 年 10 月 14 日

EC2 P3dn GPU,加快机器学习速度并下调 P3 实例价格

去年底我给大家介绍了 Amazon EC2 P3 实例,此外还探讨了一下 Tensor Core 的概念。Tensor Core 是一种面向大型深层神经网络的专业化机器学习训练和推理加速计算单元。我们的客户喜爱 P3 实例,并使用此实例来运行广泛的机器学习和高性能计算 (HPC) 工作负载。例如,fast.ai 创下了深度学习的速度纪录,利用 100 万张图片完成了 ResNet-50 深度学习模型的训练,费用仅 40 USD。


提升上限

今天我们新推出 p3dn.24xlarge 实例,进一步提升 P3 实例的上限,此实例的 GPU 内存为 p3.16xlarge 实例的 2 倍,vCPU 数量是后者的 1.5 倍。此实例配备 100 Gbps 网络带宽(最高可达老款 P3 实例的 4 倍)、本地 NVMe 存储、含 32 GB GPU 内存的最新型号 NVIDIA V100 Tensor Core GPU、用于加快 GPU 间通信的 NVIDIA NVLink、AWS 定制的 Intel® Xeon® 可扩展 (Skylake) 处理器(全内核睿频稳定频率 3.1 GHz),所有配置都依托 AWS Nitro 系统构建。规格如下:4


型号NVIDIA V100 Tensor Core GPUGPU内存NVIDIA NVLinkvCPU 数量主内存本地存储网络带宽EBS 优化带宽
p3dn.24xlarge8256 GB300 GB/s96768 GiB2 x 900 GB NVMe SSD100 Gbps14 Gbps


如果您要使用 MXNet、TensorFlow、PyTorch 或 Keras 进行大规模的训练运行,请不要忘记 Amazon Deep Learning AMI 中包含的 Horovod 分布式训练框架。您还应在 AWS Marketplace 中看看新的 NVIDIA 人工智能软件容器;这些容器已经为配备 V100 GPU 的 P3 实例进行优化。


p3dn.24xlarge 实例的总 GPU 内存高达 256 GB(是当前最大型号 P3 实例的两倍),可让您探索更大、更复杂的深度学习算法。您能够以比以往更快的速度轮换和扩展训练图像,同时发挥 Intel AVX-512 指令集和其他先进的 Skylake 功能的优势。您可以使用 NVLink 和 NVLink Collective Communications Library (NCCL),从而让您的 GPU 代码跨多个 GPU 和/或实例扩展。借助 NCCL,您还可以在置放组内使用的实例之间充分利用可用的 100 Gbps 网络带宽。


除非常适合分布式机器学习训练和图像分类作业外,此类实例也可为您的高性能计算 (HPC) 作业提供强大助力。您可以进行 3D 图像渲染、实时视频转码、金融风险建模等作业。


您可以使用包含 ENA、NVMe 和 NVIDIA 驱动程序的现有 AMI。您需要升级到最新版的 ENA 驱动程序才能获得 100 Gbps 网络带宽;如果您使用 Deep Learning AMI,请一定要使用为 AVX-512 优化的最新版本。


现已推出

p3dn.24xlarge 实例现已在美国东部(弗吉尼亚北部)和美国西部(俄勒冈)区域推出,您可以立即以按需实例、Spot 实例和预留实例形式使用这些实例。


让利 — P3 实例降价

在今天发布新产品的同时,我们还下调了现有 P3 实例的价格。下列价格从 2018 年 12 月 6 日起生效:


  • 亚太地区(东京)区域的所有价格(按需实例和预留实例)和实例型号降价 20%。

  • 亚太地区(悉尼)、亚太地区(新加坡)和亚太地区(首尔)区域的所有价格(按需实例和预留实例)和实例型号降价 15%。

  • 除亚太地区(东京)、亚太地区(悉尼)、亚太地区(新加坡)和亚太地区(首尔)外,所有区域所有实例型号的三年承诺期标准预留实例降价 15%。

  • 上述降价幅度适用于运行 Linux 的实例;运行 Microsoft Windows 和其他操作系统的实例降价幅度略低。


以上降价将有利于进一步提高您的机器学习训练和推理的经济性,是为了实现我们让每个开发人员都可进行机器学习的目标而作出的重要举措。


作者介绍:


Jeff Barr


AWS 首席布道师; 2004 年开始发布博客,此后便笔耕不辍。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/new-ec2-p3dn-gpu-instances-with-100-gbps-networking-local-nvme-storage-for-faster-machine-learning-p3-price-reduction/


2019 年 10 月 14 日 10:45239
用户头像

发布了 1265 篇内容, 共 34.9 次阅读, 收获喜欢 35 次。

关注

欲了解 AWS 的更多信息,请访问【AWS 技术专区】

评论

发布
暂无评论
发现更多内容

计算机网络基础

roadup

TCP 网络 HTTP 计算机 HTTP3.0

跪了!Alibaba内部出品贼火的Java面试手册,全面对标蚂蚁金服、头条、拼多多等

Java架构之路

Java 程序员 架构 面试 编程语言

不交“人脉”交朋友:新荣耀的底气与新机

脑极体

redis中的一致性hash

原来不悔

redis 一致性hash

SpringBoot太强了、ShardingSphere上榜

云流

spring 编程 框架

两年Java开发经验,我凭借这份349页的《阿里Java面试通关手册》成功拿到字节跳动Offer。

Java成神之路

Java 程序员 架构 面试 编程语言

跨界

张老蔫

28天写作

前端性能优化

roadup

前端工程 性能调优

卧槽,牛皮了!某程序员苦刷这两份算法PDF47天,四面字节斩获心仪大厂offer!

Java成神之路

Java 程序员 架构 面试 编程语言

智慧社区安防建设的功能,智慧社区建设方案

135深圳3055源中瑞8032

理财之我见

三石

理财 28天写作

巧合?达摩院2021十大科技是十九世纪那场幻想的升级版?

Java架构师迁哥

架构师训练营第七周作业

zamkai

精选算法面试-队列

李孟

算法 队列 28天写作

数智化浪潮之中,传统企业如何抓住转型机遇?

京东科技开发者

DevOps

某Javva程序员金秋9月靠这份文档涨薪10K,你把这份Java进阶文档吃透涨薪超简单!

Java成神之路

Java 程序员 架构 面试 编程语言

字节跳动大佬整理的这份《算法中文手册》火了,不少小伙伴靠这份指南成功掌握了算法的核心技能,成功拿到了 BATJ等大厂offer。

Java成神之路

Java 程序员 架构 面试 编程语言

化妆品溯源系统开发,区块链防伪溯源

135深圳3055源中瑞8032

第1周架构方法总结

Richard

UML 需求分析 概要设计 软件架构设计 详细设计

音频特征提取方法和工具汇总

行者AI

音视频

python 输入输出

赵开忠

Python 28天写作

12月阿里蚂蚁金服四面(已拿offer)Java技术面经总结:项目+源码+jvm调优+MySQL

云流

Java 学习 编程 程序员 面试

助力金三银四跳槽季,《Java面试突击版》第四版强势来袭

Java架构之路

Java 程序员 架构 面试 编程语言

凭借这份Java超硬核面试 “备战” 手册!我刚面试完字节跳动、阿里、华为、小米等后端岗位

Java架构之路

Java 程序员 架构 面试 编程语言

新的方式-谷歌浏览器插件的使用【天猫超市抢购飞天茅台】

谙忆

助力ARM生态 —Dragonwell新增aarch64支持

阿里云基础软件团队

探索 React 合成事件

pingan8787

前端 React 28天写作

博弈论 - 海盗分金

石云升

博弈论 28天写作 海盗分金

DAPP智能合约交易系统开发、DAPP系统开发的详细解释

W13902449729

DAPP智能合约交易系统开发 DAPP系统开发

花火交易所系统开发、雷达模式系统搭建开发

W13902449729

花火交易所系统开发 雷达模式系统搭建开发

重学JS | 改变函数上下文的3种方式

梁龙先森

前端 编程语言 28天写作

EC2 P3dn GPU,加快机器学习速度并下调 P3 实例价格-InfoQ