开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

配有 NVIDIA T4 Tensor Core GPU 的 EC2 实例 (G4)

  • 2019-09-26
  • 本文字数:1446 字

    阅读完需:约 5 分钟

配有 NVIDIA T4 Tensor Core GPU 的 EC2 实例 (G4)

我今年早些时候承诺的由 NVIDIA 提供支持的 G4 实例现已推出,现在,您可以在 AWS 的八个区域开始使用六种大小的实例! 您可以将其用于机器学习训练和推理、视频转码、游戏流和远程图形工作站应用程序。


这些实例配备多达四个 NVIDIA T4 Tensor Core GPU,每个 GPU 配有 320 个 Turing Tensor 核心、2560 个 CUDA 核心和 16GB 内存。该 T4 GPU 是机器学习推理、计算机视觉、视频处理以及实时语音和自然语言处理的理想选择。该 T4 GPU 还配备 RT 核心,可提供由硬件驱动的高效光线跟踪。NVIDIA Quadro 虚拟工作站 (Quadro vWS) 可在 AWS Marketplace 中获取。该工作站支持实时光线追踪渲染,并可以加快在媒体和娱乐、建筑以及石油和天然气应用中常见的创造性工作流程。


G4 实例构建于 AWS Nitro 系统,由 AWS 定制的第二代 Intel® Xeon® 可扩展处理器 (Cascade Lake) 提供支持,该处理器配有多达 64 个 vCPU。Nitro 本地 NVMe 存储构建数据块可提供对高达 1.8TB 的快速本地 NVMe 存储的直接访问权限。Nitro 网络构建数据块可提供高速 ENA 网络。Intel AVX512-Deep Learning Boost 功能利用一组新的矢量神经网络指令(简写为 VNNI)扩展了 AVX-512。这些指令加速了多种推理算法内循环中的低精度乘法与加法运算。


实例大小如下:


实例名称NVIDIA T4 Tensor Core GPUvCPURAM本地存储EBS 带宽网络带宽
g4dn.xlarge1416GiB1 x 125GB最高 3.5Gbps最高 25Gbps
g4dn.2xlarge1832GiB1 x 225GB最高 3.5Gbps最高 25Gbps
g4dn.4xlarge11664GiB1 x 225GB最高 3.5Gbps最高 25Gbps
g4dn.8xlarge132128GiB1 x 900GB7Gbps50Gbps
g4dn.12xlarge448192GiB1 x 900GB7Gbps50Gbps
g4dn.16xlarge164256GiB1 x 900GB7Gbps50Gbps


我们还在研究一个裸机实例,该实例将在未来几个月内推出:


实例名称NVIDIA T4 Tensor Core GPUvCPURAM本地存储EBS 带宽网络带宽
g4dn.metal896384GiB2 x 900GB14Gbps100Gbps


如果要在 G4 实例上运行显卡工作负载,请确保使用最新版本的 NVIDIA AMI(可在 AWS Marketplace 中获得),以便您可以访问必需的 GRID 和显卡驱动程序,以及包含最新优化和补丁的 NVIDIA Quadro 工作站映像。您可以在以下位置找到所需内容:


  • NVIDIA 游戏 – Windows Server 2016

  • NVIDIA 游戏 – Windows Server 2019

  • NVIDIA 游戏 – Ubuntu 18.04

  • 最新版本的 AWS Deep Learning AMI 支持 G4 实例。开发出该 AMI 的团队对 g3.16xlarge 实例与 g4dn.12xlarge 实例进行了基准测试,并与我共享结果。以下是部分重点内容:

  • MxNet 推理(resnet50v2,无需使用 MMS 即可进行正向传递)– 速度为 2.03 倍。

  • MxNet 推理(使用 MMS)– 速度为 1.45 倍。

  • MxNet 训练(resnet50_v1b,1 个 GPU)– 速度为 2.19 倍。

  • Tensorflow 推理(resnet50v1.5,正向传递)– 速度为 2.00 倍。

  • 利用 Tensorflow 服务进行 Tensorflow 推理 (resnet50v2) – 速度为 1.72 倍。

  • Tensorflow 训练 (resnet50_v1.5) – 速度为 2.00 倍。

  • 基准测试使用 FP32 数值精度;如果您使用混合精度 (FP16) 或低精度 (INT8),则可以期待更大幅度的提升。


现在,您可以在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、美国西部(加利福尼亚北部)、欧洲(法兰克福)、欧洲(爱尔兰)、欧洲(伦敦)、亚太地区(首尔)和亚太地区(东京)区域启动 G4 实例。我们还致力于让这些实例可在 Amazon SageMaker 和 Amazon EKS 集群中使用。


本文转载自 AWS 技术博客。


原文链接:


https://amazonaws-china.com/cn/blogs/china/now-available-ec2-instances-g4-with-nvidia-t4-tensor-core-gpus/


2019-09-26 16:441564
用户头像

发布了 1855 篇内容, 共 123.7 次阅读, 收获喜欢 81 次。

关注

评论

发布
暂无评论
发现更多内容

Amazon Bedrock 模型微调实践(一):微调基础篇

亚马逊云科技 (Amazon Web Services)

生成式AI

2款软件一键替换PPT背景,告别繁琐,你也可以!

彭宏豪95

人工智能 高效工作 PPT AIGC AI生成PPT

借助大语言模型快速升级你的 Java 应用程序

亚马逊云科技 (Amazon Web Services)

java

如何构建一个大模型?看完你就知道了!

博文视点Broadview

交互式 PDF Q&A:一种检索-增强生成方法

哦豁完蛋了

AI 大底座 PDF 编辑器和注释器

NFTScan | 07.22~07.28 NFT 市场热点汇总

NFT Research

NFT\ NFTScan

MobPush高效实现全球多时区定时定期推送,做中国开发者出海的坚实助力者

MobTech袤博科技

开发者 产品动态

Git的存储原理

快乐非自愿限量之名

git

低代码应用版本管理能力探讨

鲸品堂

低代码 版本管理工具 版本管理 企业号2024年7月PK榜

人工智能|利用人工智能自动找bug

霍格沃兹测试开发学社

Redis 消息队列 List、Streams

EquatorCoco

redis List 消息队列 list数据库

ActionDB 扩展 OB GIS 能力:新增 ST_PointN 函数

爱可生开源社区

GIS oceanbase actiondb

ShareSDK第三方平台使用指南——QQ

MobTech袤博科技

开发者 产品动态

基于Drone实现CI/CD【0到1架构系列】

不在线第一只蜗牛

Java 架构 CI/CD

搭建自动化 Web 页面性能检测系统 —— 部署篇

EquatorCoco

运维 前端 自动化 Web

taobao.item_get_desc API返回值中的商品标题与描述深度挖掘

技术冰糖葫芦

API 文档 API 测试 API 优先 API Hub

Web3 游戏周报(7.21 - 7.27)

Footprint Analytics

链游

开发斗鱼、虎牙游戏直播平台所需多少钱费用

软件开发-梦幻运营部

蚌埠住了!我把斯坦福大牛的Web安全开发指南给分享出来了!

我再BUG界嘎嘎乱杀

网络安全 安全 WEB安全 网安

让 AI 无处不在,英特尔揭秘 AI 与边缘技术结合的未来画卷

E科讯

“新质互联网”解读:新在哪里,利在何处?

Alter

开启智能化新纪元,TDengine 用户大会圆满落地:汽车、能源、烟草、电力行业洞见

TDengine

实战基于terraform-compliance实现IaC安全

我再BUG界嘎嘎乱杀

云计算 网络安全 安全 自动化运维

【YashanDB知识库】如何使用yasldr导入lob类型?

YashanDB

yashandb 崖山数据库 崖山DB

医疗器械行业数智化创新实践:数据可视化与 AI+ 是实现高质量发展的关键

tapdata

安全人士可以从CrowdStrike事件中汲取的五点教训

我再BUG界嘎嘎乱杀

网络安全 安全 网安 CrowdStrike

智谱AI给你带来了新的观赛搭子 AI马凡舒央视频陪你熬夜看奥运

技术研究院

京东API接口解析:京东商品列表数据接口

tbapi

京东API 京东商品列表数据接口 京东商品数据采集 关键词搜索京东商品列表

RPA是什么?探讨RPA发展的最新趋势

八爪鱼采集器︱RPA机器人

RPA RPAxAI

利用 AI 增强 API 和微服务的云安全性

哦豁完蛋了

方法 AI Studio API 文档

【YashanDB知识库】如何远程连接、使用YashanDB?

YashanDB

yashandb 崖山数据库 崖山DB

配有 NVIDIA T4 Tensor Core GPU 的 EC2 实例 (G4)_语言 & 开发_亚马逊云科技 (Amazon Web Services)_InfoQ精选文章