写点什么

Google 为他们的客户引入了 Preemptible GPU

  • 2018-02-21
  • 本文字数:1452 字

    阅读完需:约 5 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Google 宣布在他们的云平台上,释放为 Preemptible 虚拟机(Virtual Machine)附加图像处理器(Graphical Processing Unit,GPU)的 beta 发布版本。Google 云平台(Google Cloud Platform)的客户现在能够将 NVIDIA K80 和 NVIDIA P100 GPU 附加到 Preemptible VM 上,每个 GPU 每小时的价格分别是 0.22 和 0.73 美分,这要比 on-demand 实例上 GPU 的价格便宜 50%。这个发布版本能够让 Google 的客户在计算密集型的任务上有了更多的选择,这样他们能够在更细的粒度上进行高吞吐的批处理计算、机器学习以及科学和技术工作负载。

GCP 用户能够创建和运行 Preemptible VM 实例,它要比标准的 on-demand 实例成本低得多。但是,Google Compute Engine 会在 30 秒的警告之后,终止(preempt)这些实例。这些实例最多能使用 24 小时。GCP 用户如果具有容错的工作负载并且不需要专门的实例,就成本而言,Preemptible 实例是很合适的选择。另外,关联到 Preemptible VM 上的 GPU 默认都是 preemptible 的,因此成本会更低。

Alex Hickey 是 CIO Dive 站点的编辑,在最新的简报中,他提供了一些利用 Google Preemptiple GPU 的观点:

对于一般的公司来说,构建或运行 AI 系统并不便宜。专家们的薪水已经达到了六位数甚至更高,AI 的预算也变得很难分配。计算处理的硬件资源一般都是外包的,以便于节省成本。GPU 比专门的硬件在速度和处理时间上表现更好,而专门的硬件往往很快就会积累可观的前期和维护成本。可用工具,包括用于处理的硬件,是 AI 和 ML 实现普及的重要因素。据统计,40% 的公司具有 AI 实验室或实验性地应用,但是只有大约 20% 的企业实现了 AI 的规模化部署或核心业务功能的部署。不过,凭借更加可负担的 GPU,更多的公司能够在预算和策略方面找到空间,实现 POC 和测试用例的落地。

典型的 Preemptible VM 可以通过在 gcloud 命令行的实例创建命令上附加_–preemptible_ 参数或者在使用 REST API 时,将scheduling.preemptible属性设置为true进行创建。另外,用户还可以在 Google Cloud Platform Console 上将 Preemptibility 设置为 _“On”_,然后像往常一样为其关联 GPU。

图片来源: https://cloudplatform.googleblog.com/2018/01/introducing-preemptible-gpus-50-off.html

除此之外,用户如果需要更强的可扩展性,还可以通过创建由preemptible 实例所组成的托管实例组实现GPU 动态池的功能。需要注意的是,在创建组之前,要指定实例模板的preemptible 选项。这种方法所能带来的好处是如果preemptible 实例有足够的处理能力的话,在重新preempt 的时候,它们能够自动重建。当前,preemptible GPU 的特性只能在US-central1 region 中使用。Preemptible VM 的完整文档可以通过 Compute Engine 文档进行访问。

Google、Amazon 和 Microsoft 都提供了这样低价的计算资源,形式包括 Preemptible VM、spot 或 reserved VM 实例。它们的差异在于实例使用的灵活性。Amazon EC2 Spot 实例兼容 Preemptible VM。但是,客户不能为它们添加 GPU。AWS 和 Azure 所提供的 reserved 实例成本优势不明显,不过它们有一年或三年的期限。根据用例和所需的可用性不同,用户可以选择存活时间更短的 Preemptible VM 或 AWS spot 实例,也可以选择生命周期更可扩展的 Azure 或 AWS Reserved 实例。它们在成本上都比云平台的 on-demand 实例更廉价。

查看英文原文 Google Introduces Low-Priced Preemptible GPUs for Their Customers

2018-02-21 18:001872

评论

发布
暂无评论
发现更多内容

中昊芯英携全自研TPU AI芯片亮相2024高交会

科技热闻

Linux 数据处理三剑客:提升工作效率的必备工具

测试人

软件测试

SQL 审核在 CloudQuery 的四大场景应用

BinTools图尔兹

深入Linux性能与统计命令:优化、监控与管理的首选工具

测试人

软件测试

我手搓了个“自动生成标书”的开源大模型工具

白鲸开源

人工智能 机器学习 GAN 大模型

虚拟化技术:新能源汽车空调控制系统的智能新突破

DevOps和数字孪生

汽车

下周二!白鲸开源WhaleStudio将亮相AWS数据合作伙伴荟萃周,探讨DataOps新质生产力

白鲸开源

AWS DataOps 数据集成 数据调度 白鲸开源

第一!中国专属云服务市场,荣誉+1!

天翼云开发者社区

云计算 云服务 天翼云

KubeEdge 新版本5大特性解读:更完备的节点设备能力,全新的Dashboard体验

华为云开发者联盟

开源 容器 云原生 kubeedge

创新实践:基于边缘智能+扣子的智能轮椅 AIoT 解决方案

火山引擎边缘云

物联网, 智能IoT边缘服务 大模型 AI 基础设施 边缘智能

企业为什么需要国际专线网络?

Ogcloud

SD-WAN国际专线 国际专线 国际网络专线 国际互联网专线

【JIT/极态云】技术文档--Excel模板

武汉万云网络科技有限公司

SaaS,PaaS,IaaS是什么意思?一文教你弄懂!

积木链小链

IaaS PaaS SaaS 平台

【论文速读】| 注意力是实现基于大语言模型的代码漏洞定位的关键

云起无垠

10月回顾 | Apache DolphinScheduler社区动态与进展一览

白鲸开源

大数据 开源 Apache DolphinScheduler 工作流任务调度

这个 AI 懂 Vue 吗?

Trae

程序员 AI 智能 智能云

云行| 金陵古都焕发数智活力,天翼云为南京创新发展注入新动能!

天翼云开发者社区

云计算 云服务 天翼云

Hack VC:模块化是个错误吗?以数据为依据审视以太坊的这一战略

TechubNews

10月回顾 | Apache SeaTunnel社区动态与进展一览

白鲸开源

大数据 开源 数据同步 数据集成 Apache SeaTunnel

架构图怎么制作?盘点10个优秀的架构图模板!

职场工具箱

职场 在线白板 架构图 绘图软件 组织架构图

大模型应用开发初探 : 通用函数调用Planner

不在线第一只蜗牛

大模型

淘宝/天猫商品描述API返回值深度解析与实战应用:以taobao.item_get_desc为例

代码忍者

API 接口 pinduoduo API

适合企业的十款文档管理系统厂商分析

易成研发中心

Google为他们的客户引入了Preemptible GPU_语言 & 开发_Steef-Jan Wiggers_InfoQ精选文章