谷歌宣布可在 Kubernetes 引擎(GKE)中普遍使用 GPU。与最近发布的 1.10 正式版 GKE 一起,用户可以将机器学习(ML)工作负载放在上面,并利用 GPU 的强大处理能力。
谷歌为 GKE 提供了几款 GPU——快速版的 NVIDIA Tesla V100、Tesla P100 和入门级的 Tesla K80。这些 GPU 中的每一个都可作为可抢占式 GPU 使用,让用户能够以较低的成本利用谷歌云的 GPU。此外,根据公告博文所述,有了这些可用的 GPU,用户可以从一些独特的功能中受益:
-
节点池让现有群集在需要时使用 GPU。
-
当 Pod 请求 GPU 时, Cluster Autoscaler 会自动创建带有 GPU 的节点,而当活动 Pod 不再使用 GPU 时,它会将节点缩减至零。
-
侵蚀(Taint)和耐受(Toleration)技术确保只有请求 GPU 的 Pod 会被安排带有 GPU 的节点,并防止不需要 GPU 的 Pod 运行在上面。
-
资源配额让管理员可以在多个用户或团队共享的大型群集中根据命名空间来限制资源消耗。
此外,谷歌还提供了通过 GCP 控制台观察 GPU 性能的功能。
自从 GKE 上的 GPU 开放测试版以来,核心小时数增加了十倍,表明 Kubernetes 在 GCP 上的使用量增加了。但是,谷歌并不是唯一一个看到使用量增加的人。此外,微软看到他们的 Azure Kubernetes 服务(AKS)的使用量也有所增加,该服务最近才开始普遍可用。微软 Azure 容器项目经理 Gabe Monroy 在今年 5 月初的一篇博文中表示:
随着 Kubernetes 在全球范围内的普及,毫无疑问,Kubernetes 在 Azure 上的使用量比去年增长了 10 倍以上。
另一家重要的公有云提供商亚马逊为 Kubernetes(EKS)提供了弹性容器服务,该服务自 6 月中旬开始提供。此外,该提供商在 Kubernetes 的使用方面处于领先地位,因为最近的调查显示,57%运营Kubernetes 的公司选择了AWS。
用户可以通过价值300 美元的免费试用机会来体验Kubernetes 引擎中的GPU。此外,有关GPU 的价格详情,请参阅定价页面。
查看英文原文: GPUs on Google’s Kubernetes Engine Are Now Generally Available
评论