编者注:这是分为多个部分的系列文章中的第一篇,该系列文章旨在帮助您最充分地利用您的 Compute Engine VM。
您有没有想过是否为您的工作负载使用了尽可能最佳的云计算资源?在本文中,我们将详细探讨不同的 Compute Engine 虚拟机系列并提供针对选择 Compute Engine 虚拟机系列时需考虑的因素的相关指南。无论您是云计算领域的新人还是初涉 Google Cloud,这些建议都能帮助您优化 Compute Engine 使用。
对于要基于 Google Cloud 运行虚拟机 (VM) 的组织,Compute Engine 提供多个虚拟机系列以供选择,每个系列适用于特定的工作负载和应用。在各虚拟机系列中,有一组提供了规范性处理器和内存配置组合的虚拟机类型。
● 通用 —— 这些虚拟机在价格和性能之间实现了较好平衡,适用于大部分的工作负载,包括数据库、开发和测试环境、Web 应用以及手游。
● 计算优化型 —— 这些虚拟机提供 Compute Engine 中最高的每核性能,并且针对计算密集型工作负载进行优化,例如,高性能计算 (HPC)、游戏服务器以及延迟敏感型 API 服务。
● 内存优化型 —— 这些虚拟机提供我们 VM 系列中的最高内存配置,单一实例高达 12 TB。它们适用于内存密集型工作负载,例如,类似 SAP HANA 的大型内存数据库以及内存数据分析工作负载。
● Accelerator(加速器)优化型 —— 这些虚拟机基于 NVIDIA Ampere A100 Tensor Core GPU。单一 VM 支持多达 16 个 GPU,这些虚拟机适用于要求较高的工作负载,例如,支持 CUDA 的机器学习 (ML) 训练和推理以及 HPC。
通用系列
这些虚拟机在价格和性能之间实现了较好平衡,适用于各种常规工作负载。您可以从四种通用虚拟机类型中进行选择:
● E2 提供 Google Cloud 中最低的总拥有成本 (TCO),与第一代 N1 相比,节省高达 31%。E2 VM 基于各种 CPU 平台(Intel 和 AMD)运行,每个节点提供高达 32 个 vCPU 和 128GB 内存。E2 虚拟机类型还利用动态资源管理,这为将成本节省视为优先要务的工作负载提供了许多经济优势。
● N2 为 Compute Engine 的通用系列引入了第二代 Intel Xeon 可扩展处理器(Cascade Lake)。与第一代 N1 虚拟机相比,对于许多工作负载,N2 提供超过 20% 的性价比提升,并且每个 vCPU 支持最高超过 25% 的内存。
● N2D VM 基于最新的第二代 AMD EPYC (Rome) CPU,并且支持任何通用 Compute Engine VM 中最高的核数和内存。N2D VM 旨在为您提供与 N2 VM 相同的特性,包括本地 SSD、定制虚拟机类型以及通过实时迁移实现透明维护。
● N1 是 第一代通用 VM,提供多达 96 个 vCPU 和 624GB 内存。对于大部分的用例,我们推荐选择上述第二代通用虚拟机类型中的一种。对于 GPU 工作负载,N1 支持各种 NVIDIA GPU(请参见此表了解有关各个区域支持的特定 GPU 的详细信息)。
为了确保灵活性,通用虚拟机均按预先定义(具有预设数量的 vCPU 和内存)提供,或者可被配置为定制虚拟机类型。定制虚拟机类型允许您独立配置 CPU 和内存,针对您的应用找到正确的平衡点,从而让您按需付费。
让我们更详细地了解一下通用虚拟机系列:
E2 虚拟机类型
E2 VM 利用针对 Google 自己的服务开发的动态资源管理技术,这些技术旨在更好地利用硬件资源、促进成本降低并且为您实现节省。如果您有此类工作负载 —— Web 服务、小到中型数据库以及在小规格实例上运行良好且不需要 GPU 或者本地 SSD 的应用程序开发和测试环境,可考虑将其迁移至 E2。
无论是比较按需使用 TCO 还是利用承诺使用折扣,在一系列基准指标方面,E2 VM 均可提供高达 31% 的性价比提升(如下图所示)。E2 定价已经包含持续使用折扣,E2 还有资格获得承诺使用折扣,对于三年承诺,额外节省高达 55%。
免责声明:结果基于 Google Cloud 的内部基准测试,对于所有实例类型,使用同等规模的 VM(16 个 vCPU)。
N2 虚拟机类型
N2 虚拟机以 2.8GHz 基频运行,支持 3.4GHz 持续全核加速,提供高达 80 个 vCPU 和 640GB 内存。这使它们适用于可从每核性能提升受益的许多通用工作负载,包括 Web 和应用程序服务器、企业应用程序、游戏服务器、内容和协作系统以及大部分的数据库。
无论您是运行业务关键型数据库还是交互式 Web 应用,N2 VM 都使您能够从 VM 获得约 30% 的性能提升,并且缩短您的许多计算进程,正如通过各种基准指标所表明的。此外,与上一代 Intel Advanced Vector Extensions 2 (Intel AVX2) 相比,每个时钟周期的 FLOPS 翻倍,Intel AVX-512 为要求最高的计算任务增强了性能和吞吐量。
使用 Intel 优化的 Tensorflow,利用第二代 Xeon 可扩展处理器中新的深度学习 (DL) 增强指令,对一个 Wide & Deep 模型进行 AI 推理,N2 实例比 N1 实例快 2.82 倍。新的 DL Boost 指令扩展了 Intel AVX-512 指令集,在上一代处理器中需要三条指令完成的工作现在只需要一条指令。
免责声明:结果基于 Google Cloud 的内部基准测试,对于所有实例类型,使用同等规模的 VM(16 个 vCPU)。
N2D 虚拟机类型
N2D VM 提供针对数据管理工作负载的性能改进,充分利用 AMD 更高的内存带宽和更高的每系统吞吐量(适用于更大的 VM 选择),多达 224 个 vCPU,使它们成为 Google Compute Engine 中最大的通用 VM。与类似的 N 系列实例相比,N2D VM 可提供高达 13% 的节省。
N2D 虚拟机类型适用于 Web 应用、数据库、工作负载和视频流。N2D VM 还可为会从更高内存带宽受益的许多高性能计算工作负载提供性能改进。
如下图所示,针对会从 N2D 改进的内存带宽获益的基准,许多工作负载类型的性能提高 20-30%,最高提升 2.5 倍,例如,STREAM,使它们非常适合内存带宽要求高的应用。
免责声明:结果基于 Google Cloud 的内部基准测试,对于所有实例类型,使用同等规模的 VM(16 个 vCPU)。
N2 和 N2D VM 提供高达 20% 的持续使用折扣,并且还有资格获得承诺使用折扣,对于三年承诺,额外节省高达 55%。
计算优化型 (C2) 系列
计算优化型虚拟机侧重于实现最高的每核性能和最一致的性能,以支持实时应用性能需求。基于第二代 Intel Xeon 可扩展处理器 (Cascade Lake),并且提供高达 3.4GHz 的持续全核加速,这些 VM 为计算密集型工作负载(例如,HPC、游戏(AAA 游戏服务器)以及高性能 Web 服务)而优化。
与上一代 N1 相比,计算优化型虚拟机可提供超过 40% 的性能提升,并且为延迟敏感型工作负载提供更高的每线程性能和隔离。计算优化型 VM 具有不同的规格 —— 从 4 个到 60 个 vCPU,并提供最高 240 GB 的内存。对于需要更高存储性能的应用,您可以选择为这些 VM 附加高达 3TB 的本地存储。
如下图所示,对于大部分交互式应用,计算优化型 VM 可实现最高 40% 的性能提升,无论是针对每秒查询数进行优化还是针对您地图路由算法的吞吐量进行优化。对于许多 HPC 应用,基准(例如,OpenFOAM)表明平均运行时间可减少最多 4 倍。
免责声明:结果基于 Google Cloud 的内部基准测试,对于所有实例类型,使用同等规模的 VM(16 个 vCPU)。
C2 VM 提供高达 20% 的持续使用折扣,并且还有资格获得承诺使用折扣,对于三年承诺,额外节省高达 60%。
内存优化型(M1、M2)系列
内存优化型虚拟机类型提供我们的 VM 系列中最高的内存。VM 的内存大小从 1TB 至 12TB 不等,并且支持最多 416 个 vCPU,这些 VM 提供任何 Compute Engine VM 产品中最多的计算和内存资源。它们适用于大型内存数据库(例如,SAP HANA)以及内存数据分析工作负载。M1 VM 提供最多 4TB 内存,M2 VM 支持最多 12TB 内存。
M1 和 M2 VM 类型还提供 Compute Engine 中最低的每 GB 内存成本,使它们成为以较低的计算资源要求利用更高的内存配置的工作负载的出色选择。对于工作负载(例如,Microsoft SQL Server 以及类似数据库),这些 VM 允许您在利用更大的内存配置时只提供所需的计算资源。
随着为 Compute Engine 的内存优化型虚拟机类型 (M2) 添加 6TB 和 12TB VM,SAP 客户现在能够基于 Google Cloud 运行其最大的 SAP HANA 数据库。这些 VM 是一个公共云提供商提供的最大的 SAP 认证 VM。
M2 虚拟机类型不仅适用于要求最高的业务关键型数据库应用,而且还支持您最喜欢的 Google Cloud 功能。对于这些业务关键型数据库,正常运行时间对业务连续性至关重要。通过实时迁移,您可以保持系统正常运转,甚至在面临基础架构维护、升级、安全补丁等情况时依然如此。Google Cloud 灵活的承诺使用折扣让您能够将不断增长的数据库从 1TB 至 4TB 实例迁移至新的 6TB VM,同时利用您的现有内存优化承诺。
M1 和 M2 VM 提供高达 30% 的持续使用折扣,并且还有资格获得承诺使用折扣,对于三年承诺,额外节省最高可超过 60%。
Accelerator(加速器)优化 (C2) 系列
加速器优化系列是最新版的 Compute Engine 产品组合。A2 目前通过我们的 alpha 计划可用,预计今年晚些时候公开提供。A2 基于最新的 NVIDIA Ampere A100 GPU,适用于当今要求最高的应用,例如,机器学习和 HPC。A2 VM 是公共云中首个基于 NVIDIA Ampere A100 Tensor Core GPU 的产品。
与上一代 GPU 相比,每个 A100 GPU 提供高达 20 倍的计算性能,提供 40GB 的高性能 HBM2 GPU 内存。A2 使用 NVIDIA 的 HGX 系统以提供高达 600 GB/s 的高速 NVLink GPU-to-GPU 带宽。A2 虚拟机采用最多 96 个 Intel Cascade Lake vCPU、支持可为需要更快地向 GPU 传输数据的工作负载选配的本地 SSD 以及高达 100Gbps 的联网速度。A2 VM 还提供针对底层 GPU 服务器平台架构的完全透明性,支持先进的性能调整。
对于要求非常高的计算工作负载,A2 有 a2-megagpu-16g 虚拟机类型,采用 16 个 A100 GPU,提供总共 640GB 的 GPU 内存,当使用新的稀疏 (sparsity) 功能时,在单一 VM 中支持高达 10 petaflops 的 FP16 或者 20 petaOps 的 int8 CUDA 计算能力。
让计算发挥最大价值
选择正确的 VM 系列是促进提升您的工作负载效率的第一步。在接下来的几周,我们将与您分享其他有用信息,包括对我们智能计算产品的概述、OS 故障排除和优化、许可以及数据保护,以帮助您优化您的 Compute Engine 资源。
评论