微软宣布 Azure CycleCloud 正式可用,这标志着微软进入了高性能计算(HPC)市场。 Azure CycleCloud 是一种用于创建、管理、运维和优化 Azure 中任何规模 HPC 集群的工具,它适用于作为 IT 企业的 Azure 用户,支持他们为自身的客户创建安全且灵活的云高性能计算和大型计算(Big Compute)环境。此外,微软还宣布了对 NGC(NVIDIA GPU Cloud)的支持。
2017 年八月,微软从 CycleCloud 的创立者 Jason Stowe、其妻子及其他两人手里收购了该企业。其 Cycle 计算产品最初创立于 2005 年,它使用开源调度器 Condor 帮助企业实现高性能计算。CycleCloud 因支持云环境中大型计算的高速完成而荣膺多项荣誉。
此外,该企业还保持对使用云技术企业的市场观察,意在提供适用于这些企业的稳健架构。 James Stow 在 Bio.IT World 一篇文章中,对 CycleCloud 的正式可用做了如下声明:
自十多年前我们开创 CycleCloud 以来,单台服务器的计算能力就一直在呈指数级增长。这可部分归功于 FPGA 和 GPU 技术,而 Azure 为这些技术提供了最广泛的支持。
使用 CycleCloud,IT 管理者可以在 Azure 中快速地部署具有计算、存储、文件服务和应用能力的高性能集群。据发布声明介绍,CycleCloud 提供了基于角色的策略和管治特性,易于实现向需要的客户企业交付混合计算能力,同时也避免了发生成本失控问题。此后,终端用户可以完全依赖Azure CycleCloud 对他们的集群编排任务和数据工作流。要着手使用CycleCloud,客户可以通过下载该工具,或是通过使用一个 ARM 模板。
图片来源: https://azure.microsoft.com/en-us/blog/microsoft-azure-the-cloud-for-high-performance-computing/
Azure 中对 NGC(NVIDIA GPU Cloud)的支持将有助于客户加速 AI 计算,并可加速多种使用了 NVIDIA GPU 虚拟机上的 HPC 工作流。NVIDIA 提供一个可使用具有 35 个 GPU 加速容器的软件库,用于深度学习软件、HPC 应用、HPC 可视化工具,以及一系列来自 NGC 容器仓储的合作方应用。NVIDIA 在官方博客上介绍了 Azure 上对 NVIDIA GPU 的支持。据该博文介绍,客户可以通过下列实例运行使用了 NVIDIA GPU 的容器:
• NCv3(具有 1、2 或 4 个 NVIDIA Tesla V100 GPU);
• NCv2(具有 1、2 或 4 个 NVIDIA Tesla P100 GPU);
• ND(具有 1、2 或 4 个 NVIDIA Tesla P40 GPU)。同一个 NGC 容器即便类型不同,或是 GPU 数量不同,都可在各种 Azure 实例类型上工作。
Azure 市场(Marketplace)上还提供了用于深度学习和 HPC 的 NVIDIA GPU Cloud 镜像。
微软并非唯一一家云服务提供商。去年十月,AWS 就提供了具有 GPU 能力的 EC2 实例,支持多至 8 个 NVIDIA Tesla V100 GPU。这些实例设计用于处理一些计算密集型工作负载,从机器学习到基因组。除了微软和亚马逊这两家提供对 NVIDIA GPU 的支持,谷歌也提供了自己的芯片,支持客户运行使用了谷歌 TensorFlow 框架的机器学习工作负载。由此,三家主要云服务提供商都向高性能计算市场推出了自己的云服务产品。
查看英文原文: Microsoft Pushes New Azure Offerings into the High-Performance Computing Market
评论