写点什么

Amazon FSx for Lustre 更新:用于长期高性能工作负载的持久性存储

  • 2020-02-27
  • 本文字数:4388 字

    阅读完需:约 14 分钟

Amazon FSx for Lustre 更新:用于长期高性能工作负载的持久性存储

去年,我曾写过关于 Amazon FSx for Lustre 的博文,我在其中介绍了客户如何用它来创建兼容 POSIX 的 PB 级高并行文件系统,为数千个客户端同时提供服务,以亚毫秒级延迟驱动数百万次 IOPS(每秒的输入/输出操作)。


作为一项托管服务,Amazon FSx for Lustre 让您可以轻松地启动和运行世界上最热门的高性能文件系统。我们的客户将此服务用于需要速度的工作负载,包括机器学习、高性能计算 (HPC) 和金融建模。


现在,我们对 Amazon FSx for Lustre 进行了增强,使您能够创建具有三个性能级别的耐用、高可用性高性能文件系统,以及旨在为突增工作负载提供更好支持的新的第二代暂存文件系统。

最新更新

在深入了解今天的新闻前,我们先来看一看我们最近对该服务进行的几项更新:


数据存储库 API – 此次更新推出了一组 API,可使您将文件从 FSx 轻松导出至 S3,包括启动、监控和取消已更改文件到 S3 的传输的能力。要了解更多信息,请阅读在 Amazon FSx for Lustre 与 Amazon S3 之间移动数据的新增强功能


SageMaker 集成 – 经过此次更新,您可以将 Amazon FSx for Lustre 文件系统上存储的数据用作 Amazon SageMaker 模型的训练数据。您可以使用海量数据来训练您的模型,无需先将数据移动至 S3。


ParallelCluster 集成 – 经过此次更新,您可以在使用 AWS ParallelCluster 创建 HPC 集群时创建 Amazon FSx for Lustre 文件系统,并且也可以选择使用现有的文件系统。


EKS 集成 – 此次更新让您可以使用新的 AWS FSx 容器存储接口 (CSI) 驱动程序从您的 Amazon EKS 集群访问 Amazon FSx for Lustre 文件系统。


更小的文件系统大小 – 除了原来的 3.6 TiB 之外,经过此次更新,您还可以创建 1.2 TiB 和 2.4 TiB Lustre 文件系统。


CloudFormation 支持 – 此次更新让您可以使用 AWS CloudFormation 模板来部署使用 Amazon FSx for Lustre 文件系统的堆栈。要了解更多信息,请查看 AWS::FSx::FileSystem LustreConfiguration


SOC 合规性 – 此次更新宣布,Amazon FSx for Lustre 现在可以与受服务组织控制 (SOC) 约束的应用程序结合使用。要了解此合规性计划和其他合规性计划的更多信息,请查看按合规性计划划分的范围内 AWS 服务


Amazon Linux 支持 – 此次更新允许运行 Amazon Linux 或 Amazon Linux 2 的 EC2 实例访问 Amazon FSx for Lustre 文件系统。


客户端存储库 – 您现在可以使用兼容最新版本 Ubuntu、Red Hat Enterprise Linux 和 CentOS 的 Lustre 客户端。要了解更多信息,请阅读安装 Lustre 客户端

新的持久性和暂存部署选项

最初,我们推出此服务是为了对数据进行高速短期处理,而且,在今天以前,FSx for Lustre 都在提供适合进行临时存储和短期数据处理的暂存文件系统 – 如果文件服务器发生故障,数据将不会被复制,且不会保留。现在,我们扩展到短期处理之外,推出了旨在用于更长期存储和工作负载的持久性文件系统,在此系统中,数据将得到复制,且故障的文件服务器也会被替换。


除了这个新的部署选项之外,我们还推出了旨在为突增工作负载提供更好支持的第二代暂存文件系统,它能够提供比基线最多高 6 倍的突增吞吐量。与第一代暂存文件系统相同的是,该系统非常适合临时存储和短期数据处理。


下面的表格可帮助您在部署选项中进行选择:


         col 1               |                                                                                          col 2                                                                                           |                                                                                          col 3                                                                                           |          col 4         
复制代码


:--------------------------------:|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------:|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------:|:-----------------------:


| 持久性 | 暂存 2 | 暂存 1


**API 名称


** | PERSISTENT_1 | SCRATCH_2 | SCRATCH_1


存储复制 | 相同可用区 | 无 | 无


**总吞吐量


(每 TiB 预置容量)


** | 50 MB/秒、100 MB/秒、200 MB/秒 | 200 MB/秒,突增至 1200 MB/秒 | 200 MB/秒


IOPS | 数百万 | 数百万 | 数百万


延迟 | 亚毫秒,较高的差值 | 亚毫秒,非常低的差值 | 亚毫秒,非常低的差值


工作负载预期生命周期 | 天,周,月 | 小时,天,周 | 小时,天,周


静态加密 | 客户托管和 FSx 托管密钥 | FSx 托管密钥 | FSx 托管密钥


传输中加密 | 是,从这些区域中的支持 EC2 实例访问时。 | 是,从这些区域中的支持 EC2 实例访问时。 | 否


**初始的存储分配


** | 1.2 TiB、2.4 TiB,以 2.4 TiB 为增量 | 1.2 TiB、2.4 TiB,以 2.4 TiB 为增量 | 1.2 TiB、2.4 TiB、3.6 TiB


额外的存储分配 | 2.4 TiB | 2.4 TiB | 3.6 TiB

创建持久性文件系统

我可以使用 AWS 管理控制台AWS 命令行界面 (CLI) (create-file-system)、CloudFormation 模板或 FSx for Lustre API (CreateFileSystem) 创建使用持久性部署选项的文件系统。我将使用控制台:



然后,将它像其他文件系统一样安装,并照常访问它。

注意事项

这里需要牢记几点:


Lustre 客户端 – 您将需要使用包含 Lustre 客户端的 AMI(Amazon 系统映像)。您可以使用最新的 Amazon Linux AMI,或者可以创建自己的 AMI。


S3 导出 – 通过这两个选项,您都可以使用 CreateDataRepositoryTask 函数将更改导出至 S3 中。这使您能够在达到严格的恢复点目标 (RPO) 的同时,利用 S3 可提供 99.999999999% 耐用性这一设计优点。


现已推出


持久性文件系统已在所有 AWS 区域推出。暂存 2 文件系统已在所有商用 AWS 区域推出,欧洲(斯德哥尔摩)除外。


价格基于您选择的性能级别和您预置的存储量;请参阅 Amazon FSx for Lustre 定价页面了解更多信息。


本文转载自 AWS 技术博客。


原文链接:https://amazonaws-china.com/cn/blogs/china/amazon-fsx-for-lustre-persistent-storage/


2020-02-27 17:04750

评论

发布
暂无评论
发现更多内容

在线IEEE浮点二进制计算器工具

入门小站

工具

GraphScope v0.12.0 版本发布

6979阿强

大数据 图计算 GraphScope 图分析 图数据

[Day14]-[动态规划]四键盘问题

方勇(gopher)

LeetCode 数据结构与算法、

企业如何进行信息化

秋去冬来春未远

数字化 信息化管理 如何信息化 信息化规律

通过质量内建,提高交付质量

老张

软件测试 质量内建 交付质量

从安装到编译: 10分钟教你在本地使用和开发GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

Docker容器简介、优缺点与安装

乌龟哥哥

4月月更

react源码解析12.状态更新流程

buchila11

React

面试突击39:synchronized底层是如何实现的?

王磊

Java java面试

Linux驱动开发-编写W25Q64(Flash)驱动

DS小龙哥

4月月更

在线CSV转Excel工具

入门小站

工具

在 K8s 上运行 GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

jupyter notebook换皮肤

Peter

Python 机器学习 数据分析 Jupyter Notebook

Atlassian应对CVE-2022-22963,CVE-2022-22965的常见问题

龙智—DevSecOps解决方案

Atlassian CVE-2022-22963 CVE-2022-22965

linux之chroot命令

入门小站

Linux

使用 Helm 部署 GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

一文带你搭建RocketMQ源码调试环境

悟空聊架构

RocketMQ 4月日更 悟空聊架构 4月月更

seaborn绘制箱型图

Peter

可视化 数据可视化 seaborn

TypeScript基础学习

乌龟哥哥

4月月更

如何在Unity中免费制作游戏

龙智—DevSecOps解决方案

Unity Perforce Helix Core

半导体行业如何保持高效远程办公?因果集群(Causal Clustering)了解一下!

龙智—DevSecOps解决方案

远程办公 因果集群

Python 报错 ValueError list.remove(x) x not in list 解决办法

AlwaysBeta

Python 编程

基于卷积神经网络的猫狗识别

Peter

机器学习 深度学习 tensorflow keras

react源码解析11.生命周期调用顺序

buchila11

React

自己动手写Docker系列 -- 5.8实现容器制定环境变量运行

Go Docker 4月月更

读《Software Engineering at Google》(04)

术子米德

架构师成长笔记

万字长文:直击关于Docker所必须了解的知识

穿过生命散发芬芳

Docker 4月月更

基于机器学习算法的钢材缺陷检测分类

Peter

Python 决策树 随机森林 集成学习 LightGBM

图计算 101:图计算的类型、语言与系统

6979阿强

大数据 图计算 GraphScope 图分析 图数据

读《Software Engineering at Google》(03)

术子米德

架构师成长笔记

用 GraphScope 像 NetworkX 一样做图分析

6979阿强

大数据 图计算 GraphScope 图分析 图数据

Amazon FSx for Lustre 更新:用于长期高性能工作负载的持久性存储_语言 & 开发_AWS_InfoQ精选文章