一种读密集型的内存缓存 — Amazon DynamoDB Accelerator (DAX) 发行公开预览版_亚马逊云科技_Daniel Bryant



 写点什么

AWS 发行了 Amazon DynamoDB Accelerator（DAX）的公开预览版，它是一种完全受托管的 write-through 缓存服务，在逻辑上位于 DynamoDB 数据表的前面，提高读密集型负载的性能。DAX 与 DynamoDB 是 API 兼容的，也就是说，现有的应用程序可以直接使用 DAX，而不用被重写。该预览版目前只支持 Java SDK。

Amazon DynamoDB 是一种完全受托管的、可扩展的 NoSQL 数据库服务，它既支持文档模型也支持键值存储模型。据 AWS 博客所称, DynamoDB 可被用于广告技术、物联网、游戏、电子商务和金融，有些用户在一张 DynamoDB 表中存储超过 100TB 的数据而且每秒提交上百万个读写请求。有些高要求的应用程序有着最终一致的读密集型负载，开发 DAX 的目的就是为这些应用程序提供快速的内存性能。

DAX 可处理下面三种应用场景：

作为内存缓存，DAX 将最终一致的读负载的延时降低了一个数量级，从几毫秒降到微妙级。
DAX 提供了一种可管理的服务来降低运营上和应用上的复杂度，该服务与 Amazon DynamoDB 是 API 兼容的，因此在现有应用程序中实现它的时候只要求最小的功能更改。
对于读取繁重或突发性的负载，DAX 降低对过度分配读容量单元（read capacity units）的需求，从而提高吞吐量和降低运营成本。这一点对遭遇热键（hot keys）的应用程序很有用，对大型 DynamoDB 数据集（其中，不同分区内的读容量单元是均等分布的）的读吞吐量也很有用。

作为一个可管理的服务，DAX 集群可通过 AWS UI 来创建，运营任务如软件打补丁、集群维护、复制或故障管理是自动处理的（可指定一个维护窗口）。每一个 DAX 集群可包含 1 到 10 个节点，可以通过增加节点来提高整体的读取吞吐量。缓存的大小基于节点的大小，范围从 dax.r3.large 到 dax.r3.8xlarge，在集群被初始化的时候指定这个值。集群在 VPC 中运行，节点可以分布在整个可用区域。

DAX 的预览版目前只支持 DynamoDB Java SDK 的 API，而且必须用一种新的用于 Java 的 DAX SDK 来与 DAX 进行交互。AWS 文档表明，这是因为 SDK 与集群发生交互时使用了一个低级 TCP 接口，该接口被调优后用于低延迟和高吞吐量。产品的路线图中已经包含了支持用其他语言来访问 DAX。

根据 DAX 开发者指南，这类缓存技术的正面的应用案例包括：

对读取需要最快的可能响应时间的应用程序。
对一小部分项目读取更频繁的应用程序。譬如，为了转移“热”键和非均匀数据分布的影响，可将读取活动放在 DAX 缓存中。
读密集型和代价敏感型的应用程序。DAX 允许将读取活动从 DynamoDB 表转移到 DAX 集群，从而降低所需要的读容量单元。
需要反复读取大量数据的应用程序。譬如，一个长时间运行的数据云的分析程序暂时消耗了一个 DynamoDB 表的所有读容量，这将会影响需要访问同一个数据的其他应用程序。借用 DAX，该分析可针对缓存数据进行。

对下列应用程序而言，DAX 并不是理想的选择：