写点什么

Amazon 发布 Kinesis 服务更新

  • 2016-05-29
  • 本文字数:1414 字

    阅读完需:约 5 分钟

Amazon 最近公布了旗下Amazon Kinesis Service 的更新。在此次更新中,Amazon Kinesis Streams 和Amazon Kinesis Firehose 服务增加了三个新功能,包括支持Elasticsearch Service Integration(Elasticsearch 服务集成)、Shard-Level Metrics(Shard 级度量指标),以及Time-Based Iterators(基于时间的迭代器)。

Amazon Elasticsearch 服务集成

Kinesis Firehose 与 Amazon Elasticsearch 的集成使得开发者能够将数据从 Amazon Kinesis Firehose 交付流(Delivery stream)移动至 Amazon Elasticsearch 服务群集。

随着数据进入 Kinesis Firehose 交付流,将根据配置进行缓冲,随后通过批量插入的方式将其存入 Elasticsearch 服务。这些交付流还可以通过 AWS 管理控制台进行压缩和加密。

这种集成的使用场景包括服务器日志的索引和分析,点击流和社交媒体流量等。AWS 产品战略总经理 Matt Wood表示,这个新功能“非常适合日志分析和应用程序监视”。

一旦将数据发布至Elasticsearch,随后即可使用诸如 Kibana 等工具对其进行分析和可视化。

Shard 级度量指标

一个 Kinesis Stream 可包含一个或多个 Shard。Kinesis Stream 中的 Shard 代表读写能力。每个 Shard 可提供 1MB/ 秒数据输入和 2MB/ 秒数据输出。Shard 将按照使用小时数收费,每秒钟最多可处理 1000 条记录。

新提供的 Shard 级度量指标可供用户了解 Kinesis Stream 中每个 Shard 性能的详细信息。总的来说,目前共有 6 个可用度量指标,每个指标的状态每分钟更新一次。这些度量指标将按照 CloudWatch 每个指标的定价模型进行收费。

Amazon 已经公布了目前 Kinesis Streams 可用的每个度量指标的详细信息:

  • IncomingBytes – 已经成功 PUT 至 Shard 的字节数量。
  • IncomingRecords – 已经成功 PUT 至 Shard 的记录的数量。
  • IteratorAgeMilliseconds – 针对一个 Shard 调用GetRecords所返回的最后一条记录的寿命(以毫秒计)。值为“0”意味着目前正在读取的记录已经完全赶上了流的速度。
  • OutgoingBytes – 从 Shard 获得的字节数量。
  • OutgoingRecords – 从 Shard 获得的记录数量。
  • ReadProvisionedThroughputExceeded - 通过GetRecords获取的超过每秒 5 次读取或每秒 2MB 数据的限制的 Shard 数量。
  • WriteProvisionedThroughputExceeded – 由于超出 Shard 每秒 1000 条记录或每秒 1MB 数据的限制而进行限流后,已经被拒绝的记录数量。

用户可以使用这些信息估算自己的系统性能。例如可以检测上游应用程序发布数据的速度是否过快,超过了下游应用程序(Consuming application)的处理能力进而产生吞吐率瓶颈。

基于时间的迭代器

当应用程序从流中读取数据时,为了以正确的顺序拉取正确的数据,需要追踪数据在流中的位置。在 Kinesis Streams 中可以使用迭代器实现该功能。在本次更新之前可以使用顺序号、最老记录或最新记录作为迭代器。

在 AWS 的此次更新中,用户已经可以指定时间戳决定要从哪里开始处理自己的流。这种功能的一个用例是:当下游应用程序经历计划内停机时,发布方可能依然在向流中发布新数据。默认情况下,Kinesis Stream 最多可存储 24 小时的数据,这样消费应用程序就可以通过提供时间戳,从上次中断的地方继续处理流中发布的数据。

查看英文原文 Amazon Releases Kinesis Service Update


感谢侠天对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们。

2016-05-29 19:002045
用户头像

发布了 283 篇内容, 共 113.2 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

大四实习生”都四面成功拿到字节跳动Offer了,你还有什么理由去摸鱼?

学Java关注我

Java 编程 架构 面试 计算机

YARN资源调度三种模型介绍

五分钟学大数据

YARN

高并发之存储篇:关注下索引原理和优化吧!躲得过实践,躲不过面试官!

Coder的技术之路

数据库 高并发 索引结构 索引优化

GitHub Actions:真正的 DevOps CI

大龄程序员老羊

架构 DevOps 持续集成 Github Actions NoOps

zookeeper的架构

大数据技术指南

zookeeper 5月日更

LiteOS内核源码分析:静态内存Static Memory

华为云开发者联盟

内存管理 LiteOS 静态内存 Static Memory Membox

专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

华为云开发者联盟

计算机视觉 nlp 华为云 盘古大模型 预训练

yarn的多租户配置实现资源隔离

五分钟学大数据

YARN

HDFS的HA以及Yarn的HA高可用

五分钟学大数据

hdfs YARN 5月日更

架构训练营-作业三(消息队列详细架构设计文档)

eoeoeo

架构实战营

流媒体:依托于声网的连麦解决方案

小岛上的黑桃六

架构 音视频 架构师 流媒体 声网

Android中绘制圆角的三种方式

teoking

android

回顾 Alex Smola 讲述的“自动化机器学习(AutoML)”,本文带你了解 AutoGluon!

亚马逊云科技 (Amazon Web Services)

Java面试:BIO,NIO,AIO 的区别,别再傻傻分不清楚

Java大蜗牛

Java 程序员 面试 编程语言 后端

云图说|云数据库MySQL内核小版本升级全攻略

华为云开发者联盟

MySQL 云数据库 内核 华为云数据库 小版本升级

GitHub开源的最全中文诗歌古典文集数据库

不脱发的程序猿

GitHub 开源 程序人生 中华古典文集数据库

架构师实战营,模块三:架构设计详细文档

ifc177

#架构实战营

HDFS

xujiangniao

百分点大数据技术团队:政务数据安全管理实践

百分点大数据团队

高并发系列:存储优化之也许可能是史上最详尽的分库分表文章之一

Coder的技术之路

高并发 分库分表 高并发系统设计

【案例】新基建下星环科技城轨智能视频分析系统建设

星环科技

用机器学习操控无人驾驶小车,竟然和训练狗狗的原理一样!?

亚马逊云科技 (Amazon Web Services)

【LeetCode】解码异或后的数组Java题解

Albert

算法 LeetCode 5月日更

万丈高楼平地起,爆肝21000字Java基础知识总结,收藏起来总有用得着的时候

北游学Java

Java 集合 线程池 IO流

架构实战营模块三作业

日照时间长

架构实战营

负载均衡续:万亿流量场景下的负载均衡实践

Coder的技术之路

负载均衡 架构 高并发 负载均衡架构

从简历被拒到收割8个大厂offer,我用了3个月成功破茧成蝶

比伯

Java 编程 架构 面试 计算机

高并发系列:架构优化之从BAT实际案例看消息中间件的妙用

Coder的技术之路

高并发 高并发系统设计 消息队列 消息中间件

数据仓库分层架构及元数据管理

五分钟学大数据

数据仓库

Flink on Zeppelin 系列之:Yarn Application 模式支持

Apache Flink

flink

INNOVATE 2021 圆满落幕,一起盘点那些 AI 前沿实例!

亚马逊云科技 (Amazon Web Services)

Amazon发布Kinesis服务更新_亚马逊云科技_Kent Weare_InfoQ精选文章