写点什么

Apache Flink 实现的数据流体系结构

  • 2016-06-12
  • 本文字数:804 字

    阅读完需:约 3 分钟

data Artisans 应用程序工程总监 Jamie Grier 最近在 OSCON 2016 Conference 大会发言谈到了使用 Apache Flink 构建的一种数据流体系结构。同时还谈到了数据流应用程序的构建块。

数据流体系结构可用于处理随着时间流逝以事件流方式持续生成的数据,这一点不同于传统的静态数据集。相对于传统的集中式“状态化”数据库和数据仓库,数据流应用程序可以处理事件流以及针对历史事件汇总而来的应用程序本地状态。流式数据处理的一些优势包括:

  • 降低从信号到决策的过程延迟
  • 通过统一的方式处理实时和历史数据
  • Time travel 查询

Apache Flink 是一种开源的分布式流化和批量化数据处理平台。Flink 的诞生受到了 Google Data Flow 模型的启发,可支持 Java 和 Scala 语言开发的 Stream Processing API。相比其他流式数据处理框架,Flink 中不存在微批量(Micro batching)数据,而是使用了一种“一次一条消息”的流处理技术。

Jamie 介绍了状态流处理并展示了 Flink 应用程序的代码范例,以及使用开源时序数据库和 Graphana 可视化工具 Influxdb 进行监控的方法。

同时他还介绍了流处理过程中窗口(Windowing)的概念以及处理时间(Processing Time)和事件时间(Event Time)的窗口概念。处理时间的窗口会对流数据的分析产生影响,并会导致数据处理过程中出现某些错误。在事件时间方法中,窗口来自于数据,而非时钟时间。对于事件时间,可通过数据嵌入的时间戳对数据进行处理,这样即可获得更精确的结果。

Jamie 还介绍了在应用程序中使用 Flink 时的错误处理和容错机制。Flink 中的 Savepoints 功能可在不丢失任何状态的情况下对程序和 Flink 集群进行更新。如果要对实时数据进行流处理,此时 Savepoints 数据快照会显得非常重要。

如果你想详细了解 Apache Flink,可访问他们的网站。此外 Flink Forward 2016 Conference 活动将于九月在柏林召开,提交提案的截止日期为2016 年6 月30 日。

查看英文原文 Data Streaming Architecture with Apache Flink

2016-06-12 19:002677
用户头像

发布了 283 篇内容, 共 106.5 次阅读, 收获喜欢 62 次。

关注

评论

发布
暂无评论
发现更多内容

预告!网络安全红队GPT大模型训练直播来袭

云起无垠

用友BIP资产云携手洋井石化,打造行业领先的智慧资产管理系统

用友BIP

资产云

华为云ROMA Connect亮相Gartner®全球应用创新及商业解决方案峰会,助力企业应用集成和数字化转型

华为云PaaS服务小智

云计算 华为云 峰会

华秋亮相第五届模拟半导体大会,助力电子行业高质量发展

华秋电子

PCB

HarmonyOS NEXT带来的DevEco Profiler助您轻松分析应用性能问题

Geek_2d6073

HarmonyOS应用侧与前端页面数据通道建立

HarmonyOS开发者

HarmonyOS

解决方案| anyRTC远程检修应用场景

anyRTC开发者

人工智能 音视频 视频会议 远程协助 电话会议

9.19-21,openEuler与您相约2023欧洲开源峰会

openEuler

Linux 开源 操作系统 openEuler

【ODPS新品发布第1期】DataWorks全新发布:增强分析/数据建模个人版等新能力

阿里云大数据AI技术

大数据 阿里云

运行程序提示路径错误?

矩视智能

深度学习 机器视觉

北京大上科技发布全球首款25.3英寸彩色墨水屏显示器

硬科技星球

区块链集成:加密货币网站开发的必备条件

区块链软件开发推广运营

数字藏品开发 dapp开发 区块链开发 链游开发 NFT开发

Premiere Pro 2022 for Mac(pr)更新字幕转换包 v22.6.2永久激活版

mac

pr2022 苹果mac Windows软件 视频编辑软件 ​Premiere Pro 2022

基于YOLOv2和传感器的多功能门禁系统

timerring

YOLOv2

医院如何实现安全又稳定的跨网文件数据交换呢?

镭速

跨网文件数据交换

国产化操作系统有哪些?适配国产化操作系统堡垒机哪款好用?

行云管家

信创 堡垒机 国产化 国产操作系统 国产

财务共享中心进行数据服务应该从哪里入手?

用友BIP

财务共享

如何在Blender中压缩/减小GLTF模型的大小

3D建模设计

blender GLTF

glTF 中基于物理的渲染(PBR)

3D建模设计

华为云CodeArts Check代码检查服务用户声音反馈集锦(1)

华为云PaaS服务小智

云计算 软件开发 华为云

莆田市属于哪个省?有正规等保测评机构吗?

行云管家

等保 等保测评 等保等级保护

最适合做缺陷跟踪管理的8款工具

爱吃小舅的鱼

缺陷管理 bug管理 bug管理工具

5 个适合出海离岸公司的地区推荐

出海的猹

出海企业

“敏捷教练必修课程”10月14-15日 ·A-CSM认证在线周末班【提前报名特惠】CST导师亲授

ShineScrum捷行

程序设计之——手把手教你如何从Excel文件中读取学生信息

SoFlu软件机器人

2023百度教育再出发,探索经营增长新空间

彭飞

GLTF文件格式解析与预览、编辑

3D建模设计

GLTF

GLTF-pipeline

3D建模设计

gltf编辑器

如何将 OBJ 模型转换和压缩为 GLTF 以与 AWS IoT TwinMaker 配合使用

3D建模设计

GLTF

OpenCloudOS + 英特尔第四代至强处理器:完美适配,加速未来

OpenCloudOS

Linux intel

【重磅】《中台技术财务应用蓝皮书》正式发布

用友BIP

智能财务

Apache Flink实现的数据流体系结构_语言 & 开发_Srini Penchikala_InfoQ精选文章