PCon全球产品创新大会(北京站)来啦~了解最新日程 了解详情
写点什么

快数据的三大典型应用模式

  • 2015 年 5 月 07 日
  • 本文字数:1309 字

    阅读完需:约 4 分钟

随着互联网、物联网及电子信息技术的不断发展,智能终端数量极速增长,其所产生数据的速度也前所未有的加快。于是,大数据成为当前这个时代的一个主题词。大数据在给人们带来存储困难的同时,也蕴藏了巨大的潜在价值。目前,对数据的分析和处理,可以划分为两种模式——批处理模式和流处理模式。批处理模式是指数据库中的数据积累到一定量时统一进行分析和处理;流处理模式是指在数据流进入数据库时即刻进行分析和处理。在企业构建大数据处理框架时,这两种处理模式相辅相成,起着非常重要的作用。

快数据指的就是流处理模式中的活动数据、即时状态数据或者正在进行处理当中的数据。Ovum 公司的首席架构师 Tony Baer 指出,“快数据本身并没有什么新的,但是价格和性能优势使得快数据应用被广泛采用”。快速数据在带来巨大价值的同时,也带来了处理和分析的巨大困难。快速数据的价值会随着处理时间的增加而迅速减少。这就要求处理工具要具备接近实时处理和决策的能力。而通过实时分析,企业可以通过实时交互为客户提供很好的服务、更加高效的管理系统资源以及推出新的实时业务。 GigaSpaces 公司的首席技术官 Nati Shalom 明确表示,快数据必然会成为大数据之中的一项重点发展方向。目前, Oracle 等公司已经推出了自己的快数据解决方案。针对快数据,VoltDB 公司的工程副总裁 JohnPiekos 对其应用场景进行了分析,总结出三大典型的应用模式——实时分析、实时决策引擎以及快速数据流水线。

所谓实时分析就是从快速数据流中实时捕捉有用的价值,为用户提供当前状态信息或者警告提示等。例如,电信公司需要同时处理来自上万或者几十万的通话请求。针对这种快数据情景,实时分析就需要对每个请求及时进行处理,获知或修改用户余额、通信双方的基本信息等。因此,这种应用模式中,数据分析和数据入库的过程要基本同时进行。数据库依赖之前消息的数据进行数据库状态的实时分析,然后能够针对一段时间的情况进行分析和整理。对于已经处理完毕的数据,数据库可以直接丢弃。

实时决策引擎与实时分析紧密相关,它面向成千上万的客户端请求,利用相应的信息和决策策略得出结果,并把结果实时反馈给客户端。以电信公司为例,应用程序需要根据实时分析的结果决定是否接通用户的此时通话请求或者在余额为零时结束通话。因此,在这种模式中,决策引擎需要快速的作出决定,而且更新余额等关键状态时要采用稳健型策略。此外,系统使用 SQL 等标准工具可以捕捉和查询系统当前状态。

最后,快数据的数据流水线模式处理来自一个或者多个源的流数据,并对数据执行实时 ETL(提取、转换、加载)操作,最后把结果发送到数据湖泊进行保存。数据流水线对数据进行验证、聚集、计数等等。

这三种典型的应用场景指出了快数据应用可能被采用的地方。作为继大数据的又一个重要概念,快数据已经受到了 VoltDB 等公司的广泛关注。随着技术的进步和企业的发展,快数据应用也必然会带给人们越来越多的价值。


感谢崔康对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ @丁晓昀),微信(微信号: InfoQChina )关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入 InfoQ 读者交流群)。

2015 年 5 月 07 日 05:581288
用户头像

发布了 268 篇内容, 共 105.9 次阅读, 收获喜欢 21 次。

关注

评论

发布
暂无评论
发现更多内容

2021金三银四必备:Java后端开发面试总结【25个技术专题】

比伯

Java 编程 架构 面试 计算机

产品训练营作业:流程图

Geek_06d2e5

现在与以前的你相遇在此刻,让二种不同的风格,创造未来你自己的手艺吧。

叶小鍵

产品经理训练营-第五周作业

月亮 😝

关于MVCC,我之前写错了,这次我改好了!

艾小仙

Java MySQL 数据库 面试 MVCC

孩子应该什么时候上什么兴趣班

Ian哥

28天写作

使用 Tye 辅助开发 k8s 应用竟如此简单(五)

newbe36524

微服务 netcore 全链路追踪 dotnet dapr

用例画成流程图 - 第四章,第三讲总结

mas

索引失效的场景

new life

MySQL 索引性能

面试中经常问到的动态代理到底是什么

废材姑娘

Java

「产品经理训练营」第五周 作业记录

玲玲

第十三周学习心得

cc

第十三周命题作业

cc

电商平台:收货地址

worry

电商平台

(28DW-S8-Day4) 区块链里面2个核心问题

mtfelix

28天写作

翻译:《实用的Python编程》02_04_Sequences

codists

Python 人工智能 面试 数据结构与算法 序列

地表建筑物识别 Dayo2

IT蜗壳-Tango

七日更 28天写作 2月春节不断更

圈子创业

张老蔫

28天写作

程序员的职业生涯与赛道选择

刘旭东

职业规划 码农 职业生涯

设计模式【2.2】-- 工厂模式怎么演变成抽象工厂模式?

秦怀杂货店

设计模式 工厂模式 23种设计模式 工厂方法模式

框架效应如何影响人的决策?「Day 4」

道伟

心理 决策 28天写作

保持前进

Nydia

工作中当你感觉焦虑的时候,该怎么办?

一笑

28天写作

得不到的永远在骚动——蔡格尼克效应

Justin

心理学 习惯养成 28天写作 游戏设计

改变认知,到写作方式的改变

数列科技杨德华

28天写作

极客大学·产品经理训练营·第四章作业(第五周)

二大爷

极客大学产品经理训练营

产品经理训练营-第五周学习总结

月亮 😝

将上周写的用例画成流程图-第四章,第三讲

mas

Linux c 开发 - 内存管理器ptmalloc

赖猫

Linux 后台开发 内存管理

28天瞎写的第二百四十二天:正念冥想,我要想什么?

树上

冥想 28天写作 正念

Elasticsearch Validate API

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试 二月春节不断更

TDSQL前沿技术进展和趋势——数据异常基础理论研究

TDSQL前沿技术进展和趋势——数据异常基础理论研究

快数据的三大典型应用模式-InfoQ