写点什么

Spark,Storm 和实时分析

  • 2014-06-19
  • 本文字数:746 字

    阅读完需:约 2 分钟

随着过去几年的信息量爆炸式增长,大数据分析一直在进步。 Hadoop 绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的 Hadoop 已不能满足实时分析的要求。

Apache Spark 背后公司,Databricks 最近提出追加 1400 万美元加速 Spark 和 Shark 的研发。Spark 是用 Scala 写的大规模数据处理引擎,而 Shark 是 Spark 的 Hive 兼容变体。

同 Spark 类似,通过提供事件处理和分布式计算能力, Storm 目标也是改变 Hadoop 批处理特性。通过在有向图中设计拓扑变换,架构师可以完成任意的复杂计算,一次一个变换。

Nathan Marz 利用一线的经验,提出了 lambda 架构模式来解决这个基础架构问题。 Lambda 架构的体系结构包括一个服务层,它会从批处理层获取经常更新的信息,一个速度层,用于计算实时分析来弥补缓慢的批处理层。基本上,Hadoop 是以批进行计算分析,在批次之间的运行,速度层通过以流的形式检查事件来增量更新指标。

Spark 和 Storm 在 Hadoop 集群中进行操作,访问 Hadoop 存储。 Storm-YARN 是 Storm 和 Hadoop 融合体的雅虎开源实现。Spark 为 Hadoop 提供本地集成。Hadoop 集成是利用 YARN (NextGen MapReduce) 获得的。整合实时分析和基于 Hadoop 的系统,允许通过计算弹性更好地利用集群资源,在同一个集群意味着网络传输量最小。

在商业支持方面,Cloudera 已经宣布支持 Spark 和 CDH (Cloudera 包含 Apache Hadoop 的版本)。在 2014 上半年, hortonworks 计划在 HDP (hortonworks 数据平台)整合 Apache Storm。

查看英文原文: Spark, Storm and Real Time Analytics


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-19 07:539114

评论

发布
暂无评论
发现更多内容

面对疫情,我们正在行动!

anyRTC开发者

uni-app android 音视频 WebRTC 在线教育

Elasticsearch 横向扩容

escray

elastic 七日更 28天写作 死磕Elasticsearch 60天通过Elastic认证考试

合约跟单系统APP开发|合约跟单软件开发

系统开发

UML是表达思想的工具

鲁米

UML

Redis不仅仅是缓存,还是……

码农译站

数据库 redis 缓存 关系型数据库 非关系型数据库

花了19998买的学习教程!Android跨进程通信导论,技术详细介绍

欢喜学安卓

android 程序员 面试 移动开发

“战复不胜”的产品经理

产品经理训练营

有原则,方得始终!

鲁米

SOLID 设计原则

量化交易自动炒币软件开发系统

量化策略交易软件开发系统源码

Task01-产品类JD对比

遠景

产品 字节跳动 产品经理 JD

初探架构,随笔整理

鲁米

软件架构

“公测”成绩亮眼 数字人民币有望重构支付体系

CECBC

数字红包

ssh连接不上Linux怎么办

HKBGP

Linux

Soul网关源码阅读(七)限流插件初探

Java 网关 限流

Nginx 最常用的两个功能:负载均衡和缓存

码农架构

Java nginx 架构 并发

Docker发布开发团队2021年三个首选方向;工信部印发《工业互联网创新发展行动计划(2021-2023 年)》

京东科技开发者

云计算

产品实战作业(Job Model)

晓豪

迷茫 产品经理训练营 BTA 邱岳

产品经理训练营 0 期作业第一章作业

郭郭

对比:微服务VS单体架构

xcbeyond

微服务 单体架构 28天写作

40000美元之后,比特币高位震荡加剧,是买?是卖?还是持有?

CECBC

比特币

2021年1月初Java开发从小公司跳槽阿里制胜关键:狂刷17套大厂真题

Java架构追梦

Java 阿里巴巴 架构 面试

万字解释!在咸鱼被疯抢的网络协议核心彩板手册已曝光!

996小迁

Java 编程 架构 面试 网络协议

微众银行区块链:领跑产业应用落地 推进开源生态繁荣

CECBC

区块链技术

Android入门你值得拥有!史上最通俗计算机网络分层详解,含BATJM大厂

欢喜学安卓

android 程序员 面试 移动开发

张红珊——第一节课作业

zzz

第一章作业

转转

架构的直观展示

鲁米

架构视图 4+1

四,编程范式

鲁米

编程范式

产品经理训练营 - 第一章 必做作业

Denny-xi

产品经理 产品经理新人如何落地 产品经理训练营

什么是产品经理?——课程总结

Deborah

Spark,Storm和实时分析_DevOps & 平台工程_Alex Giamas_InfoQ精选文章