写点什么

Spark,Storm 和实时分析

  • 2014-06-19
  • 本文字数:746 字

    阅读完需:约 2 分钟

随着过去几年的信息量爆炸式增长,大数据分析一直在进步。 Hadoop 绝对是首选大数据分析和计算平台。随着数据卷,多样性和速度的增长,作为批处理框架的 Hadoop 已不能满足实时分析的要求。

Apache Spark 背后公司,Databricks 最近提出追加 1400 万美元加速 Spark 和 Shark 的研发。Spark 是用 Scala 写的大规模数据处理引擎,而 Shark 是 Spark 的 Hive 兼容变体。

同 Spark 类似,通过提供事件处理和分布式计算能力, Storm 目标也是改变 Hadoop 批处理特性。通过在有向图中设计拓扑变换,架构师可以完成任意的复杂计算,一次一个变换。

Nathan Marz 利用一线的经验,提出了 lambda 架构模式来解决这个基础架构问题。 Lambda 架构的体系结构包括一个服务层,它会从批处理层获取经常更新的信息,一个速度层,用于计算实时分析来弥补缓慢的批处理层。基本上,Hadoop 是以批进行计算分析,在批次之间的运行,速度层通过以流的形式检查事件来增量更新指标。

Spark 和 Storm 在 Hadoop 集群中进行操作,访问 Hadoop 存储。 Storm-YARN 是 Storm 和 Hadoop 融合体的雅虎开源实现。Spark 为 Hadoop 提供本地集成。Hadoop 集成是利用 YARN (NextGen MapReduce) 获得的。整合实时分析和基于 Hadoop 的系统,允许通过计算弹性更好地利用集群资源,在同一个集群意味着网络传输量最小。

在商业支持方面,Cloudera 已经宣布支持 Spark 和 CDH (Cloudera 包含 Apache Hadoop 的版本)。在 2014 上半年, hortonworks 计划在 HDP (hortonworks 数据平台)整合 Apache Storm。

查看英文原文: Spark, Storm and Real Time Analytics


感谢张龙对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-06-19 07:539199

评论

发布
暂无评论
发现更多内容

你都如何回忆我,带着笑或是很沉默

小天同学

回忆 高考 青春

不懂SpringApplication生命周期事件?那就等于不会Spring Boot嘛

YourBatman

Spring Boot SpringApplication

Week 5 作业

Shawn

架构师训练营 - 第五周 - 作业

韩挺

架构师训练营学习总结——缓存与消息队列【第五周】

王海

极客大学架构师训练营

首次揭秘!​春晚活动下快手实时链路保障实践

Apache Flink

Apache flink 架构 实时计算

分布式缓存、消息系统和异步架构

架构5班杨娟Jessie

极客大学架构师训练营

就餐卡系统设计

用一致性Hash算法的实现负载均衡(Kotlin)

Acker飏

极客大学架构师训练营 一致性Hash算法

架构师训练营 - 第五周 - 学习总结

韩挺

Week5 一致性hash算法

TiK

Week 05- 作业二:学习总结

dean

极客大学架构师训练营

Week 05 命题作业

卧石漾溪

极客大学架构师训练营

架构师训练营第五章作业

叮叮董董

Week5 学习总结

wyzwlj

极客大学架构师训练营

Spring 同名 Bean 加载策略

xiaoxi666

spring bean 同名 覆盖

动手实现一致性hash算法

极客大学架构师训练营 分布式缓存 一致性哈希 一致性hash

使用@AutoConfigureBefore调整配置顺序竟没生效?

YourBatman

Java Spring Boot @AutoConfigureBefore

【架构师训练营 - 作业 -5】一致性HASH算法实现

小动物

极客大学架构师训练营 作业 第五周

week2作业

区块链技术打通医疗应用场景

CECBC

行业资讯 生产 区块链技术 生活服务

架构师训练营第5周作业

Bruce Xiong

架构师训练营 Week 05 作业

Wancho

架构师训练营第五章总结

叮叮董董

springBoot集成rabbitmq并实现延时队列

生命在于折腾

RabbitMQ

开发人员应当避免的代价高昂的职业错误

小隐乐乐

职业规划 职业素养 架构师

一致性Hash算法以及Java代码实现

架构5班杨娟Jessie

极客大学架构师训练营

Week 05- 作业一:一致性 hash 算法

dean

极客大学架构师训练营

第五周作业-一致性hash算法实现

吴建中

极客大学架构师训练营

命题作业5-1 【C++实现版本】

天之彼方

c++

week5-总结 技术选型

Geek_z9dmvw

Spark,Storm和实时分析_DevOps & 平台工程_Alex Giamas_InfoQ精选文章