写点什么

Yahoo! 开源运行在 Hadoop 上的 Storm——Storm-YARN

2013 年 6 月 19 日

Apache Hadoop 是大数据处理与批处理的事实标准,而 Twitter Storm 则很快地成为实现大规模事件处理的一种标准。遗憾的是,直到最近,实现 Storm 和 Hadoop 所需要的集群在物理上仍然有所不同。上周,Yahoo宣布开放运行在 Hadoop 集群上的 Storm——即 Storm-YARN 的源代码。

据 Yahoo! 介绍,相对于隔离的集群,实时处理(Storm)和批处理的结合具有很多优势:

  • 提供了巨大的弹性潜力。实时处理的负载一般不恒定,而且是不可预测的。就其本身而言,为满足需求峰值,Storm 会需要更多资源。将 Storm 和批处理搭配使用,Storm 需要资源时可以从批处理作业那里窃取,当资源需求下降时再把资源还回去。Storm-YARN 为实现这一理念奠定了基础。
  • 很多应用将 Storm 用于低延时处理,而将 Map/Reduce 用于批处理,同时,两者之间会共享数据。通过将 Storm 放到物理上更接近数据源和 / 或同一流水线中其他组件的地方,可以减少网络传输,进而减少获取数据的总开销。

Storm 与 YARN 的集成利用了Hadoop 的新型资源管理器 YARN

Storm-on-YARN 支持 Storm 应用利用数以万计的 Hadoop 计算节点的计算资源。YARN 用来根据需求启动 Storm 应用的主节点——即 Nimbus,并支持 Nimbus 为 Storm 应用的工作节点(即 Supervisor)请求资源。

Storm-YARN 提供了标准的 Storm 配置文件,其中包括 YARN 的特定参数,支持配置初始启动的 Supervisor 数及为每个 Supervisor 分配的容器的内存大小。

此外,为支持 Hadoop 风格的安全机制,Yahoo! 还增强了 Storm,支持 Storm 应用直接访问存储在 HDFS 和 Hbase 上的 Hadoop 数据。

Loraine Lawson 介绍:

实时交付信息是 Hadoop 和其他大数据解决方案更有前景的应用之一。这一点很少被提及,这很遗憾,因为对很多组织而言,这是真正的致胜之道,对我们这些人也很有启示。

Storm 实现的实时事件处理,加上 Hadoop,再加上实时Hadoop 查询,它们的结合让我们离这一愿景又近了一步。

查看英文原文: Yahoo! Open Sources Storm on Hadoop

2013 年 6 月 19 日 06:337325
用户头像
臧秀涛 极客邦科技技术会议负责人

发布了 300 篇内容, 共 114.2 次阅读, 收获喜欢 21 次。

关注

评论

发布
暂无评论
发现更多内容

2020-06-13-第二周学习总结

路易斯李李李

设计模式原则小结

L001

学习心得

蒜泥精英

架构师训练营第二周学习总结

人世间

极客大学架构师训练营

架构师训练营 第二周作业

孙有能希

架构师训练营-第二周作业

清风徐徐

单例模式 极客大学架构师训练营 组合模式

Python 核心技术与实践 string

Bonaparte

Python string

架构师训练营第二周总结

15359861984

架构师0期02周命题作业

喵呜的小哥哥

架构师训练营 - 第二周学习总结

清风徐徐

架构师实现架构目标的主要手段(第2周学习总结)

李德政

极客大学架构师训练营

架构师第二周作业

跨域刀

极客大学架构师训练营

架构师第二课总结

Dennis

架构师训练营第二周作业

草原上的奔跑

架构师训练营 第二周【作业】

小K

依赖倒置

wei

架构师训练营 - 第二周作业

teslə

架构师训练营Lesson2-Homework

强哥

极客大学架构师训练营 依赖倒置

架构师训练营第二章总结

吴吴

架构师训练营-第二周作业

坂田吴奇隆

极客大学架构师训练营

隔离原则优化 Cache 类的设计

潜默闻雨

第二周 - 学习总结

molly

极客大学架构师训练营

第二周总结

跨域刀

极客大学架构师训练营

第二周作业

重新来过

编程与设计

eazonshaw

架构师训练营第二章作业

吴吴

架构师训练营第二周作业

fenix

依赖倒置原则的个人理解

潜默闻雨

week2 homework

【架构师训练营】week 2 homework

eazonshaw

第二周学习总结

Darren

NLP领域的2020年大事记及2021展望

NLP领域的2020年大事记及2021展望

Yahoo!开源运行在Hadoop上的Storm——Storm-YARN-InfoQ