写点什么

Apache Storm 1.0 发布,带来性能提升和许多新特性

  • 2016-04-17
  • 本文字数:968 字

    阅读完需:约 3 分钟

1.0 版本是 Apache Storm 发展过程中一座重要的里程牌,负责 Apache Storm 项目的 Apache 软件基金会副总裁 P. Taylor Goetz 这样写道。该版本包含许多新特性和改进。尤其是,Goetz 声称它带来了3 到16 倍的性能提升。

Storm 是一个事件处理程序,可以对流数据进行分布式处理。一个 Storm 应用程序由“spouts”和“bolts”构成,它们被配置成一个有向无环图,用来表示信息源和数据处理程序。Storm 的主要特点是能处理实时数据,不像 Hadoop 那样允许批处理。

据 Goetz 介绍,与先前的版本相比,Storm 1.0 的性能最高提升了 16 倍,在大多数情况下预计都会有 3 倍的性能提升。特别地,性能的重大改善似乎来自下面的更改:

  • SpoutOutputCollector.emit()调用中使用 Java重新实现了Clojure reduce函数;
  • DisruptorQueue引入批处理,代替 spout 层的批处理,这以增加延迟为代价大幅提升了吞吐量。

特别地,雅虎工程师所做的大量的基准测试表明,与其他两个流行的分布式处理框架 Apache Flink Apache Spark 相比,性能历来是 Storm 的主要竞争优势之一。

此外,Storm 1.0 包含许多值得注意的新特性,例如:

  • Pacemaker:一个处理工作进程心跳的心跳守护进程,它常驻内存,提供了比 ZooKeeper 更好的性能;
  • 分布式缓存及相关 API:它允许在拓扑之间共享文件。文件可以随时更新,而不需要重新部署受影响的拓扑。这对于当前将资源文件包含在拓扑 jar 包中的做法是一种改进,这种做法更新文件时需要重新部署;
  • 高可用 Nimbus:使用一个 Nimbus 节点的动态集群代替单个 Nimbus 实例,如果当前的群首节点出现故障,就会选出新的“群首”;
  • 流窗口 API:新增窗口定义支持,这些窗口可以应用于数据处理,比如在最后一个小时里计算最热门的话题。以前,开发人员必须构建自己的窗口逻辑;
  • 自动反压:当任务缓冲区的大小达到了指定的限制(以百分比表示),Storm 就会自动降低拓扑 spouts 的速度;
  • 资源感知调度器:一种新的调度器实现,在将任务分配给最能满足特定需求的工作进程时考虑了集群中可用的内存和 CPU 资源;
  • 动态工作进程性能分析:旨在让用户可以从 Storm UI 获取工作进程性能数据,比如堆转储文件、JStack 输出。

读者可以从 GitHub 上下载 Apache Storm 1.0,或者从 Storm 下载页面上获取各种打包格式。

查看英文原文: Apache Storm Reaches 1.0, Brings Improved Performance, Many New Features

2016-04-17 19:004035
用户头像

发布了 1008 篇内容, 共 398.9 次阅读, 收获喜欢 345 次。

关注

评论

发布
暂无评论
发现更多内容

微信小程序开发小白教学

FinFish

ide 小程序容器 小程序容器技术

大数据从业者必知必会的Hive SQL调优技巧

京东科技开发者

福建龙岩等级保护测评机构有几家?在哪里?

行云管家

等保 堡垒机 龙岩

Go必知必会:深入探索Go语言中的指针,内存操作的艺术

王中阳Go

golang 指针 数据类型 GO语言编程

A Comprehensive Review of the Best IPQ5010/IPQ5018 Wi-Fi 6 Routerboards

wallyslilly

ipq5018

企业如何选择合适的可观测产品

乘云数字DataBuff

可观测性 数字化

Micromat Lifespan for mac系统内存测试工具

Mac相关知识分享

如何构建成功的财务规划团队?

智达方通

企业管理 全面预算管理 财务管理 全面预算管理系统

PaddleX图像分割赋能医疗领域筛查检测,打造智能医疗诊断系统

百度Geek说

电商API的创新应用与高效数据采集策略实践

代码忍者

API 接口 pinduoduo API

花半小时用豆包Marscode 和 Supabase免费部署了一个远程工作的导航站

豆包MarsCode

人工智能 程序员 AI 项目 部署

Mac 的实用电池健康保护工具AlDente Pro for Mac

Mac相关知识分享

软件

并发处理的利器:深入探讨锁分离设计+6大分离场景(高并发篇)

肖哥弹架构

Java 高并发

战略上的AI:如何将人工智能融入企业战略

天津汇柏科技有限公司

AI人工智能

防范数据泄露就用堡垒机!

行云管家

数据安全 堡垒机 数据泄露

文献解读-Consistency and reproducibility of large panel next-generation sequencing: Multi-laboratory assessment of somatic mutation

INSVAST

基因数据分析 生信服务

模拟建造游戏推荐:城市:天际线Cities: Skylines(Win&Mac) 版下载

你的猪会飞吗

城市天际线 Mac游戏下载

快速理解 GraphRAG:构建更可靠、更智能的 Chatbot

Baihai IDP

程序员 AI 白海科技 Baihai IDP 企业 9 月 PK 榜

LED显示屏P3、P4、P5的区别有哪些?

Dylan

技术 LED显示屏 全彩LED显示屏 led显示屏厂家 户内led显示屏

IPQ5332 vs. IPQ9578-Comprehensive Analysis of Wi-Fi 7 Chips:

wifi6-yiyi

WiFi7

EtreCheckpro for mac硬件信息查看工具

Mac相关知识分享

这是一封面向未来的公开信:校园“Milvus明日之星”招募令

Zilliz

AI Milvus 向量数据库

“AI+Security”系列第3期(二):AI赋能自动化渗透测试

云起无垠

企业有了ELT就不需要ETL了?别被忽悠了

RestCloud

数据挖掘 kettle 数据处理 ETL ELT

Mac 的实用调色工具ColorWell for Mac

Mac相关知识分享

软件

怎样摆脱繁重的“物理集中”,轻松连接与交付全域数据,真正实现“敏捷用数”?

Aloudata

PR2022安装包,Premiere Pro 2022(Win&Mac) 直装下载

你的猪会飞吗

pr2022 Premiere Pro 2022 mac破解软件下载

DDD学习与感悟——向屎山冲锋

京东科技开发者

文本快速输入工具Rocket Typist pro for Mac

Mac相关知识分享

软件

java浅拷贝BeanUtils.copyProperties引发的RPC异常

京东科技开发者

如何编写高质量的用户故事

俞凡

最佳实践 敏捷开发

Apache Storm 1.0发布,带来性能提升和许多新特性_语言 & 开发_Sergio De Simone_InfoQ精选文章