写点什么

Twitter 已经用 Heron 替换了 Storm

  • 2015-06-15
  • 本文字数:944 字

    阅读完需:约 3 分钟

Twitter 已经用 Heron 替换了 Storm。此举将吞吐量最高提升了 14 倍,单词计数拓扑时间延迟最低降到了原来的 1/10,所需的硬件减少了 2/3。

Twitter 使用 Storm 实时分析海量数据已经有好几年了,并在 2011 年将其开源。该项目稍后开始在 Apache 基金会孵化,并在去年秋天成为顶级项目。Storm 以季度为发布周期,现在已经达到了 0.9.5 版本,并且正在向着人们期望的 1.0 稳定版前进。但一直以来,Twitter 都在致力于开发替代方案 Heron,因为 Storm 无法满足他们的实时处理需求。

Twitter 的新实时处理需求包括:“每分钟数十亿的事件;大规模处理具有次秒级延迟和可预见的行为;在故障情况下,具有很高的数据准确性;具有很好的弹性,可以应对临时流量峰值和管道阻塞;易于调试;易于在共享基础设施中部署。” Karthik Ramasamy 是 Twitter Storm/Heron 团队的负责人。据他介绍,为满足这些需求,他们已经考虑了多个选项:增强 Storm、使用一种不同的开源解决方案或者创建一个新的解决方案。增强 Storm 需要花费很长时间,也没有其它的系统能够满足他们在扩展性、吞吐量和延迟方面的需求。而且,其它系统也不兼容 Storm 的 API,需要重写所有拓扑。所以,最终的决定是创建 Heron,但保持其外部接口与 Storm 的接口兼容。

拓扑部署在一个 Aurora 调度器上,而后者将它们作为一个由多个容器(cgroups)组成的任务来执行:一个 Topology Master、一个 Stream Manager、一个 Metrics Manager(用于性能监控)和多个 Heron 实例 (spouts 和 bolts)。拓扑的元数据保存在 ZooKeeper 中。处理流程通过一种反压机制实现调整,从而控制流经拓扑的数据量。除 Aurora 外,Heron 还可以使用其它服务调度器,如 YARN 或 Mesos。实例运行用户编写的 Java 代码,每个实例一个 JVM。Heron 通过协议缓冲处理彼此间的通信,一台机器上可以有多个容器。(要了解更多关于 Heron 内部架构的细节信息,请阅读论文《 Twitter Heron:大规模流处理》。)

Twitter 已经用 Heron 完全替换了 Storm。前者现在每天处理“数 10TB 的数据,生成数 10 亿输出元组”,在一个标准的单词计数测试中,“吞吐量提升了 6 到 14 倍,元组延迟降低到了原来的五到十分之一”,硬件减少了 2/3。

当被问到 Twitter 是否会开源 Heron 时,Ramasamy 说“在短时间内不会,但长期来看可能。”

2015-06-15 13:408999
用户头像

发布了 1008 篇内容, 共 393.0 次阅读, 收获喜欢 344 次。

关注

评论

发布
暂无评论
发现更多内容

"Global Golden Course" - Certified ScrumMaster (Delivered in English at weekend)

ShineScrum

Scrum Agile ScrumMaster Agile Coach

LED显示屏技术升级方向解析

Dylan

工具 LED显示屏 全彩LED显示屏 led显示屏厂家 舞台表演

Mint Blockchain,要让全人类都拥有 NFT 资产!

NFT Research

web3 NFT\ L2

碳课堂|一文读懂全球碳标准的前世今生

AMT企源

碳管理 碳核算 碳认证

解析 cURL 命令的功能和特性

Apifox

后端 后端开发 API curl 网络请求

激发大数据场景价值,润和软件HopeOS闪耀鲲鹏昇腾开发者大会2024

科技热闻

枫清科技(Fabarta )再获“鑫智奖”,推动金融数智化与智能营销创新

Fabarta

软件测试学习笔记丨后端接口开发 - MyBatis 传统开发方式

测试人

软件测试

速度围观|使用分布式企业级任务调度平台,到底有多香?

智在碧得

数字化转型 XXL-JOB 任务调度平台 http任务 elastic job

谷歌访问助手,解决chrome扩展无法自动更新的问题

Rose

photoshop 2021安装教程 ps2021中文版 mac/win

Rose

MacDroid pro:打破Android和Mac系统之间的传输障碍

Rose

Macs Fan Control for mac:提高设备的散热效果,减少过热造成的风险

Rose

这款PDF解析工具,精准触达大模型问答应用的需要

合合技术团队

人工智能 PDF OCR LLM

开源之夏2024学生报名启动!阿里云PolarDB社区项目期待你的参与!

阿里云数据库开源

数据库 阿里云 学生开发者

Downie 4 mac视频下载器:自动检测和下载指定网站上的最新视频

Rose

在iPhone / iPad上轻松模拟GPS位置:AnyGo for Mac中文破解资源

Rose

腾讯互娱面经,希望别凉

王中阳Go

Go 面试 微服务 大厂面经 Go进阶

第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号2024年5月PK榜

OpenHarmony 成功亮相国际学术会议 ASPLOS 2024

科技热闻

Imagenomic Portraiture 4.5 ps智能磨皮滤镜插件

Rose

PS磨皮滤镜降噪插件套装 Imagenomic Professional Plugin Suite 支持ps2024

Rose

带你熟悉CCE集群增强型CPU管理策略enhanced-static

华为云开发者联盟

Kubernetes 华为云 华为云开发者联盟 华为云CCE 企业号2024年5月PK榜

万界星空科技商业开源MES+项目合作+商业开源低代码平台

万界星空科技

低代码平台 mes #开源 开源mes 万界星空科技

芯盾时代智能风控决策系统信贷版

芯盾时代

监管合规 风控系统 金融业 信贷

大语言模型 —— AI时代的文字计算器?

Baihai IDP

程序员 AI 白海科技 企业号 5 月 PK 榜 LLMs

基于阿里云向量检索 Milvus 版与 PAI 搭建高效的检索增强生成(RAG)系统

阿里云大数据AI技术

人工智能 阿里云 Milvus

软件测试学习笔记丨后端接口开发 - MyBatis 代理开发

测试人

软件测试

Twitter已经用Heron替换了Storm_大数据_Abel Avram_InfoQ精选文章