QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074515
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 139.3 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

技术标准|隐语技术标准的 What & Why & How

隐语SecretFlow

技术标准 隐私计算 数据要素流通

国内第一个开源免费电子签章系统发布了

开放签开源电子签章

开源 电子签章 开放签

华为微信红包封面新春献礼,龙年送福更添彩

最新动态

AI创业创新的三个误区及应对之道

算AI

人工智能 创业 AI 创新

【幻兽帕鲁】专用服务器攻略来啦!一键部署,5s开服

华为云开发者联盟

云计算 服务器 华为云 华为云开发者联盟 幻兽帕鲁

Navicat Premium 15 :专为简化数据库的管理及降低系统管理成本而设计

Rose

关键帧缓入缓出曲线调节控制操作AE脚本 Kease for mac

Rose

敏捷产品是双轨开发而非双轨制

ShineScrum

鸿蒙星河版启航!系统级原生智能实现应用「零成本」AI化

新消费日报

云图说|揭秘云原生服务生命周期治理平台,云原生服务中心OSC

华为云开发者联盟

云原生 华为云 华为云开发者联盟 华为云云图说

支付宝花呗分期如何接入

盐焗代码虾

支付宝 经验分享 花呗分期

当我们一起走过 2023|Apache Doris 年度时刻盘点

SelectDB

概念回顾:分布式拒绝服务 (DDoS) 攻击

NGINX开源社区

nginx DDoS DDoS 攻击 (SSL)/TLS Web 应用防火墙

前端开发CSS实用的技巧有哪些

小魏写代码

小艺上线新春限定版!丰富玩法一起“花式”迎龙年

最新动态

Flink 2.0 状态存算分离改造实践

Apache Flink

聊聊BUG的根因分析

老张

bug bug管理

得物自研API网关实践之路

得物技术

微服务架构

别人还在集五福,星河社区开发者已经奖品拿到手软了!

飞桨PaddlePaddle

百度 百度飞桨 飞桨星河社区

水杉在极狐GitLab 的 DevOps 实践

极狐GitLab

【亿级数据专题】「高并发架构」盘点本年度探索对外服务的百万请求量的高可靠消息服务设计实现

码界西柚

后端 消息队列 高并发架构 亿级数据 2024年第三十四篇文章

PS插件-模拟真实投影拖尾阴影工具 Shadowify v1.0.1

Rose

AE脚本-真实三维立体文字标题排版空间翻转组合动画 TypeMonkey3D

Rose

AE脚本-智能快速图层对齐工具 Align Pro

Rose

影响2024年Web3赛道的三大事件

TechubNews

solidity案例详解(二)众筹合约

BSN研习社

区块链 Solidity

说说开放签电子签章开源的这一年

开放签开源电子签章

开源 电子合同 年终总结 电子签名 电子签章

2023年行摄回忆录

穿过生命散发芬芳

行摄回忆录 盘点2023

前端开发CSS实用的技巧有哪些

小齐写代码

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章