写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074531
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 140.0 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

MySQL面试必备一之索引

Hunter熊

MySQL 面试 索引 B+树 聚簇索引

GraphPad Prism 10:集数据整理、统计分析、图表制作和报告生成于一体的科研软件

Rose

医学绘图软件 GraphPad Prism 10 GraphPad Prism破解版

macOS 13 Ventura (苹果最新系统下载安装) v13.6.4正式版

Rose

macOS Ventura 苹果13系统 macOS13系统下载

permute3许可码 全能媒体格式转换器 3.11.4中文版

Rose

Permute 3 for mac 媒体格式转换工具 Permute 3破解版

DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧

小万哥

xml 程序人生 编程语言 软件工程 前端开发

MTMT:构建比特币生态平行世界 打造铭文生态繁荣

股市老人

支付系统概述(一):支付模式概览

agnostic

支付系统设计与实现

MTMT质押活动即将开启,用户最高可获得100%APY增值

BlockChain先知

从 Redis 开源协议变更到 ES 国产化:一次技术自主的机遇

极限实验室

elasticsearch redis' easysearch ES国产化

flutter-barrage-craft — 能成为pub.dev中最好用的弹幕插件吗🤔?

编程的平行世界

flutter 插件化 pub.dev

MTMT 质押活动启动 ,坐享巨大BTCFi 市场红利

石头财经

从0到1:兼职招聘小程序开发笔记(一)

CC同学

电力电子技术实现电能变换与控制的原理

芯动大师

DC-DC 电源 电力变换

《自动机理论、语言和计算导论》阅读笔记:p115-p138

codists

编译原理

IBM SPSS Statistics 27 功能强大、操作简便的统计分析软件

Rose

spss数据统计 IBM SPSS Statistics下载 IBM SPSS Statistics 27

分享一个自己做的可视化代码生成器

LazyCoder

低代码平台 代码生成器 代码可视化

MTMT质押活动即将开启,用户最高可获得100%APY增值

股市老人

过 IntelliJ IDEA 对 containerd 进行源码级调试

GousterCloud

容器 云原生 Containerd IDEA DeBug

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章