QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

不同实时 Hadoop 实现之间竞争升温

  • 2013-02-27
  • 本文字数:782 字

    阅读完需:约 3 分钟

自从 Google 的 Dremel 论文发表以来,Hadoop 社区已经在尝试围绕 Hadoop 实现类似功能。首先出现的是 OpenDremel ,目前它已经是 Apache Drill 的一部分,而后者已于去年成为 Apache 孵化项目。之后,也是在去年,Cloudera 引入了 Impala ,目前仍处于 beta 状态,它还是 Cloudera Hadoop 发布版——CDH 4.1 的一部分。

Stinger Initiative 是该领域新的竞争者,由 Hortonworks 于上周引入 Apache 的孵化过程,其目标是:

让 Hive 能在人的响应时间内处理很多用例(也就是 5-30 秒这一区间范围内的查询)——如大数据的查看、可视化和参数化报表——而无需安装、维护和学习其他工具,这能够为拥有 Hive 技巧和投资的大型社区带来很多价值。

Hortonworks 打算通过以下手段实现该目标:

  • 改进 Hive 的 SQL 兼容性,包括支持 Hive 中没有的 SQL 类型和‘where’子句中的子查询。
  • 优化 Hive 的执行计划。
  • 支持新的 Hadoop 列格式 ORCFile(类似于 Dremel、Drill 和 Cloudera 的 Trevini )。
  • 引入基于 YARN 的新的运行时框架 Tez

Tez 是北印度语的“速度(speed)”,该项目还处于等待投票成为 Apache 孵化项目的阶段。它是:

……一种通用的、高度可定制的框架,用于简化 Hadoop 中数据处理任务的创建,支持小规模(低延迟)和大规模(高吞吐量)负载。通过提供为一个作业执行复杂 DAG(有向无环图)任务的能力,它将 MapReduce 范型推广为一种更强大的框架,这样 Apache Hadoop 生态系统中的项目(如 Apache Hive、Apache Pig 和 Cascading)就能满足人机交互响应时间和 PB 级规模极端吞吐量的需求了(无疑 MapReduce 是实现这一点的关键驱动因素)。

当前的三个“实时”Hadoop 查询实现——Drill、Impala 和现在的 Stinger 或是已经开源,或是很快就会开源,都将能够利用社区的支持和投入来解决实时 Hadoop 查询的重要问题。

查看英文原文 Competition between Real-time Hadoop Implementations Heats Up

2013-02-27 07:074438
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 136.5 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

JeecgBoot 如何集成 Spring AI

JEECG低代码

Cisdem PDFMaster for mac(专业PDF编辑转换器)v6.5.0激活版

Mac相关知识分享

祝贺!亚马逊云科技与伊克罗德信息签署为期4年市场拓展战略合作计划

伊克罗德信息科技

系统整容纪:用知识来"武装"自己~认识MySQL的锁与事务

京东科技开发者

记一次JSF异步调用引起的接口可用率降低

京东科技开发者

Project Office for mac(任务项目管理软件) 11.0激活版

Mac相关知识分享

云MES:数字化转型的引擎,企业上云的强力推手

万界星空科技

企业上云 mes 5G 企业上云 云mes 万界星空科技

用 AI 解锁技术调研的新姿势

京东科技开发者

万界星空科技MES中的仓库管理功能

万界星空科技

mes 云mes 万界星空科技 出入库管理 仓库管理

Transmit 5 for Mac(FTP客户端) 5.10.4中文版

Mac相关知识分享

(成功率稳定)京东商品详情API快速上手:初学者的实用指南

代码忍者

API API 文档 API 测试

Swish for Mac(MacBook触控板窗口管理) v1.10.3免激活版

Mac相关知识分享

360联合国内15个最强大模型推出“AI助手”碾压GPT4o!全球首部《人工智能法案》正式生效!|AI日报

可信AI进展

人工智能

高并发系统的艺术:如何在流量洪峰中游刃有余

京东科技开发者

【行云流水线】满足你对工作流编排的一切幻想~skr

京东科技开发者

高并发系统的艺术:如何在流量洪峰中游刃有余

京东科技开发者

基于人工智能的代码分析与 Bug 检测实战

测试人

软件测试

第七在线联手深服协:以科技之力,绘就时尚 AI 智能商品管理新篇章

第七在线

Network Performance Comparison for Industrial Automation Systems: IPQ9574 vs. IPQ6018

wallyslilly

​ 精选一款/开源MES生产制造执行系统

万界星空科技

mes #开源 开源mes 万界星空科技 mes源码

【YashanDB知识库】ycm托管数据库时报错OM host ip:127.0.0.1 is not support join to YCM

YashanDB

yashandb 崖山数据库 崖山DB

文献解读-遗传病-第二十六期|《癫痫的临床特征、诊疗和KCNH5突变》

INSVAST

基因测序 基因数据分析 遗传病 文献解读

JetBrains GoLand v2023.3.2中文密钥版 及详细安装教程

Rose

写在万粉千文的黎明前

FunTester

Principle for Mac(交互式UI原型设计神器) v6.33中/英文版

Mac相关知识分享

JetBrains IntelliJ IDEA 2020 中文无限试用版 Mac版 IDEA 2020下载安装

Rose

堡垒机应用发布功能是什么意思?有什么用?

行云管家

堡垒机 应用发布 堡垒机软件

如何确保 API 接口的稳定性和可靠性

Noah

轻松搞定工作汇报ppt!这3款AI软件值得拥有

彭宏豪95

效率工具 职场 办公软件 AIGC AI生成PPT

免费领取云主机,在华为开发者空间玩转YOLOV3

华为云开发者联盟

人工智能 云主机 目标检测 YoloV3 企业号 8 月 PK 榜

柳州等保测评机构有哪些?在哪里?

行云管家

等保 等保测评 柳州

不同实时Hadoop实现之间竞争升温_大数据_Boris Lublinsky_InfoQ精选文章