写点什么

Greenplum Pivotal HD 结合了 SQL 和 Hadoop 的优势

  • 2013-03-01
  • 本文字数:1035 字

    阅读完需:约 3 分钟

EMC Greenplum 宣布了一个新的 Hadoop 发行版本—— Pivotal HD ,其中包含一个完全运行于 HDFS 之上的 MPP 数据库,兼容 SQL,而且速度“比 Hive 快数百倍”。

Pivotal HD 支持标准 Hadoop 发型版本的常用特性(包括 HDFS、Pig、Hive、Mahout 和 Map-Reduce 等),但又加入了一些其他的组件,具体如下面结构图所示:

Pivotal 的主要组件是 HAWQ ,这是一个 MPP(Massively Parallel Processing)关系数据库,借助一种动态流水线机制直接运行于 Hadoop 中的 HDFS 之上,其特性包括:

  • 兼容 SQL——支持各个版本的 SQL,包括 SQL92、SQL99 和 SQL 2003 OLAP 等。百分之百兼容 PostgreSQL 8.2。
  • 面向行或面向列的数据存储。
  • 查询优化器——查询可以运行于成千上万个节点上。
  • 完全兼容 ODBC/JDBC。
  • 交互式查询——大数据集上的复杂查询可以以秒级或次秒级的速度解决。
  • 数据管理——提供了表统计和表安全等功能。
  • 支持存储在 HDFS、Hive、HBase、Avro、ProtoBuf、分隔的文本和序列化文件中的数据。
  • 深度分析——包含了数据挖掘和机器学习算法。

Greenplum 的高级技术总监 Gavin Sherry 做了一个演示(见该视频的42 分42 秒),在60 个节点组成的HDFS 集群上,有总量达几个TB 的10 亿行数据,下列SQL 语句可以在13 秒内执行完,这提供了接近实时的能力:

<p>SELECT gender, count (*)<br></br>FROM retail.order JOIN customers ON retail.order.customer_ID = customers.customer_ID<br></br>GROUP BY gender;</p>据 EMC Greenplum 的解决方案架构师 Donald Miner 介绍,“ HAWQ 比 Hive 快数百倍”,下图是 Greenplum 提供的基准测试结果( PDF ):

HAWQ 能够在“次秒级别内”解决查询问题,“同时做到了在同一引擎内支持规模更大的数据集和完整的 SQL 表达能力”。Miner 解释了这是如何做到的:

我们有所谓的“分段服务器(segment server)”来管理每个表的一个分片。集群中的每个数据节点上会运行一些分段服务器。不过这种数据分片是完全保存在 HDFS 内的。有一个“主节点”负责存储顶层元数据、构建查询计划并将节点本地的查询推送到分段服务器上。

在查询启动时,数据将从 HDFS 中读出并加载到 HAWQ 执行引擎中。HAWQ 遵循 MPP 架构,不同于将数据溢出到磁盘上和在磁盘上建立检查点(如 MapReduce),它会让数据流过流水线的不同阶段。另外,分段服务器是一直运行的,所以不存在启动时间。

Pivotal HD 有三个版本( PDF ):企业版、数据库服务版和用于评估的社区版。
查看英文原文: Greenplum Pivotal HD Combines the Strengths of SQL and Hadoop

2013-03-01 02:296265
用户头像
臧秀涛 略懂技术的运营同学。

发布了 300 篇内容, 共 140.0 次阅读, 收获喜欢 35 次。

关注

评论

发布
暂无评论
发现更多内容

COD6射击游戏推荐:使命召唤6 现代战争 for Mac/win 中文版

你的猪会飞吗

Mac游戏下载 好玩的游戏推荐

Spring高手之路19——Spring AOP注解指南

砖业洋__

Java spring 后端 aop

三菱课堂笔记 MELSEC L系列基础

万里无云万里天

自动化 三菱

吉他谱反复记号有哪些 Guitar Pro如何加吩咐标记

阿拉灯神丁

吉他学习 吉他谱 Guitar Pro8 软件下载

7天爆拉100倍,解读以太坊ERC-404协议,埋伏赚钱机会!

区块链开发团队DappNetWork

Chain-of-Thought真能提高大模型的推理能力吗?

算AI

人工智能 NLP 大模型

三菱课堂笔记 MELSENSOR基础(激光位移传感器版)

万里无云万里天

自动化 三菱

数智领航 云启未来|华为云618营销季全面启动

YG科技

苹果电脑vm虚拟机下载:VMware Fusion Pro for mac v13.5.0专业激活版

你的猪会飞吗

VM虚拟机破解版 Mac好用的软件推荐

不只是程序员的专利:Python为何成为全民编程语言?

程序员晚枫

Python 数字化 智能化 电子化

用常用组件感恩父亲节

坚果

HarmonyOS HarmonyOS框架

以太坊现货ETF通过,市场行情并不买账,ETF的故事到头了?

区块链开发团队DappNetWork

如何设计一个秒杀系统?

Java随想录

Java 高并发 秒杀

三菱课堂笔记 MELSEC Q系列基础

万里无云万里天

自动化 三菱

三菱课堂笔记 PLC维护

万里无云万里天

自动化 三菱

视频剪辑可以赚钱吗 快速学会视频剪辑的方法 会声会影视频制作教程

阿拉灯神丁

视频剪辑处理 视频课 会声会影2023 音乐软件 视频剪辑软件

PS Raw增效工具:Camera Raw 16 for mac 中文版

你的猪会飞吗

Mac插件 ps插件

三菱课堂笔记 PLC入门

万里无云万里天

自动化 三菱

币圈六大历史惨案,519将至暴跌还是暴涨?

区块链开发团队DappNetWork

区块链 交易所开发软件开发 nft卡牌 dapp合约开发

中小企业转型有招,华为云618营销季步步“智”胜

YG科技

Greenplum Pivotal HD结合了SQL和Hadoop的优势_DevOps & 平台工程_Abel Avram_InfoQ精选文章