写点什么

Hadoop 即服务提供商 Qubole 现在运行在 Google Compute Engine 上

  • 2013-12-29
  • 本文字数:1088 字

    阅读完需:约 4 分钟

Qubole 是一家托管的 Hadoop 即服务提供商,用户现在能够在 Google Compute Engine(GCE)上使用该服务了。在这之前 Qubole 只能在 Amazon 的 AWS 上使用,在 Google 宣布对公众开放 GCE 之后不久 Qubole 就宣布了这一消息。

社区对该消息的反映大部分都是积极的,人们好像认为大数据主题会成为 GCE 潜在的杀手级应用。来自于 DataStax 的 Alex Popescu 这样写道:

如果你仔细看看这些内容,那么你将会注意到这样一个主题:覆盖来自于任意角度的数据;使用 DataStax 的 Cassandra/DSE 处理 OLTP,使用 DataTorrent 进行流处理,Qubole 用于 Hadoop,MapR 用于 Hadoop 这样的解决方案。我能够看见这种情况持续了一段时间,同时正在让 Google Compute Engine 成为 Amazon Web 服务的一个强力竞争者。

Hadoop 即服务(HaaS 也被称为云端 Hadoop)也带来了一些不同的选项:

  • 动摇你自己的部署,也就是在一个像 GCE 或者 EC2 这样的 IaaS 平台上安装 Apache Hadoop 或者一个分布式服务(例如 Cloudera、Hortonworks、MapR)。这样能够对运行的服务进行细粒度的控制,但是也带来了部署和管理上的复杂性。
  • 预打包的服务,例如 Amazon 的 EMR 或者 Savvis 的大数据服务,该服务有助于降低部署复杂性并且为已安装的服务提供中层控制。
  • 托管的 HaaS,例如 Qubole 和 Mortar ,有希望降低部署和管理的复杂性

与本地部署相比 HaaS 的关键区别在于:弹性、现货定价、计算和存储之间的分离(例如像Amazon S3 或者 Google 云存储这样的最终一致性对象存储)和增强的安全标准。像 Qubole 这样的托管 HaaS 服务往往用于开发场景,用于评估和测试、短暂运行的分析工作以及实现混合云设置。但是它们也有各自的一些限制:

  • 将数据放入云端同时再次将其从云端取出都有它们各自的价格标记。
  • 由于法律规定可能会涉及到隐私和数据保护问题,这可能会阻止或者限制用例。
  • 24/7 操作的 TCO 必须在具体分析的基础上进行计算。
  • Hadoop、Hive 等服务和最终一致性对象存储一般会存在不匹配的情况。

Ashish Thusoo 和 Joydeep Sen Sarma 在 Facebook 工作期间丰富了自己运行 Hadoop 和 Hive 的经验,在那里他们管理着一个数据基础设施团队。然后,在 2012 年 6 月,他们创建了 Qubole ,并且在 2013 年 4 月获得了 700 万美元的 A 轮融资。Joydeep 深入介绍了他们在实现自己的 HaaS 服务时所面对的挑战,同时在他的 Hive London Meetup 谈话“云友好的Hadoop 和Hive ”中还对内部原理做了讲解。另外,Christian Prokopp (Rangespan 的数据科学家) 最近还写了一个详细的纲要以及Qubole 与EMR 之间的对比。

查看英文原文: Hadoop-as-a-Service Provider Qubole Now Runs on Google Compute Engine

2013-12-29 22:151535
用户头像

发布了 321 篇内容, 共 121.3 次阅读, 收获喜欢 19 次。

关注

评论

发布
暂无评论
发现更多内容

区块链交易所APP开发|区块链交易所系统软件开发

系统开发

虚拟币钱包APP系统开发|虚拟币钱包软件开发

系统开发

Nginx架构赏析

旺旺

nginx 架构 中间件

深入理解MVCC与间隙锁

林一

MySQL MVCC

Scrum Patterns:Sprint计划会(译)

Bruce Talk

敏捷 译文 Agile Scrum Patterns

算法:匹配有效的括号,Swift 5中UITest从入门到精通, Swift 5 Viper Template,极客大学产品经理训练营 产品思维和产品意识, John 易筋 ARTS 打卡 Week 36

John(易筋)

ARTS 打卡计划 极客大学产品经理训练营 Swift 5 UITest Swift 5 Viper Template

五分钟学会模板模式

田维常

mybatis

关于价值、目标、任务的思考

L3C老司机

自动泊车初步了解 (28天写作 Day17/28)

mtfelix

自动驾驶 28天写作 自动泊车

泪目!为什么Flutter能最好地改变移动开发?成功收获美团,小米安卓offer

欢喜学安卓

android 程序员 面试 移动开发

商务部CECBC区块链专委会副主任、数字经济商学院院长吴桐:建立完善稳健的基础设施 加速区块链与产业深度融合

CECBC

区块链

第二次作业

秦挺

产品 0 期 - 第二周作业

Jxin

老师讲的真棒!2021Android精选面试实战总结整理,分享PDF高清版

欢喜学安卓

android 程序员 面试 移动开发

Dockerfile ENV 使用指南

K8sCat

Docker Dockerfile ENV ARG

一文带你读懂:设计模式的六大原则

后台技术汇

28天写作

第4周总结-系统架构

潘涛

架构师训练营 4 期

重学JS | ES6既有Set,为啥还要有Weak Set?

梁龙先森

JavaScript 大前端 编程语言 28天写作

人民日报——大力发展数字经济

CECBC

数字经济

优雅编码 | 18个Javascript代码的小技巧

devpoint

代码优化 优雅

「产品经理训练营」作业02:利益相关方识别

狷介

产品经理训练营

CSS(二)——CSS核心基础

程序员的时光

CSS 程序员 七日更 28天写作

高效学习:如何学得更快更好

石云升

学习 28天写作

能源革命背后的牛公司 (28天写作 Day16/28)

mtfelix

28天写作 能源革命

“区块链+产业应用”系列研讨会首场“大健康产业篇”在深圳举行

CECBC

健康产业

架构师训练营 4 期 第4周

引花眠

架构师训练营 4 期

「架构师训练营 4 期」 第四周 - 001

凯迪

「产品经理训练营」第二章作业

Sòrγy_じò ぴé

产品经理训练营 极客大学产品经理训练营 产品训练营

企业是如何选择技术栈来做离线数仓

大数据老哥

C++静态链接符号冲突的几种处理方法

ElvinYang

第4周课后练习-系统架构

潘涛

架构师训练营 4 期

Hadoop即服务提供商Qubole现在运行在Google Compute Engine上_DevOps & 平台工程_Michael Hausenblas_InfoQ精选文章