写点什么

MapReduce 是倒退:拿它与关系数据库比较公平吗?

  • 2008-01-19
  • 本文字数:661 字

    阅读完需:约 2 分钟

最近 David J. DeWitt 和 Michael Stonebraker 在 the Database Column 上写了一篇文章试图将日益流行的 MapReduce 编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce 代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从 40 年前 IBM 第一次在 1968 年发布 IMS 时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑 MapReduce 应用程序能有多大伸缩性。此外,MapReduce 的实现者应该好好学习近 25 年来的并行 DBMS 研究文献。

文章接着给罗列了如下判据:

  • MapReduce 是一个糟糕的实现(与 B-trees 相比)
  • MapReduce 不是革新
  • MapReduce 缺乏某些特性(如装载和索引)
  • MapReduce 与 DBMS 工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen 进行了逐条反驳。在这些条目中,他指出 MapReduce 不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen 建议更好的比较对象应该是 SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的 SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta 从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢 10 倍,不牢靠的廉价货最终也会胜出。想想 Linux 对阵 AT&T 的 Unix,或 mysql 对阵 Oracle……

关于这篇文章冗长的争论和评论还可以从 reddit ycombinator 上找到。

查看英文原文: MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

2008-01-19 04:381892
用户头像

发布了 150 篇内容, 共 45.4 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

GraphScope v0.12.0 版本发布

6979阿强

大数据 图计算 GraphScope 图分析 图数据

一文带你搭建RocketMQ源码调试环境

悟空聊架构

RocketMQ 4月日更 悟空聊架构 4月月更

云风:不加班、不炫技,把复杂的问题简单化

博文视点Broadview

周日直播|OpenMLDB Pulsar Connector,高效打通实时数据到特征工程

Apache Pulsar

开源 架构 云原生 Apache Pulsar 消息中间件

从安装到编译: 10分钟教你在本地使用和开发GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

用 GraphScope 像 NetworkX 一样做图分析

6979阿强

大数据 图计算 GraphScope 图分析 图数据

基于机器学习算法的钢材缺陷检测分类

Peter

Python 决策树 随机森林 集成学习 LightGBM

企业如何进行信息化

秋去冬来春未远

数字化 信息化管理 如何信息化 信息化规律

如何在Unity中免费制作游戏

龙智—DevSecOps解决方案

Unity Perforce Helix Core

web前端培训学习需要掌握哪些 Linux 命令

@零度

前端开发

读《Software Engineering at Google》(04)

术子米德

架构师成长笔记

seaborn绘制箱型图

Peter

可视化 数据可视化 seaborn

[Day14]-[动态规划]四键盘问题

方勇(gopher)

LeetCode 数据结构与算法、

读《Software Engineering at Google》(03)

术子米德

架构师成长笔记

使用 Helm 部署 GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

通过质量内建,提高交付质量

老张

软件测试 质量内建 交付质量

react源码解析12.状态更新流程

buchila11

React

Docker容器简介、优缺点与安装

乌龟哥哥

4月月更

TypeScript基础学习

乌龟哥哥

4月月更

半导体行业如何保持高效远程办公?因果集群(Causal Clustering)了解一下!

龙智—DevSecOps解决方案

远程办公 因果集群

EventBridge 特性介绍|以 IaC 的方式使用 EventBridge

阿里巴巴云原生

在 K8s 上运行 GraphScope

6979阿强

大数据 图计算 GraphScope 图分析 图数据

万字长文:直击关于Docker所必须了解的知识

穿过生命散发芬芳

Docker 4月月更

Atlassian应对CVE-2022-22963,CVE-2022-22965的常见问题

龙智—DevSecOps解决方案

Atlassian CVE-2022-22963 CVE-2022-22965

react源码解析11.生命周期调用顺序

buchila11

React

自己动手写Docker系列 -- 5.8实现容器制定环境变量运行

Go Docker 4月月更

面试突击39:synchronized底层是如何实现的?

王磊

Java java面试

Python 报错 ValueError list.remove(x) x not in list 解决办法

AlwaysBeta

Python 编程

基于卷积神经网络的猫狗识别

Peter

机器学习 深度学习 tensorflow keras

jupyter notebook换皮肤

Peter

Python 机器学习 数据分析 Jupyter Notebook

Linux驱动开发-编写W25Q64(Flash)驱动

DS小龙哥

4月月更

MapReduce是倒退:拿它与关系数据库比较公平吗?_Java_Scott Delap_InfoQ精选文章