写点什么

MapReduce 是倒退:拿它与关系数据库比较公平吗?

  • 2008-01-19
  • 本文字数:661 字

    阅读完需:约 2 分钟

最近 David J. DeWitt 和 Michael Stonebraker 在 the Database Column 上写了一篇文章试图将日益流行的 MapReduce 编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce 代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从 40 年前 IBM 第一次在 1968 年发布 IMS 时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑 MapReduce 应用程序能有多大伸缩性。此外,MapReduce 的实现者应该好好学习近 25 年来的并行 DBMS 研究文献。

文章接着给罗列了如下判据:

  • MapReduce 是一个糟糕的实现(与 B-trees 相比)
  • MapReduce 不是革新
  • MapReduce 缺乏某些特性(如装载和索引)
  • MapReduce 与 DBMS 工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen 进行了逐条反驳。在这些条目中,他指出 MapReduce 不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen 建议更好的比较对象应该是 SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的 SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta 从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢 10 倍,不牢靠的廉价货最终也会胜出。想想 Linux 对阵 AT&T 的 Unix,或 mysql 对阵 Oracle……

关于这篇文章冗长的争论和评论还可以从 reddit ycombinator 上找到。

查看英文原文: MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

2008-01-19 04:381969
用户头像

发布了 150 篇内容, 共 46.7 次阅读, 收获喜欢 10 次。

关注

评论

发布
暂无评论
发现更多内容

写作平台一周年-感谢曾经的自己

数据社

InfoQ 写作平台 1 周年 人气作者 TOP10

一文带你了解华为云GaussDB的五大黑科技

华为云开发者联盟

数据库 华为云 GaussDB(for Influx) 时间线 tpmC

ceph-csi源码分析(3)-rbd driver-服务入口分析

良凯尔

Kubernetes 源码分析 Ceph CSI

耗时5小时,用低代码搭了2套应用,我才明白它为什么能火了

优秀

低代码 低代码开发 低代码开发平台 低代码平台

漫游语音识别技术——带你走进语音识别技术的世界

攻城先森

深度学习 学习 音视频 nlp 语音识别

弱网下的极限视频通信学习感悟!

txp

音视频

客服中心简单分析

zzz

First Unique Character in a String 的变种问题返回第一个找到符合条件的字符

HoneyMoose

北美一工作搜索引擎公司技术岗面经

HoneyMoose

话题讨论|三大运营商Q1业绩大增,5G开始收割?

程序员架构进阶

5G 话题讨论 28天写作 4月日更 通信运营商

一房地产数据服务初创公司的面经

HoneyMoose

图的学习总结

Nick

数据结构 数据结构与算法

LeetCode题解:191. 位1的个数,位运算,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

奋力前行,感谢有你

IT蜗壳-Tango

IT蜗壳 人气作者 TOP10

软件 IT 专业大学生职业方向情况调查

李孟聊AI

大学生日常 IT 大学生

NumPy之:数据类型对象dtype

程序那些事

Python 数据分析 Numpy 程序那些事

人类视觉神经科学助力音视频产业革命-弱网下的极限实时通信

张音乐

音视频 笔记 弱网下的极限实时视频通信

Faiss源码剖析:类结构分析

华为云开发者联盟

机器学习 KNN Faiss 类结构 Quantizer

Dubbo 注册中心

青年IT男

dubbo

如果你不知道从哪本书开始阅读,那就从这本开始吧

小天同学

读书 好书推荐 读后感 4月日更

Python3 print变量打印输出功能后面隐含的几个知识点

老猿Python

Python print str repr

Kubernetes 上如何控制容器的启动顺序?

张晓辉

Kubernetes istio

vue+webpack+vue-cli

Vue js 打包 webpack vuecli

笔记分享--弱网下的极限实时视频通信

攻城先森

音视频 端到端 #弱网 极限视频通信

golang单元测试踩坑系列(一)

geange

单元测试 Go 语言

ceph-csi源码分析(4)-rbd driver-controllerserver分析

良凯尔

Kubernetes 源码分析 Ceph CSI

弱网下的极限实时视频通信

疯狂的驸马

音视频 编码 极限视频通信

【一定要看哦】转瞬之间的成长,传播知识的梦想(赠予极客邦【1周年】)

洛神灬殇

程序人生 1 周年盛典 InfoQ 写作平台 1 周年 InfoQ 的朋友们

uni-app rtm插件集成指南及常见问题--iOS

anyRTC开发者

uni-app ios 音视频 WebRTC sdk

中国区块链产业全景图

CECBC

技术应用

让宝妈宝爸告别安全顾虑,区块链构建母婴行业新生态

CECBC

母婴

MapReduce是倒退:拿它与关系数据库比较公平吗?_Java_Scott Delap_InfoQ精选文章