Hadoop 是 Apache 开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook 和 Yahoo 等等。本文是 Hadoop 入门实践三部曲的第一部,主要讲述了 What 和 Why 的问题。
什么是 Hadoop 呢?
Hadoop 框架中最核心的设计就是:MapReduce 和 HDFS。MapReduce 的思想是由 Google 的一篇论文所提及而被广为流传的,简单的 一句话解释 MapReduce 就是“任务的分解与结果的汇总”。HDFS 是 Hadoop 分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。
为什么要使用 Hadoop 呢?
1、可扩展:不论是存储的可扩展还是计算的可扩展都是 Hadoop 的设计根本。
2、经济:框架可以运行在任何普通的 PC 上。
…
…
详细内容,请阅读全文:分布式计算开源框架Hadoop 介绍。
作者介绍:岑文初,就职于阿里软件公司研发中心平台一部,任架构师。当前主要工作涉及阿里软件开发平台服务框架(ASF)设计与实现,服务集成平台(SIP)设计与实现。没有什么擅长或者精通,工作到现在唯一提升的就是学习能力和速度。个人Blog 为: http://blog.csdn.net/cenwenchu79 。
参与 InfoQ 中文站内容建设,请邮件至 editors@cn.infoq.com 。也欢迎大家到 InfoQ 中文站用户讨论组参与我们的线上讨论。
评论