写点什么

Apache 基金会主席 Doug Cutting 谈 Hadoop 和开源

  • 2012-01-17
  • 本文字数:1457 字

    阅读完需:约 5 分钟

在 2011 年 12 月 2 日举办的 Hadoop In China 2011 大会上, Apache 软件基金会主席 Doug Cutting 先生来到了中国,并做了有关开源和 Hadoop 的演讲。会前,InfoQ 中文站对 Doug Cutting 先生进行了专访。

Doug 是多个成功开源项目的创立者,包括 Lucene、Nutch 和 Hadoop。Doug 于 2009 年从 Yahoo! 加入 Cloudera,当时他所在的团队构建并部署了生产环境的 Hadoop 存储和分析集群,完成关键任务的业务分析,他是团队的主要成员。Doug 拥有斯坦福大学的学士学位,同时是 Apache 软件基金会董事会成员。

InfoQ**:Doug先生,非常欢迎您来到中国,您能先做个简单的自我介绍吗?**

Doug我叫 Doug Cutting,是一名软件开发人员,在硅谷工作多年。大概 11 年前,我开始做开源软件方面的工作。首先参与了 Lucene 搜索项目。后来,Lucene 被带到了 Apache 软件基金会中,我就在其中从事开源工作了,那是 10 年前。此后,我开始了又一个项目—— Nutch ,这也是一个 web 搜索技术;然后就是 Hadoop ,这个后来非常成功的项目。 过去 5 年左右,我一直在做 Big Data 和存储处理方面的工作。

InfoQ**:在您看来,人们使用Hadoop遇到的最大障碍是什么?您能提供一些建议让大家克服这些障碍么?**

Doug教育问题,在我看来是最大的问题。 使用 Hadoop,需要不同的思考和计算方式,现在也已经有了一些书籍和课程,能够帮大家克服这些问题。随着理解它的人越来越多,我相信传播得也会越来越快。是有一些技术上的障碍和社会层面上的障碍,不过这些问题解决起来更容易,因为技术和相关社区都在发展。但是首先人们要明白 Hadoop 背后的机制。

InfoQ**:对于大规模应用来说,监控非常重要。说到监控运行Hadoop的应用,您能列举出最重要的三个监控指标吗?还有您选择这三个的原因?**

DougHadoop 的目标是以低成本、高效率的方式来做事情。你的硬件使用率是一个很好的指标,比如 CPU 的使用率、磁盘的使用率等等,你有没有完全把资源的利用起来。

与其一起的,你还希望利用高效的算法,当然,这很难监控,需要在一开始就想清楚。一旦开始运行后,要保证所有的资源都能高效利用,有时候很困难,需要在分布式系统里的输入、输出、计算这三者之间取得平衡。这些是最底层要监控的东西。

当然,还有错误和失败等等,这些也是很重要的东西。分布式系统内的调试要更为困难。知道什么时间、哪里出了问题,此类报表对于寻找问题根源是很有帮助的。 同时,某些应用的特定报表也很重要,比如把某些运行进度报告给用户。

InfoQ:接下来是关于开源软件的问题:从技术角度看,您认为哪个开源项目将会成为下一个“超级巨星”?

Doug我想 HBase 正在不断吸引更多眼球,它在变得越来越稳定、性能越来越高效。我对于 HBase 的进展非常兴奋,我想很多机构将来都会用到它,从中获得价值。

InfoQ:您有很多开源项目方面的经验,能否介绍下您如何激励大家参与开源项目、并为其不断做出贡献?

Doug最重要的事情,是倾听其他人,试图理解他们为什么要做某些事情。我们每个人都很自然地把注意力放在自己的需要上。要想一起协作做某些事情,我们必须理解其他人的需求。所以,有礼貌地倾听、理解、接受其他人的需求,并试图找出大家可以一起工作的方式方法,这是开源项目中最重要的技能。

Doug Cutting 先生在本次大会上的两个演讲也将在不久后在 InfoQ 中文站上发布,请大家保持关注。

被采访的视频,请访问优酷版本


给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2012-01-17 21:236126
用户头像

发布了 479 篇内容, 共 159.4 次阅读, 收获喜欢 50 次。

关注

评论

发布
暂无评论
发现更多内容

Java运算符、标识符以及进制

timerring

Java

阿里巴巴内部Spring Cloud Alibaba 全彩 PDF 版手册开源

采菊东篱下

Java 微服务

4月22日,云数据库技术沙龙【杭州站】

NineData

MySQL 数据库 开发者 Clickhouse 沙龙预告

ps2022电脑配置要求 PS2022下载

理理

ps2022电脑配置要求 PS2022下载

解密HTTP协议:探索其组成部分与工作原理

做梦都在改BUG

Java 计算机网络 网络协议 HTTP

未来已来,OpenHarmony 3.2 Release发布,迈入发展新阶段

OpenHarmony开发者

OpenHarmony

AI日课@20230411:Prompt的三个层次和三个“万万没想到!”

无人之路

ChatGPT

NPlayer最新版本下载 Mac视频播放神器

理理

mac视频播放器 nPlayer for Mac NAS局域网视频播放神器 nplayer 下载

MySQL索引数据结构入门

江南一点雨

Java MySQL

【实践篇】基于CAS的单点登录实践之路

京东科技开发者

CAS SSO 单点登录 企业号 4 月 PK 榜

百度工程师的软件质量与测试随笔

百度Geek说

测试 软件质量 测试技术 智能测试 企业号 4 月 PK 榜

🔥笔耕不辍,筑梦前行,三周年连更活动来啦!

InfoQ写作社区官方

热门活动 三周年连更

After Effects新手教程|如何对素材进行整理与预览

理理

ae 2021中文版 After Effects破解版 After Effects教程 AE最新版下载

在桌面养只捣蛋鹅 Desktop Goose让你的mac桌面更有趣!

理理

抖音桌面宠物鹅 桌面宠物鸭 Mac版 Desktop Goose怎么关闭 Desktop Goose下载

Spring源码探索-核心原理下(AOP、MVC)

Java你猿哥

spring aop Spring MVC

一文解读基于PaddleSeg的钢筋长度超限监控方案

飞桨PaddlePaddle

人工智能 图像识别 飞桨

【异常解决】UnknownHostException: api.weixin.qq.com 的解决方案

No8g攻城狮

小程序 微信 Java EE

【深入了解系统性能优化】「实战技术专题」全方面带你透彻探索服务优化技术方案(方案篇)

洛神灬殇

性能优化 JVM 软件开发 4月日更 编程体系

实用技术宝典:MAC地址格式转换多种实现方式

小毛驴的烂笔头

linux命令 linux运维

从GitHub火到了头条!共计1658页的《java岗面试核心》,拿走不谢

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

Redis分布式锁一定注意两个坑

做梦都在改BUG

Java redis 分布式锁

如何调整和优化Go程序的内存管理方式?

Jack

AutoCAD安装无响应,需要在macOS上完全卸载Autodesk产品!

理理

cad2024激活版 AutoCAD安装无响应 AutoCAD M1

OceanBase 4.1 发版 | 一个面向开发者的里程碑版本

OceanBase 数据库

数据库 oceanbase

Xmind新手指南之如何插入主题元素?Xmind2022下载

理理

Xmind 2022 mac思维导图 XMind教程

Hybrid App 选用什么前端框架更好

Onegun

flutter React Native Hybrid

Github发布6天,Star55K+,这套笔记足够你拿下90%的Java面试

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

Java 源码重读系列之 HashMap

U2647

源码 hash map #java

Kubernetes 本地持久化存储方案 OpenEBS LocalPV 落地实践下——原理篇

江湖十年

后端 #Kubernetes# Go 语言

CUDA编程基础与Triton模型部署实践

阿里技术

cuda 模型部署

如何把Ai绘画工具放到我们的App中

Onegun

AI AIGC

Apache基金会主席Doug Cutting谈Hadoop和开源_开源_郑柯_InfoQ精选文章