写点什么

大数据 Hadoop 解决方案:2014 年第 1 季度形势

  • 2014-03-18
  • 本文字数:1470 字

    阅读完需:约 5 分钟

根据最新的 Forrest 报告,有很多公司都在努力挖掘他们拥有的大量数据,包括结构化、非结构化、半结构化以及二进制数据等,探索对数据的深入利用。下面是报告结论的其中一点:

大多数公司估计他们只分析了已有数据的 12%,剩余 88% 还没有被充分利用。大量的数据孤岛和分析能力的缺乏是造成这种局面的主要原因。另外一个难题是如何判断数据是否有价值。尤其是在大数据时代,你必须采集并存储这些数据。一些看起来与业务无关的数据,如手机 GPS 数据,将来也可能是座金矿。

所以,大量公司都寄希望于使用 Hadoop 解决如下难题:

  • 采集并存储与公司业务职能相关的所有数据。
  • 支撑先进的分析功能,包括商业智能,采用现代方式对数据进行先进的可视化和预测性分析。
  • 将数据快速分享给所需之人。整合多个数据孤岛帮助组织解答以前根本没人提过,甚至是未知的复杂问题。
  • 容纳持续增长的数据量和新数据源。Hadoop 支持解决方案规模的快速、有效扩大,使不断增长的容量、速度以及多样的数据尽在公司的把控之中。

根据报告的内容,Hadoop 的购买周期正处于上升阶段,因此在该领域催生了越来越多的厂商。尽管 Hadoop 是 Apache 的开源项目,任何人都可以免费下载,但大多数消费者还是倾向于采用厂商的打包方案。除了将所有的 Hadoop 组件打包并保证其能正常使用(兼容版本)之外,厂商一般还会提供企业级支持和扩展:以 Apache Hadoop(Common,HDFS,MapReduce )作为方案的核心组件,搭配额外实现增强 Hadoop 的功能,并增加差异化功能使其解决方案更具吸引力。

Forrester 的报告详细介绍了 9 家厂商:Amazon Web Services、Cloudera、Hortonworks、IBM、Intel、MapR 科技、Microsoft、Pivotal 软件和 Teradata,并根据以下指标对这些厂商进行了评测:

  • 现有产品,包括解决方案架构、数据和处理功能、安装、管理、监控工具、兼容性和社区成熟度等方面。
  • 战略,包括厂商在满足当前客户需求和弥补企业部署方面的计划。对战略的评测包括股权并购、内部战略的执行能力、产品路线图以及对客户的支持能力等。
  • 市场占有率,包括公司的财务,全球占有率,安装基数,与其他软件厂商、专业服务厂商以及软件即服务(Saas)/ 云 / 托管提供商之间的战略合作关系等。

报告的主要研究结果如下:

  • 厂商众多,但是并没有占主导地位的厂商。

在此次大数据 Hadoop 解决方案评测中,领导厂商有 Amazon Web Services、Cloudera、Hortonworks、IBM、MapR 科技、Pivotal 软件和 Teradata。这些厂商都是基于 Apache 开源项目,然后增加打包、支持、集成等特性以及自己的创新等内容以弥补 Hadoop 在企业中的短板。所有厂商都实现了这些功能,尽管方式略有不同——从各厂商的评测得分和厂商资料可见一斑。

  • 新晋厂商的解决方案也有不俗的表现。

在此次大数据 Hadoop 解决方案评测中,表现强劲的厂商有 Intel 和 Microsoft。Microsoft 为 HDInsight 产品制定了强劲的路线图,使其竞争力不亚于其他领导厂商。Microsoft HDInsight 为 Azure 进行了特殊优化,所以对于那些想要在 Azure 上实现 Hadoop 的 Microsoft 客户来说,它是最好的解决方案。而 Intel 将其创新能力聚焦于芯片级,如果它想将其产品打造成企业级解决方案,还需要加强其战略和企业工具。

根据该报告,虽然此次对大数据 Hadoop 解决方案市场的评测只是一个开始,但是对于那些努力摆脱复杂的 Hadoop 厂商局面的公司而言,该报告提供了很好的参考信息。


感谢孙镜涛对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作,请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博( @InfoQ )或者腾讯微博( @InfoQ )关注我们,并与我们的编辑和其他读者朋友交流。

2014-03-18 07:463043
用户头像

发布了 28 篇内容, 共 10.9 次阅读, 收获喜欢 0 次。

关注

评论

发布
暂无评论
发现更多内容

架构实战营 - 模块 2- 作业

笑春风

rtsp系列专题(一)之rtsp服务器搭建

txp

音视频 音频技术

SQL 子查询怎么优化?写的很深的这种!

xcbeyond

sql SQL优化 4月日更

重读《重构2》- 函数组合成变换

顿晓

重构 4月日更

架构实战营 模块二 总结

Pitt

架构实战营 模块二

Keyto

微信朋友圈高性能复杂度分析设计

贯通

#架构实战营

一种特殊的树—堆

Nick

数据结构

算法训练营 - 学习笔记 - 第三周

心在飞

作业 - 分析一下微信朋友圈的高性能复杂度

sN0wpeak

架构实战营

Java-技术专题-CountDownLatch的介绍和使用

码界西柚

Java AQS CountDownLatch JUC

架构实战营模块2作业

白发青年

架构实战营

Mac 新手使用技巧|从 Windows 换到 Mac,真没有想象中的那么难。

彭宏豪95

macos 效率 Mac windows 4月日更

模块二-微信朋友圈的高性能复杂度

华仔架构训练营

架构师实战营 模块二作业 微信朋友圈高性能架构分析

小遵

架构实战营模块 2 作业

梦寻解语花

架构实战营

Golang interface and error handle

escray

学习 极客时间 Go 语言 4月日更

微信朋友圈架构设计

Vincent

#架构实战营

【LeetCode】删除有序数组中的重复项Java题解

Albert

算法 LeetCode 4月日更

架构实战营-M02H

b1a2e1u1u

微信朋友圈 高性能分析

return

架构实战营模块二作业

hunk

架构实战营

【架构实战营】模块2作业

dragonboa

我是如何从零开始学Python:(2)如何解决安装和检查Python版本遇到的问题?

广之巅

Python 4月日更

Linux tail 命令

一个大红包

4月日更

朋友圈复杂度分析

鲲哥

有阳光的地方就会有影子

小天同学

公平 个人感悟 社会百态 4月日更

模块二作业

梦寐凯旋

Ansible 安装

耳东@Erdong

ansible 4月日更

「架构实战营」第二次作业

高亮

架构实战营

架构实践二

颜培攀

架构实战营

大数据Hadoop解决方案:2014年第1季度形势_DevOps & 平台工程_Boris Lublinsky_InfoQ精选文章