Pivotal 开源其大数据套件

Pivotal 决定开源其大数据套件和核心组件，并宣布成立 ODP（ Open Data Platform ）组织，ODP 旨在倡导和推进大数据领域的开源和标准化。

相比 HortonWorks、Cloudera 和 MapR 这些早先的玩家，Pivotal 是大数据市场的后来者。但现在，为了解决大数据领域“分裂（fragmentation）和供应商锁定（vendor lock-in）”的问题，Pivotal 决定将其大数据套件中的一些产品进行开源。这些产品包括 Greenplum Database （并行处理的数据仓库）、 HAWQ （和 ANSI 标准兼容的 Hadoop 上的 SQL 查询引擎）和 GemFire （分布式内存中的 NoSQL 数据库）

迈克尔·库基（Michael Cucchi），Pivotal 的产品市场总监，对这一过程及其背后的原因提供了更多的细节。按照库基所说，客户虽然喜欢“Pivotal 大数据套件的灵活性”，但他们的购买偏好却在发生变化，这其中的原因在于“这些日子客户想尽办法来争取同开源技术相结合，特别是在 IT 的基础设施领域”。所以结果就是，Pivotal 决定开源其大数据套件的核心部分，并且库基也提到他们意图开源其套件的所有组件。

按照库基所说，开源的过程已经“进行了一段时间”，主要是处理一些复杂的事情，比如软件许可、知识产权和产品管治，并为后面的行动提供一些细节。

详细的计划还正在敲定中，但是 Pivotal 已计划按季度的节奏来开始发布和孵化 Pivotal GemFire 、 Pivotal HAWQ 和 Pivotal Greenplum Database 。现在 Pivotal 已接近完成 GemFire、Greenplum Database 和 HAWQ 代码所有权的结构改造，使其成为最适合大数据社区工作的实体。

Pivotal 还宣布成立 ODP（ Open Data Platform ）组织，初创的 15 个公司包括 Hortonworks、IBM、Infosys、GE、SAS 等，这些公司致力于推进大数据领域的开源和标准化。第一批被 ODP 关注的组件包括 Ambari、HDFS、MapReduce 和 YARN，而且 Pivotal 很可能会将其套件的源码委托给 ODP 来管理。

于此同时，Pivotal 的大数据组件还进行了一些服务上的增强：在 Cloud Foundry 上利用 Operations Manager 来部署套件的能力；以及同 Spring XD（Pivotal 的大数据集成运行环境）、Redis 和 RabbitMQ 进行集成。按照库基所说，下一个版本的 Pivotal HD（Pivotal 的 Hadoop 发行版）将会同 Spark 以及“所有可用的 Apache 项目”进行集成。

查看英文原文： Pivotal Open Sources Their Big Data Suite

创作场景

Pivotal 开源其大数据套件