GridGain 最近宣布,GridGain 的内存数据组织(In-Memory Data Fabric)已经被接纳成为 Apache 孵化器项目,并命名为 Apache Ignite(燃烧)。
今年早些时候,GridGain 通过 Apache 2.0 许可转化为开源模式。现在,该产品在 Apache 基金会项目组合中将变为可用。为 Apache 组织框架做出贡献的目标,是要建立社区并驱动开发内存中数据和计算的解决方案,而不仅仅是为了开源。
InfoQ 采访了尼基塔·伊万诺夫, GridGain 的 CTO 和创始人,内容包括对内存计算框架成为一个 Apache 项目,这个决定背后的动机,以及即将推出的特性和 GridGain 的增强。
InfoQ: GridGain 在最近变为开源后又成为 Apache 项目的原因是什么?
今年早些时候,GridGain 终于把商业产品中的许多扩展和改进后向移植到开源产品中,并把开源项目许可证改成 Apache 2.0。我们很快就意识到,该项目之所以能获得来自国际社会显著关注和兴趣,是因为在 2014 年 3 月份我们开源后其下载量增加了 2000%。那么为了下一步发展,基于一些原因加入 ASF(Apache 软件基金会),成为 Apache Ignite 项目就是自然和合乎逻辑的。成为 Apache 软件社区的一部分不仅可以持续推动 GridGain 的核心代码库被采用,同时也能通过开发者社区来激励更多的适用性和快速创新,以及确保在不断增长的用户基础上这个代码库的长期生存能力。对于发展、培养开发者和用户的社区来说,确实没有比 Apache 软件基金会更好的地方了,特别是针对象 GridGain 这样的基础软件。
InfoQ: GridGain 产品的哪个部分正贡献到 Apache 中呢?是不是只有内存计算框架,或者也有内存数据存储呢?
超过 90%的代码库贡献到了 ASF,这意味着 GridGain 内存数据组织的所有核心功能,包括数据网格,计算网格和流引擎都将是 Apache Ignite 代码库的一部分。接下来是怎么去定义商业产品,这是 GridGain 在持续做的事情,创新将集中在高端企业级功能,如安全性,数据中心复制,先进的管理和监督,等等。
InfoQ:新的 Apache 项目的许可模式是什么?如何去比较 Apache 项目、GridGain 开源项目和 GridGain商业产品在管理上的差别?
Apache Ignite 和任何其它的 ASF 项目之间没有差别。它的许可证是在 Apache 2.0 中,该项目将通过 PMC(Project Management Committees,项目管理委员会)进行管理,PMC 将包括 GridGain 贡献者以及外部的提交者。商用产品将继续通过 GridGain 的企业许可程序提供。
InfoQ:新项目走出孵化状态的时间表是什么?
我们期待着第一个代码在今年年底下线,并希望在 12 个月以内 Apache Ignite 可以毕业从而成为顶级项目。
InfoQ**** 中文站: GridGain 如何与 Hadoop 一起工作,后者已经是数据处理需求的热门之选?
Apache Ignite 和 Hadoop(包括 Apache Spark)解决的是不同的问题,即使它们在一定程度上可能应用了类似的底层基本技术,例如 Spark 的情况。Apache Ignite 是一种多用途,和 OLAP/ OLTP 内存中数据结构相关的,而 Hadoop 仅仅是 Apache Ignite 原生支持(和加速)的诸多数据来源之一。
InfoQ:如何在新兴的数据分析工具前景中给 GridGain 定位呢?比如 Apache Spark(特别是 Spark Streaming)这样的框架,都已经支持基于内存的实时数据处理用例?
Spark 是一个和 Apache Ignite 类似的姊妹项目。虽然 Spark 将其视线聚焦在 OLAP 世界中,但 Apache Ignite 项目凭借其业界领先的事务处理能力在新兴的混合型的 OLTP/ OLAP 用例方面更胜一筹。特别是针对 Hadoop,Apache Ignite 将为现有的 Map/Reduce,Pig 或 Hive 作业提供即插即用式的加速,避免了推倒重来的做法,而 Spark 需要先做数据 ETL,更适合新写的分析应用。
InfoQ:你能谈谈内存中数据组织产品即将推出的特性和增强功能吗?
更多的即插即用功能,在 Apache Ignite 最初的路标上,你会发现主题是更多的集成和简化,从而进一步加快 Apache Ignite 代码库的采用,并且更容易使用。
尼基塔还谈到了 GridGain 如何能和像 Hadoop 这样的工具一起来适应大数据管理和分析的前景。
每一天,我们都能看到新的、有趣的内存技术领域的使用案例,在几年前你甚至不会对它们抱有期望,如纽约马拉松选手某一天的实时跟踪。我们坚信,新型的交易、分析和混合实时应用将会出现,即使是最小型的组织也能获得快速、数据驱动的决策和经营的竞争优势。我们确信,通过社区来驱动采用,内存数据组织技术的适用性会在推动创新中扮演重要的角色,从而使 Apache Ignite 成为未来的快速数据世界(Fast Data world),如同 Hadoop 是今天的大数据。
关于受访者
尼基塔·伊万诺夫是 GridGain 系统公司的发起人和 CTO,GridGain 成立于 2007 年,投资者包括 RTP Ventures 和 Almaz Capital。Nikita 领导 GridGain 开发了领先的分布式内存片内数据处理技术 - 领先的 Java 内存片内计算平台,今天在全世界每 10 秒它就会启动运行一次。Nikita 有超过 20 年的软件应用开发经验,创建了 HPC 和中间件平台,并在一些创业公司和知名企业都做出过贡献,包括 Adaptec, Visa 和 BEA Systems。Nikita 也是使用 Java 技术作为服务器端开发应用的先驱者,1996 年他在为欧洲大型系统做集成工作时他就进行了相关实践。
查看英文原文: Apache Ignite GridGain Incubator Project - Q&A Interview with Nikita Ivanov
评论