今天，在荷兰阿姆斯特丹举行的Spark+AI欧洲峰会上，DataBricks和Linux基金会联合宣布，开源项目Delta Lake正式成为Linux基金会的托管项目。

Delta Lake由Databricks在今年年初开源，该项目旨在与社区共同打造一个开放标准，以管理数据湖中的大量数据，并不断提高数据湖的可靠性、质量和性能（关于Delta Lake的更多技术特性可以参考InfoQ早前的报道《Databricks 开源存储层 Delta Lake，欲取代传统数据湖》）。成为Linux基金会项目后，Delta Lake原来采用的Apache 2.0开源许可将保持不变。目前Delta Lake已经被成千上万的组织采用，包括Intel、阿里巴巴、Booz Allen Hamilton都是其开源生态一员。为了进一步推动Delta Lake开原生态的发展，让更多开发者和企业采用Delta Lake并参与贡献项目代码，Databricks决定让Delta Lake成为Linux基金会的托管项目并使用开放式的治理模式。

如今，每个公司都希望通过数据科学、机器学习和分析等手段从数据中获得更多价值，但由于数据湖中数据可靠性较差，从数据中获取价值的难度极大。Delta Lake通过为 Apache Spark 和其他大数据引擎提供可伸缩的 ACID 事务，让用户可以基于 HDFS 和云存储构建可靠的数据湖。自2017年10月推出以来，Delta Lake已被四千多家组织采用，每月处理超过2 exabytes的数据。

“将Delta Lake引入Linux基金会这样的中立组织，将有助于开源社区更好地基于该项目开发解决大数据（本地和云端）存储和处理问题的技术，”Linux基金会战略计划副总裁Michael Dolan说，“ Linux基金会致力于帮助开源社区采用开放治理模式来实现广泛的行业贡献和共识建立，这将有助于改善当前数据存储和可靠性相关技术。”

Databricks的联合创始人也是开源项目Apache Spark的创始成员，如今Spark早已成为大规模数据处理的事实标准。Databricks的首席执行官兼联合创始人Ali Ghodsi对Delta Lake项目再次经历这一旅程感到兴奋。“我们的团队一直致力于创建开源项目并为之做出贡献，因为我们知道这是最快、最好的创新方式。为了解决不同组织在数据方面的挑战，我们希望保证Delta Lake项目真正彻底地开源。借助Linux基金会社区的力量和贡献，我们相信Delta Lake很快就会成为数据湖中数据存储的标准。”

尽管Delta Lake最初是为了与Apache Spark配合使用而设计的，但如今Delta Lake已经构建了一个更加开放且蓬勃发展的社区，且增加了对其他开源数据系统的支持。

阿里巴巴大数据/人工智能副总裁贾扬清表示：

“作为主要的云计算提供商，阿里巴巴一直是各种开源项目（尤其在大数据和AI领域）的领导者、贡献者、使用者和支持者。我们一直在与Databricks合作开发Delta Lake的原生Hive连接器，我们非常高兴看到该项目加入Linux基金会。我们将继续推动Delta Lake开源社区的发展并为之做出贡献。”

英特尔架构、图形和软件副总裁兼机器学习性能总经理李伟（Wei Li）表示：

“英特尔与Databricks已经合作了非常长时间，我们共同致力于通过创新的数据分析和AI解决方案推动Apache Spark技术的发展，并帮助企业做好准备。Databricks 贡献给Linux基金会的Delta Lake项目是一项相当重要的开源存储技术，可以帮助采用者提高数据湖的可靠性。我们期待加入Delta Lake项目，并继续与Databricks和Apache社区进行合作。”

创作场景

官宣！开源 Delta Lake 正式加入 Linux 基金会，共同打造数据湖开放标准