本周二,数据湖提供商 Databricks 表示正在开源所有 Delta Lake API,作为 Delta Lake 2.0 版本发布计划的一部分。另外该公司还宣布将 Delta Lake 的所有增强功能贡献给 Linux 基金会。
“从一开始,Databricks 就一直致力于开放标准和开源社区。”Databricks 的联合创始人兼首席执行官 Ali Ghodsi 说,“开放数据湖库正迅速成为企业处理数据的标准。Delta Lake、MLflow 和 Spark 都是这一数据架构的核心,我们很自豪能够在加速企业创新和采用方面尽自己的一份力量。”
2019 年 6 月,Databricks 曾宣布Delta Lake 的开源,但显然不是全部开源。Cloudera、Microsoft、SAP、Snowflake 等 Databricks 竞争对手通过质疑 Delta Lake 到底是开源还是专有软件的方式,夺走了一部分的潜在客户。分析师认为,通过完全开源,Databricks 正在消除客户的这种担忧和竞争性批评。
随着数据湖市场上的商业开源项目越来越多,Databricks 可能会发现自己面临新的竞争,包括为超大型分析表提供高性能查询的 Apache Iceberg。这个领域的许多其他参与者都专注于 Apache Iceberg 作为 Delta Lake 表的替代品。
一些其他企业也都开始推出 Apache Iceberg 商业化产品。随着这些产品的推出,数据湖市场开始分裂,技术人员有着多种选择,Delta Lake 面临着来自其他开源 Lakehouse 格式的压力。在竞争压力下,Databricks 表示 Delta Lake 2.0 将于今年晚些时候全面推出,预计将为数据分析提供更快的查询性能。
查看更多:https://www.infoworld.com/article/3665117/databricks-open-sources-its-delta-lake-data-lake.amp.html
评论