产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

官宣!开源 Delta Lake 正式加入 Linux 基金会,共同打造数据湖开放标准

  • 2019-10-16
  • 本文字数:1360 字

    阅读完需:约 4 分钟

官宣!开源Delta Lake正式加入Linux基金会,共同打造数据湖开放标准

今天,在荷兰阿姆斯特丹举行的 Spark+AI 欧洲峰会上,DataBricks 和Linux基金会联合宣布,开源项目Delta Lake正式成为 Linux 基金会的托管项目。



Delta Lake 由 Databricks 在今年年初开源,该项目旨在与社区共同打造一个开放标准,以管理数据湖中的大量数据,并不断提高数据湖的可靠性、质量和性能(关于 Delta Lake 的更多技术特性可以参考 InfoQ 早前的报道《Databricks 开源存储层 Delta Lake,欲取代传统数据湖》)。成为 Linux 基金会项目后,Delta Lake 原来采用的 Apache 2.0 开源许可将保持不变。目前 Delta Lake 已经被成千上万的组织采用,包括 Intel、阿里巴巴、Booz Allen Hamilton 都是其开源生态一员。为了进一步推动 Delta Lake 开原生态的发展,让更多开发者和企业采用 Delta Lake 并参与贡献项目代码,Databricks 决定让 Delta Lake 成为 Linux 基金会的托管项目并使用开放式的治理模式。


如今,每个公司都希望通过数据科学、机器学习和分析等手段从数据中获得更多价值,但由于数据湖中数据可靠性较差,从数据中获取价值的难度极大。Delta Lake 通过为 Apache Spark 和其他大数据引擎提供可伸缩的 ACID 事务,让用户可以基于 HDFS 和云存储构建可靠的数据湖。自 2017 年 10 月推出以来,Delta Lake 已被四千多家组织采用,每月处理超过 2 exabytes 的数据。


“将 Delta Lake 引入 Linux 基金会这样的中立组织,将有助于开源社区更好地基于该项目开发解决大数据(本地和云端)存储和处理问题的技术,”Linux 基金会战略计划副总裁 Michael Dolan 说,“ Linux 基金会致力于帮助开源社区采用开放治理模式来实现广泛的行业贡献和共识建立,这将有助于改善当前数据存储和可靠性相关技术。”


Databricks 的联合创始人也是开源项目 Apache Spark 的创始成员,如今 Spark 早已成为大规模数据处理的事实标准。Databricks 的首席执行官兼联合创始人 Ali Ghodsi 对 Delta Lake 项目再次经历这一旅程感到兴奋。“我们的团队一直致力于创建开源项目并为之做出贡献,因为我们知道这是最快、最好的创新方式。为了解决不同组织在数据方面的挑战,我们希望保证 Delta Lake 项目真正彻底地开源。借助 Linux 基金会社区的力量和贡献,我们相信 Delta Lake 很快就会成为数据湖中数据存储的标准。


尽管 Delta Lake 最初是为了与 Apache Spark 配合使用而设计的,但如今 Delta Lake 已经构建了一个更加开放且蓬勃发展的社区,且增加了对其他开源数据系统的支持。


阿里巴巴大数据/人工智能副总裁贾扬清表示:


“作为主要的云计算提供商,阿里巴巴一直是各种开源项目(尤其在大数据和 AI 领域)的领导者、贡献者、使用者和支持者。我们一直在与 Databricks 合作开发 Delta Lake 的原生 Hive 连接器,我们非常高兴看到该项目加入 Linux 基金会。我们将继续推动 Delta Lake 开源社区的发展并为之做出贡献。”


英特尔架构、图形和软件副总裁兼机器学习性能总经理李伟(Wei Li)表示:


“英特尔与 Databricks 已经合作了非常长时间,我们共同致力于通过创新的数据分析和 AI 解决方案推动 Apache Spark 技术的发展,并帮助企业做好准备。Databricks 贡献给 Linux 基金会的 Delta Lake 项目是一项相当重要的开源存储技术,可以帮助采用者提高数据湖的可靠性。我们期待加入 Delta Lake 项目,并继续与 Databricks 和 Apache 社区进行合作。”


2019-10-16 18:485320
用户头像
蔡芳芳 InfoQ主编

发布了 800 篇内容, 共 550.4 次阅读, 收获喜欢 2789 次。

关注

评论 1 条评论

发布
用户头像
关于为什么Delta Lake没有选择加入Apache基金会,我们也专门询问了Databricks的同学,得到的答复是“近期Apache基金会政治氛围有点浓厚”,并且本质上Linux基金会的Cloud属性更强。

It’s interesting to see Databricks choose the Linux Foundation for this project, given that its roots are in the Apache Foundation. “We’re super excited to partner with them,” Ghodsi said about why the company chose the Linux Foundation. “They run the biggest projects on the planet, including the Linux project but also a lot of cloud projects. The cloud-native stuff is all in the Linux Foundation.”
展开
2019-10-17 10:34
回复
没有更多了
发现更多内容

2024年中小企业如何选择项目管理软件?这8款值得关注

易成研发中心

2024年,众多领先企业携手用友加速出海

用友BIP

探索Bash编程:开启自动化脚本的魔法之旅

测试人

软件测试

Spring事务传播机制(最全示例)

快乐非自愿限量之名

spring

异构仿真:打造更可靠的综合化航空电子软件

DevOps和数字孪生

飞机

小团队项目管理软件哪款最合适?8款工具对比

易成研发中心

CFD专栏丨HyperMesh CFD功能详解:虚拟风洞 Part 2

Altair RapidMiner

gpu 仿真 智能制造 altair CFD

OpenTelemetry 赋能DevOps流程的可观测性革命

乘云数字DataBuff

DevOps 运维 OpenTelemetry

电商数据探索:利用API接口获取淘宝关键词与店铺商品全览

代码忍者

API 接口 pinduoduo API

企业网盘软件对比:9款国内靠谱选择推荐

易成研发中心

大国重器 数智领航——用友助力核工业迈向高质量发展新征程

用友BIP

网盘企业版哪个好用?盘点8款适合企业使用的网盘

易成研发中心

企业网盘选择推荐:2024年十大网盘产品排行榜

易成研发中心

风霜雨雪总关情:气象局如何推进实时数据在环境和气候科学的应用实践,让气象数据供得出、流得动、用得上

tapdata

实时数据集成 mongodb聚合计算 气象数据 气象数据平台

天润融通活动预告丨走进上汽集团,探秘数智标杆

天润融通

从《中央企业高质量发展报告(2024)》看央企奋进新姿态

用友BIP

.NET现在可以做什么,有哪些公司在用的?

不在线第一只蜗牛

.net

选择支持在线编辑的企业网盘,看看这些主流5款

易成研发中心

2024年最佳公司网盘:口碑爆棚的10款工具盘点

易成研发中心

新业财税资档一体化:全面营运资金管理就选用友BIP超级版

用友BIP

代币开发:构建区块链生态的核心要素

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

深度盘点:国内7大企业网盘私有化部署厂商

易成研发中心

实现高效运行管理:如何使用 NSSM 工具将 IoTDB 注册为 Windows 系统服务

Apache IoTDB

天润融通“AI破局 • 聚力增长”主题论坛圆满收官

天润融通

避免赛事版权风险!开发合法获取赛事内容体育直播平台

软件开发-梦幻运营部

解密小红书详情API接口:获取与运用

科普小能手

API 小红书 API 接口 小红书API接口 小红书API

博睿数据登顶中国应用性能管理及可观测性APMO市场份额第一!

博睿数据

APM 可观测性 IDC

用友BIP超级版:释放数据要素价值,加速企业决策智能化

用友BIP

更聪明、有感情、有态度:数字人助力企业创新营销力、生产效率双提升

科技热闻

2024年IT项目管理软件用哪个?8大精选一览

易成研发中心

数智化背景下审计行业的变革与应对之策

不在线第一只蜗牛

低代码 数智化

官宣!开源Delta Lake正式加入Linux基金会,共同打造数据湖开放标准_大数据_蔡芳芳_InfoQ精选文章