数据湖和数仓融合架构实践_技术洞察_技术趋势_大厂实践_InfoQ精选专题



 写点什么

登录/注册

过去几年，数据仓库和数据湖方案在快速演进和弥补自身缺陷的同时，二者之间的边界也逐渐淡化。云原生的新一代数据架构不再遵循数据湖或数据仓库的单一经典架构，而是在一定程度上结合二者的优势重新构建。各大云厂商陆续提出自己的“湖仓一体”（Lakehouse）技术方案，如 AWS 的Redshift Spectrum、微软Azure Synapse Analytics 服务与 Azure Databricks 集成、阿里云MaxCompute+DataWorks、华为云FusionInsight等。还有一些公司正在通过开源表格式（如 Delta Lake、Apache Iceberg、Apache Hudi）构建自己的数据湖仓。在云厂商和开源技术方案的共同推动之下，2021 年我们将会看到更多“湖仓一体”的实际落地案例。

InfoQ希望通过选题的方式对数据湖和数仓融合架构在不同企业的落地情况、实践过程、改进优化方案等内容进行呈现，并推动该技术方向的发展。

网易数帆实时数据湖Arctic的探索和实践

网易数帆实时数据湖 Arctic 的探索和实践

数据中台也要从离线为主走向实时化，湖仓一体是第一步。

作者 : 蔡芳芳

2021-12-03

4548

使用对象存储，数据湖才能重获新生

使用对象存储，数据湖才能重获新生

存储正在经历新一轮架构革命：戴尔科技集团在数据湖的探索和思考

作者 : Tina

2021-10-28

9546

现在是采用湖仓一体的好时机吗？

现在是采用湖仓一体的好时机吗？

除了湖仓一体，我们还需要关注哪些数据架构演进方向？

作者 : 蔡芳芳

2021-09-17

5625

Adobe将PB级数据迁移到Iceberg的实践与经验教训

Adobe 将 PB 级数据迁移到 Iceberg 的实践与经验教训

本文将分享 Adobe 将超过 1PB 的数据集迁移到 Adobe 体验平台数据湖（Datalake）上的 Iceberg 的故事，具体介绍我们面临的挑战以及从中吸取的经验教训。

作者 : Adobe 译者: 王强策划: 蔡芳芳

2021-08-10

4307

OPPO数仓与数据湖融合架构升级的实践与思考

OPPO 数仓与数据湖融合架构升级的实践与思考

对话 OPPO 鲍永成：没有完备的数据体系，空谈湖仓之争没意义

作者 : 蔡芳芳

2021-04-03

7288

Flink集成Iceberg在同程艺龙的实践

Flink 集成 Iceberg 在同程艺龙的实践

本文将分享同程艺龙将 Flink 与 Iceberg 深度集成的落地经验和思考。

作者 : 张军策划: 蔡芳芳

2021-03-23

5085

从自研到Delta到Iceberg，网易严选数据湖建设实践

从自研到 Delta 到 Iceberg，网易严选数据湖建设实践

本文将分享网易严选的数据湖建设过程和思考。

作者 : 左琴策划: 蔡芳芳

2021-03-17

6741

Adobe基于Iceberg的数据湖性能提升实践

Adobe 基于 Iceberg 的数据湖性能提升实践

本文介绍了 Adobe 公司在使用 Iceberg 时遇到的小文件问题以及高并发写入的一致性问题。针对这两个问题，Adobe 给出了有指导意义的解决方案。

作者 : Adobe 译者: wangkx 策划: 蔡芳芳

2021-02-04

4488

数仓实时化改造：Hudi on Flink 在顺丰的实践应用

数仓实时化改造：Hudi on Flink 在顺丰的实践应用

本文主要介绍顺丰在数据仓库的数据实时化、数据库 CDC、Hudi on Flink 上的实践应用及产品化经验。

作者 : 蔡适择

2020-12-13

4175

大数据架构变革进行时：为什么腾讯看好Apache Iceberg？

大数据架构变革进行时：为什么腾讯看好 Apache Iceberg？

在基础软件开源化的趋势下，国内企业在数据湖技术点上的探索与跟进并不比国外企业落后太多

作者 : 蔡芳芳

2020-04-22

15146

深度对比Delta、Iceberg和Hudi三大开源数据湖方案

深度对比 Delta、Iceberg 和 Hudi 三大开源数据湖方案

今天我们就来解构数据湖的核心需求，帮助用户更好地针对自身场景来做数据湖方案选型。

作者 : 胡争(子毅）

2020-03-19

40159

没有更多了