4万字《腾讯云技术实践精选集 2021》发布,点击下载 了解详情
写点什么

20 个大数据必知领域之「Iceberg」

  • 2020 年 5 月 28 日
  • 本文字数:319 字

    阅读完需:约 1 分钟

20个大数据必知领域之「Iceberg」


随着大数据存储和处理需求的多样化,如何构建一个统一的数据湖存储,并在其上进行多种形式的数据分析,便成了企业构建大数据生态的一个重要方向。如何能快速、一致、原子性地在数据湖存储上构建起 Data Pipeline 是一个亟待解决的问题。


为此 Uber 开源了 Apache Hudi,Databricks 提出了 Delta Lake,而 Netflix 则发起了 Apache Iceberg 项目,一时间这种具备 ACID 能力的表格式中间件成为了大数据、数据湖领域炙手可热的方向。相比于 Hudi、Delta Lake,Iceberg 正式提出了表格式这样一个概念,利用表格式来有效地组织数据、提供 ACID 能力、优化对象存储,使之成为数据湖上一个不可缺少的一环。


会议演讲推荐


2020 年 5 月 28 日 15:201042

评论

发布
暂无评论
发现更多内容

限时!字节Java程序性能优化宝典开源,原来这才叫性能优化

互联网架构师小马

Java 性能优化

week9-homework

J

week9-conclusion

J

用docker-compose快速部署ChirpStack

远鹏

Docker-compose IoT ChirpStack LoraWan Go 语言

大数据知识专栏 - Hadoop的资源管理 Yarn介绍

小马哥

大数据 hadoop YARN 七日更

【并发编程的艺术】JVM内存模型

程序员架构进阶

架构 Java内存模型 Java虚拟机 28天写作

你有多久没去看海了呢「幻想短篇 15/28」

道伟

28天写作

为什么很多事情说起来容易做起来难

Justin

学习 心理学 成长 心态 28天写作

币币交易系统APP开发|币币交易软件开发

系统开发

十个手指头弹钢琴、高水准欣赏探讨优雅益智的古典音乐技术 数学不好很难进行

史上最全!阿里巴巴2021年最新最全500道Java后端面试大全(值得收藏)

Java 编程 程序员 面试

2050年的一次出游 (28天写作 Day15/28)

mtfelix

自动驾驶 28天写作 科幻写作

28天瞎写的第二百二十六天:TechCrunch Hackathon 的故事

树上

28天写作

soul 数据同步(三)http长轮询 同步策略

xzy

区块链量化交易怎么做?

v16629866266

共识算法的简单理解(一)

石君

28天写作

关于“为更新而更新”的一种新的理解

Nydia

无代码、Excel与Airtable

lidaobing

低代码 Excel 无代码开发 28天写作 Airtable

Soul 源码阅读 03|WebSocket 同步数据分析

哼干嘛

Java 源码分析 Soul网关

如何管理过程质量?新手管理者的陷阱

一笑

管理 管理者 28天写作 质量保证

一个系统小BUG修复投产居然花了3个小时来处理(上)

罗小龙

28天写作 投产事故 解决思路

【CSS】红砖背景

德育处主任

css3 大前端 html/css CSS小技巧 28天写作

疫情闭关修炼半个月,我竟把JDK源码都读懂了!

996小迁

Java 编程 架构 面试 程序人生

产品质量管理活动流程

俊毅

历史上的今天

IT蜗壳-Tango

七日更

项目管理系列(8)-从0到1搭建PMO(一)

Ian哥

28天写作

人设崩塌的美国生物实验室

脑极体

【高并发】ReadWriteLock怎么和缓存扯上关系了?!

冰河

并发编程 读写锁 高并发 ReadWriteLock 签约计划第二季

5G最核心的本质是能力可被编排及开放

JiangX

5G 数字化转型 28天写作

Windows AD 是否开启或者关闭了UAC服务

BigYoung

windows Windows 10

技术招聘常被吐槽,企业应该考虑好这一点

李忠良

28天写作

20个大数据必知领域之「Iceberg」-InfoQ