【AICon】 如何构建高效的 RAG 系统?RAG 技术在实际应用中遇到的挑战及应对策略?>>> 了解详情
写点什么

20 个大数据必知领域之「Hudi」

  • 2020-05-28
  • 本文字数:269 字

    阅读完需:约 1 分钟

20个大数据必知领域之「Hudi」


Apache Hudi 是由 Uber 开源的在分布式文件系统上提供对大型分析数据集的摄取、管理以及查询的数据湖框架。2019 年 1 月加入 Apache 孵化器进行孵化,加入孵化器大半年,发布第一个 Apache 版本后就快速被 AWS EMR 团队集成进 EMR 5.28.0 发布版,它也是 Amazon EMR 集成的开源项目里唯一一个还处于孵化阶段的项目。Hudi 在 Uber 从 2016 年开始研发到 2017 年上线生产环境,已构建远超 100 PB 的数据湖、单表 1000 个 Pipeline、每天处理 100TB 的数据规模。

一线实践案例

深度对比 Delta、Iceberg 和 Hudi 三大开源数据湖方案

会议演讲推荐

如何基于 Apache Hudi 构建企业级数据湖


2020-05-28 15:101191

评论

发布
暂无评论
发现更多内容

全是技巧!ZBrush雕刻手部教程赶紧收藏!

Finovy Cloud

使用 NFTScan NFT API 开发一个多链 NFT Marketplace

NFT Research

API NFT\

ChatGPT与深度学习的完美融合:打造智能化推荐系统新时代

蓝海大脑GPU

开源之夏 2023|欢迎报名 Apache RocketMQ 社区项目!

Apache RocketMQ

RocketMQ 开源之夏

开心档之C++ 变量类型

雪奈椰子

聊聊原生拖拽API

巨梦科技

django Vue

iOS描述文件(.mobileprovision)一键申请

雪奈椰子

豆浆、油条、肉夹馍......西安银行的挑战开始了

OceanBase 数据库

数据库 oceanbase

数据可视化图表之雷达图介绍

2D3D前端可视化开发

数据分析 数据可视化 数据可视化工具 可视化图表 雷达图

RocketMQ 5.0 如何配置TLS加密传输?

Apache RocketMQ

消息列队

解密领域驱动设计(DDD):搭建强大、灵活的软件架构神器

xfgg

Java 架构 DDD 领域驱动模型

万物可卷!低代码充满想象,能打敢战

引迈信息

低代码 JNPF

天翼云CDN全站加速产品对websocket协议的支持

天翼云开发者社区

云计算 CDN

免费堡垒机选择云堡垒机可以吗?哪家好?

行云管家

堡垒机 云堡垒机 免费堡垒机

使用MFT进行加密文件传输的7个好处

镭速

学术加油站|基于LSM-tree存储系统的内存管理,最大限度降低I/O成本

OceanBase 数据库

数据库 oceanbase

登录appuploader

雪奈椰子

行云流水| CI 3.0 云原生构建全新上线

CODING DevOps

DevOps 云原生 软件工程 研发效能 持续构建

虚拟化技术 - CPU虚拟化

天翼云开发者社区

cpu 虚拟化

亚马逊云是哪个国家的?收费标准贵吗?

行云管家

云计算 云服务 云管理 亚马逊云

大数据如何助力营销(4)策略制定

MobTech袤博科技

ipa文件怎么安装到iPhone手机上?

雪奈椰子

Pose泰裤辣! 一键提取姿态生成新图像

华为云开发者联盟

人工智能 AI 华为云 华为云开发者联盟 企业号 5 月 PK 榜

阿里大佬耗时半年!肝出了这1015页分布式全栈手册

程序知音

Java 分布式 java架构 Java进阶 后端技术

太爆了!阿里最新出品2023版JDK源码学习指南,Github三天已万赞

程序员小毕

程序员 后端 jdk源码 架构师 java面试

靠这份GitHub 标星80K的图解算法,杀进大厂!

程序知音

Java 数据结构 算法 后端技术 算法与数据结构

ipa如何安装到iphone

雪奈椰子

使用数据可视化分析还有多少人在玩梦幻西游

搞大屏的小北

数据可视化 用户画像 梦幻西游 游戏分析

WorkPlus Knowledge:基于ChatGPT创建专属你的智能化知识库

WorkPlus

如何把ipa文件(iOS安装包)安装到iPhone手机上? 附方法汇总

雪奈椰子

IOS证书制作教程

雪奈椰子

20个大数据必知领域之「Hudi」_大数据_闫佳忆_InfoQ精选文章