写点什么

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京

  • 2025-04-06
    北京
  • 本文字数:1479 字

    阅读完需:约 5 分钟

大小:765.64K时长:04:21
如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


Datastrato VP of engineering 史少锋已确认出席并发表题为《从碎片到统一:如何用元数据湖解决多 Lakehouse 治理难题》的主题分享。企业在采用多 Lakehouse 后,往往面临一些挑战,比如:如何实现多 Lakehouse 中数据的发现和共享,让应用、引擎以统一的方式接入;如何实现多 Lakehouse 的统一管理和治理,使用方式不一致导致的数据治理问题等。对此,基于标准协议的 Rest Catalog 以及支持多引擎的统一元数据服务,可以帮助企业统一管理 Lakehouse,解决上面提到的问题,此次分享将带来以上方面的最佳实践。


史少锋是 Datastrato VP of engineering,Apache 会员, Apache Incubator PMC, Mentor of Apache Gravitino, Gluten, HoraeDB 等多个项目;专注于大数据分析和云计算技术。曾任 eBay 全球分析基础架构部大数据高级工程师,IBM 云计算部门架构师等。他在本次会议的详细演讲内容如下:


演讲提纲

1. Lakehouse 架构背景

  • 什么是 Lakehouse 架构

  • Lakehouse 的核心优势:数据湖与数据仓库的结合

  • Lakehouse 在企业中的典型应用场景

2. 多 Lakehouse 趋势

  • 企业为何需要多 Lakehouse

  • 多 Lakehouse 的典型架构模式

  • 多 Lakehouse 带来的机遇与挑战

3. 多 Lakehouse 治理挑战

  • 数据发现与共享难题

  • 统一管理与治理困境

  • 实际案例:企业面临的具体问题

4. 什么是统一元数据湖

  • 统一元数据湖的定义与核心价值

  • 统一元数据湖的关键特性

  • 统一元数据湖与传统元数据管理的对比

5. 基于统一元数据湖的 Lakehouse 架构

  • 架构设计原则

  • 技术实现

  • 实际应用案例

6. 未来展望


您认为,这样的技术在实践过程中有哪些痛点?

  • 协议适配问题:尽管基于标准协议的 Rest Catalog 是核心优势之一,但在实际企业环境中,不同的 Lakehouse 架构可能是在不同时期、由不同供应商构建的。这些系统可能对标准协议的支持程度参差不齐,存在部分功能无法完全适配 Rest Catalog 的情况。

  • 企业中可能同时存在多种处理引擎和分析引擎,这些引擎对元数据的理解和使用方式存在差异。统一元数据湖服务要支持多引擎,就需要针对每种引擎的特点进行定制化开发。


演讲亮点

  • 介绍基于标准协议的 Rest Catalog 及其在多 Lakehouse 环境中的技术优势,展示统一元数据湖

  • 如何实现跨平台、跨引擎的数据管理。

  • 分享如何通过统一元数据湖解决多 Lakehouse 环境中的数据发现、共享和治理难题,提供可落地的解决方案和实际案例。

  • 探讨统一元数据湖在数据架构中的未来发展方向,为企业提供战略性的技术选型建议。


听众收益

  • 掌握多 Lakehouse 治理的关键挑战与解决方案

  • 学习统一元数据湖的核心技术与实践

  • 获取可落地的数据治理最佳实践


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-06 17:006275

评论

发布
暂无评论

私有云统一管理定义以及好处简单说明

行云管家

云计算 私有云 云管理

Web3项目的开发

北京木奇移动技术有限公司

区块链技术 web3开发 软件外包开公司

龙蜥社区两大委员会月度会议圆满召开

OpenAnolis小助手

开源 操作系统 龙蜥社区

无需登录+离线调试 Apipost完胜Apifox?

数据追梦人

DNS常见问题:什么是主机记录和记录值?

国科云

数字藏品NFT的技术原理

北京木奇移动技术有限公司

软件外包公司 音乐NFT 体育NFT

CrossOver 25重磅发布:众多革命性突破带给你更强的Mac游戏兼容性

阿拉灯神丁

兼容性测试 CrossOver Mac下载 Mac游戏推荐 mac虚拟机软件

中国企业出海的驱动力、跨端技术创新及流量分发新模式

xuyinyin

运维堡垒机-开启IT安全运维利器!

行云管家

网络安全 堡垒机 数字安全

​​AMS行政管理系统:数字化赋能人力资源精益管理​

秃头小帅oi

从“制造”到“智造”,低代码如何赋能制造业转型升级?

天津汇柏科技有限公司

人工智能 低代码 智能制造

几张图搞懂息队列Message Que

Marvin Ma

kafka RabbitMQ IT 消息队列 message queue

导师招募!Apache DolphinScheduler开源之夏2025等你领航!

白鲸开源

开源 Apache DolphinScheduler 开源之夏

Cloud Kernel SIG 季度动态:发布ANCK 6.6-003版本,支持一测多证

OpenAnolis小助手

操作系统 龙蜥社区 OpenAnolis 龙蜥社区SIG

深入研究:淘宝天猫商品评论查询API详解

tbapi

淘宝API 淘宝商品评论API接口 天猫商品评论API接口

移动端动态化发展:技术演进与生态建设实践

xuyinyin

Agentic AI 干货!DeepSeek + OpenAI SDK 构建 Agent 实战

七牛云

AI

祝贺!华为云GES完成中国信通院图数据库产品测试

华为云开发者联盟

图数据库 华为云GES 中国信通院

倒计时三年,国产化替代100%进度走到哪了?

禅道项目管理

信创 项目管理软件 国产化替代

5分钟掌握!DolphinScheduler时间参数动态配置秘籍

白鲸开源

大数据 开源 Apache DolphinScheduler 任务调度 大数据调度

【轻量化】三个经典轻量化网络解读

地平线开发者

自动驾驶; 算法工具链 地平线征程6

Spring项目开发的智能助手:通义灵码使用指南

阿里云云效

云计算 spring

龙蜥社区荣获 OS2ATC 2025 “最具影响力开源创新贡献奖”

OpenAnolis小助手

开源 操作系统 龙蜥社区 OpenAnolis

基于Raft协议 + gRPC长连接实现集群间的服务发现、服务注册、元数据共享、元数据持久化

路 飞

什么是用于REST API的JWT Bearer令牌以及如何通过代码和工具进行调试

数据追梦人

Python3 AI 通义灵码 VSCode插件安装与功能详解

阿里云云效

Python

音乐NFT项目的技术开发

北京木奇移动技术有限公司

区块链技术 软件外包公司 音乐NFT

Apache DolphinScheduler 3.3.0 Alpha发布,功能增强与性能优化大升级!

白鲸开源

大数据 开源 Apache DolphinScheduler 任务调度 发版

Spring项目开发的智能助手:通义灵码使用指南

阿里巴巴云原生

spring

Python3 AI 通义灵码 VSCode插件安装与功能详解

阿里巴巴云原生

Python

龙蜥RISC-V SIG 2.0研讨会圆满举办,宋卓当选国际基金会Datacenter SIG主席

OpenAnolis小助手

AI 操作系统 高性能计算 龙蜥社区 OpenAnolis

如何用元数据湖解决多 Lakehouse 治理难题|QCon 北京_架构_QCon全球软件开发大会_InfoQ精选文章