AICon 上海站|90%日程已就绪,解锁Al未来! 了解详情
写点什么

Data Warebase 一体化数据平台的云原生实践 | QCon 北京

  • 2025-04-01
    北京
  • 本文字数:1560 字

    阅读完需:约 5 分钟

大小:819.11K时长:04:39
Data Warebase一体化数据平台的云原生实践 | QCon北京

2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将汇聚全球 140+ 技术先行者及创新实践者,直击行业痛点,解锁可复制的经验与模式。这不仅是一场会议,更是一次对技术演进的集体探索。无论你是资深开发者,还是技术管理者,都能在这里有所收获,为下一步的技术决策提供方向。


ProtonBase 技术副总裁杨克特已确认出席并发表题为《Data Warebase-- 一体化数据平台的云原生实践》的主题分享,深度解析两大场景的技术攻坚:针对 TP/AP 一体化,如何通过分布式事务保障强一致性、行列混合存储优化资源隔离,实现 TP 和 AP 负载的高效共存;针对实时离线一体化,如何通过实时处理和增量计算技术融合的方案,突破传统 Lambda 架构冗余开发与时效性瓶颈,解决当前主流流批引擎痛点。同时分享 Data Warebase 如何以云原生存算分离为基础,集成统一元数据、智能资源调度等能力,简化多场景架构复杂度,为未来数据与 AI 深度协同提供坚实底座。


杨克特具备 10 多年核心系统设计和研发经验。曾任阿里巴巴资深技术专家,负责过搜索引擎、资源调度、实时监控等系统的设计和研发。具备丰富的开源经验,是 Apache Flink 和 Apache Druid 的 PMC 成员,以及 Apache 软件基金会成员。他在本次会议的详细演讲内容如下:


演讲提纲

1.数据平台的云原生进程

- 典型数据架构的演进过程- 数据本身对上云带来的挑战

2.当前数据平台的痛点和新场景需求

- 常见痛点介绍- TP / AP 一体化需求- 离线实时融合需求- AI 数据协同

3.云原生数据平台的基础架构设计- 如何保证数据系统扩展性- 数据分片策略的取舍- 解决分布式数据不一致的问题- 如何保证数据系统的弹性- 实时读写给弹性带来的挑战- 选择合适的存算分离架构

4.TP / AP 一体化需求- 常见场景介绍- 介绍核心技术挑战和实践- 如何保证 TP 和 AP 的数据一致性- 如何保证 TP 和 AP 的资源隔离和公平性- 介绍多种性能优化手段

5.离线实时一体化- 介绍 lambda,kappa 等架构的演进- 介绍现有方案在时效性、性能、资源开销三方面的取舍- 介绍现有方案的核心痛点- 提出新的实时处理和增量技术给这个场景带来的全新选择

6.AI 和数据的协同- 介绍 RAG 的基本原理- 传统搜索技术和向量检索的混合

7.Data Warebase 的实践和展望- Data Warebase 如何有效的融合这些核心技术- 通过 Data Warebase 简化数据架构的实践


您认为,这样的技术在实践过程中有哪些痛点?

一体化的方案,往往需要在用户开箱体验和单一场景极致优化中做出选择。为了系统尽可能的简单易用,我们选择了尽量减少配置,保障开箱体验的路线,但这样会牺牲一些极端单一场景的支持。


演讲亮点

- 在 TP/AP 一体化的场景下,大部分系统的方案还是通过数据同步(比如一份行存,一份列存)来实现。我们选择了在一份混合存储上来支持这个负载。- 在离线实时一体化场景下,当下主流的选择是一个流计算系统加一个批处理系统的 lambda 架构,或者以流计算系统为基础的 kappa 架构。我们提出了实时加增量计算融合的全新思路。


听众收益

- 了解当下数据平台的核心痛点和全新需求- 了解 TP/AP 一体化的挑战和实践方案- 了解离线实时体化的场景,挑战和实践方案


除此之外,本次大会还策划了多模态大模型及应用AI 驱动的工程生产力面向 AI 的研发基础设施不被 AI 取代的工程师大模型赋能 AIOps云成本优化Lakehouse 架构演进越挫越勇的大前端等专题,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京现场带来前沿技术洞察和一线实践经验。


目前,所有大会演讲嘉宾已结集完毕,了解更多报名和详情信息可扫码或联系票务经理 18514549229 咨询。



为确保大会顺利举行,现诚邀志愿者加入,时长 3.5 天。可与大咖交流、获极客时间 VIP 月卡、大会演讲视频资源和证书。主办方提供午餐和交通支持。时间:4 月 9 日 13:00-4 月 12 日 18:00,地点:北京万达嘉华酒店,报名链接:https://www.infoq.cn/form/?id=2088

2025-04-01 18:005236

评论

发布
暂无评论

可落地的积极心态

蛋先生DX

心态 6月日更

架构实战营 模块五:课后作业

👈

架构实战营

Go 并发基础

Damon

Go 语言 6月日更

Python位运算符——详解

在即

6月日更

技术管理简单说

蛋先生DX

技术管理 6月日更

【译】JavaScript 代码整洁之道-函数篇

KooFE

JavaScript 大前端 函数 6月日更 整洁代码

设计微博系统中”微博评论“的高性能高可用计算架构

方堃

网络攻防学习笔记 Day36

穿过生命散发芬芳

网络攻防 6月日更

Golang channel 通道

escray

学习 极客时间 Go 语言 6月日更

权限与认证:基于JWT的授权实现

程序员架构进阶

架构 JWT 认证授权 28天写作 6月日更

Java 并发编程—— CountDownLatch 应用

Antway

6月日更

JSON.parse无双引号如何实现转换

吴脑的键客

JavaScript

公司战略:要不要多元化发展?

石云升

创业 职场经验 6月日更

模块五 作业

夏日

架构实战营

Kubernetes手记(2)- 核心组件/附件

雪雷

k8s 6月日更

标识符与保留字(即关键字)

在即

6月日更

架构实战营 模块五:学习总结

👈

架构实战营

Go并发编程-channel多路复用

Rayjun

Go 语言 select

Hadoop实战篇(1)

进击的梦清

大数据 hadoop Linux

模块5 设计微博系统中”微博评论“的高性能高可用计算架构

Chris Cheng

架构实战营

【云原生AI】Fluid + JindoFS 助力微博海量小文件模型训练速度提升 18 倍

阿里巴巴云原生

商业模式创新

soho

身为程序员 你真的会使用github搜索吗?

madison

GitHub GitHub Pages 高效搜索 搜索技巧

使用 Docker 安装并连接 MySQL

程序员小航

MySQL Docker

Pandas之:Pandas简洁教程

程序那些事

Python 大数据 数据分析 pandas 程序那些事

高级软件工程师必备的五大技能

架构精进之路

6月日更 软素质

模块5作业

wade

#架构实战营

如果父母依旧辛苦,那我们的成长又有什么意义?

牧小农

故事 父母

MySQL基础之三:条件查询

打工人!

MySQL 6月日更

音频和视频流最佳选择?SRT协议解析及报文识别

明儿

音视频 协议 流媒体开发

【Vue2.x 源码学习】第五篇 - 数组的劫持

Brave

源码 vue2 6月日更

Data Warebase一体化数据平台的云原生实践 | QCon北京_架构_QCon全球软件开发大会_InfoQ精选文章