速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

构建现代化数仓 将 MPP DBMS 迁移至 Spark

  • 2019-09-05
  • 本文字数:558 字

    阅读完需:约 2 分钟

构建现代化数仓 将MPP DBMS迁移至Spark

QCon上海2018大会上,俞育才讲师做了《构建现代化数仓: 将 MPP DBMS 迁移至 Spark》主题演讲,主要内容如下。


演讲简介


eBay 使用 MPP 数据仓库已经有二十年的历史,我们的系统有 60PB 的数据,上万张的核心表,他们支撑着 eBay 最核心的商务逻辑和站点功能。从 17 年开始,eBay 将这个庞大的数仓向 Spark 做迁移,使用我们开发的工具,这其中 90%的工作都可以自动化地完成,并且通过优化 Spark 框架,我们节省了一半的内存。本次演讲我们将分享这迁移过程中的实践,经验与优化。

听众受益

  • 自动化数据迁移工具集:元数据管理,SQL 转换器,管道生成器,数据验证,工作流控制等;

  • 数据的物理布局:如何对表做 bucket 和 partition;

  • 使用 Spark 的 Adaptive Execution 简化参数配置,优化内存使用,处理数据倾斜;

  • 使用 Spark 的 Indexed Bucket 提升大量核心表的查询性能。


讲师介绍


俞育才


eBay 大数据架构师


俞育才,毕业于上海交大,eBay 大数据架构师,负责 Spark 数据平台的设计与优化。12 年软件开发经验,Apache Spark 的活跃开发者,熟悉系统软件的性能分析与调优,为 Spark 设计和实现了自适应执行引擎和层次化存储。在加入 eBay 之前,俞育才在英特尔工作了 9 年,领导团队研究各种前沿的硬件技术加速云和大数据计算。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-05 16:383107

评论

发布
暂无评论
发现更多内容

市场表现低迷,本周期的山寨币还有投资机会吗?

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

结合RNN与Transformer双重优点,深度解析大语言模型RWKV

华为云开发者联盟

深度学习 华为云 transformers 华为云开发者联盟 企业号2024年7月PK榜

万字详解!在 Go 语言中操作 ElasticSearch

左诗右码

Elasticsearch SQL

Python 使用 FastAPI 和 PostgreSQL 构建简单 API

我再BUG界嘎嘎乱杀

Python postgresql 开发语言 FastApi

Net5.5G,全球运营商的AI之翼

脑极体

AI

win版EssentialPIM Pro Business(个人信息管理器) v12.0.2 中文注册版

iMac小白

win版4K Video Downloader Plus(4K视频下载器) v1.7.2特别版

iMac小白

win版4K Video Downloader(高清视频下载软件) v4.31特别版

iMac小白

EMQX 与 MQTT: AI 大模型时代的分布式数据中枢

EMQ映云科技

mqtt mqtt broker

从超越数字到卓越叙事,感受数据可视化的力量

智达方通

企业管理 全面预算管理 财务管理 财务规划

Java for循环倒序输出

EquatorCoco

Java Python

弹性云主机实例怎么选?

天翼云开发者社区

云计算 云主机

华为大咖说 企业应用AI大模型的“道、法、术” -- 法:落地篇 (上)

华为云PaaS服务小智

人工智能 企业 华为云

ES-Computing EditPlus(文本编辑器)v6.0.6直装版

iMac小白

win版Advanced SystemCare Pro(电脑优化工具) v17.5特别版

iMac小白

Galaxy Digital Q2 加密风投报告:反弹仍在持续,与上一轮牛市还有差距

TechubNews

使用 Makefile 管理和部署 Go 项目

左诗右码

Go

团队待办事项软件:2024年主流的20款分析

爱吃小舅的鱼

任务管理 待办事项管理软件 todo软件

利用亚马逊云科技生成式AI工具微调COE流程

亚马逊云科技 (Amazon Web Services)

一文为你深度解析LLaMA2模型架构

快乐非自愿限量之名

深度学习 架构 nlp 模型架构

容器的优势,在Docker中运行Tomcat

天翼云开发者社区

云计算 虚拟机 容器服务

win版Aiseesoft Video Converter Ultimate(万能视频转换器) v10.8.50激活版

iMac小白

构建现代化数仓 将MPP DBMS迁移至Spark_QCon_俞育才_InfoQ精选文章