写点什么

构建现代化数仓 将 MPP DBMS 迁移至 Spark

  • 2019-09-05
  • 本文字数:558 字

    阅读完需:约 2 分钟

构建现代化数仓 将MPP DBMS迁移至Spark

QCon上海2018大会上,俞育才讲师做了《构建现代化数仓: 将 MPP DBMS 迁移至 Spark》主题演讲,主要内容如下。


演讲简介


eBay 使用 MPP 数据仓库已经有二十年的历史,我们的系统有 60PB 的数据,上万张的核心表,他们支撑着 eBay 最核心的商务逻辑和站点功能。从 17 年开始,eBay 将这个庞大的数仓向 Spark 做迁移,使用我们开发的工具,这其中 90%的工作都可以自动化地完成,并且通过优化 Spark 框架,我们节省了一半的内存。本次演讲我们将分享这迁移过程中的实践,经验与优化。

听众受益

  • 自动化数据迁移工具集:元数据管理,SQL 转换器,管道生成器,数据验证,工作流控制等;

  • 数据的物理布局:如何对表做 bucket 和 partition;

  • 使用 Spark 的 Adaptive Execution 简化参数配置,优化内存使用,处理数据倾斜;

  • 使用 Spark 的 Indexed Bucket 提升大量核心表的查询性能。


讲师介绍


俞育才


eBay 大数据架构师


俞育才,毕业于上海交大,eBay 大数据架构师,负责 Spark 数据平台的设计与优化。12 年软件开发经验,Apache Spark 的活跃开发者,熟悉系统软件的性能分析与调优,为 Spark 设计和实现了自适应执行引擎和层次化存储。在加入 eBay 之前,俞育才在英特尔工作了 9 年,领导团队研究各种前沿的硬件技术加速云和大数据计算。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2018/shanghai/schedule


2019-09-05 16:383125

评论

发布
暂无评论
发现更多内容

Java学习笔记——内部类,linux底层架构

Java 程序员 后端

Java中的程序控制流程,java在线编译器实现原理

Java 程序员 后端

Java各种锁详情,java中间件技术及其应用开发

Java 程序员 后端

Java基础 - 单列集合,ArrayList,Vector,从零开始学springboot百度网盘

Java 程序员 后端

Java匹马行天下之一顿操作猛如虎,框架作用知多少?,HTTPS面试常问全解析

Java 程序员 后端

Java基础22 网络编程(HTTP和UDP),java基础入门课后编程题答案

Java 程序员 后端

Java多态实现原理,java同步锁原理

Java 程序员 后端

Java学到什么程度才算精通?,springmvc原理图解

Java 程序员 后端

JavaWeb JSP详解,java语言程序设计基础篇第十一版答案

Java 程序员 后端

Java中高级核心知识全面解析——JVM,java全套视频教程

Java 程序员 后端

java使用poi操作world生成饼图,柱状图,折线图,java微服务架构训练营

Java 程序员 后端

Java基础16 集合(ArrayList、LinkedList,linux操作系统教程电子版

Java 程序员 后端

JavaWeb Ajax详解,java开发面试问题大全及答案大全

Java 程序员 后端

Java中高级核心知识全面解析——Dubbo,java架构师课程下载

Java 程序员 后端

Java基础 - 正则,Math,Random,零基础学java电子书

Java 程序员 后端

Java之String重点解析,成功定级腾讯T3-2

Java 程序员 后端

Java基础15 Java常用类,深入剖析

Java 程序员 后端

Java基础面试题——IO流,Netty时间轮调度算法原理分析

Java 程序员 后端

Java中高级核心知识全面解析——系统设计(RestFul-API[概念

Java 程序员 后端

Java中高级核心知识全面解析——常用框架(Spring常用注解

Java 程序员 后端

JAVA多线程和并发基础面试问答,吊打面试官你也可以,看完这一篇你就懂了

Java 程序员 后端

031云原生之应用性能监测

穿过生命散发芬芳

云原生 10月月更

Java中高级核心知识全面解析——常用框架(Spring中都用到了那些设计模式-)

Java 程序员 后端

Java到Kotlin入门,这一篇就够啦,java开发岗高频面试题全解析祖国的花朵

Java 程序员 后端

Java中return和finally到底哪个先执行,java程序设计实用教程叶核亚第五版

Java 程序员 后端

java入门基础三(执行语句),Java多线程面试题大全含答案

Java 程序员 后端

Java基础面试题——IO流(1),mysql数据库开发面试

Java 程序员 后端

Java学习笔记——String,java程序开发实战教程在线

Java 程序员 后端

JavaWeb - response对象,重定向,定时跳转案例,蚂蚁金服内推四面

Java 程序员 后端

JavaWeb快速入门--Bootstrap,java获取视频时长

Java 程序员 后端

JavaWeb快速入门--Filter&Listener,java百度网盘课程

Java 程序员 后端

构建现代化数仓 将MPP DBMS迁移至Spark_QCon_俞育才_InfoQ精选文章