产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

Kubernetes 运行大数据工作负载的探索和实践

  • 2020-02-05
  • 本文字数:744 字

    阅读完需:约 2 分钟

Kubernetes 运行大数据工作负载的探索和实践

ArchSummit 北京 2019 大会上,王雷博讲师做了《Kubernetes 运行大数据工作负载的探索和实践》主题演讲,主要内容如下。


演讲简介


随着 Kubernetes 的成熟,越来越多的大数据用户希望将 Spark 作业运行在 Kubernetes 之上。Spark 从 2.3 版本开始已经可以运行在 Kubernetes 之上,然而目前 Kubernetes 默认调度器对于大数据场景的支持还有很多不足,例如高并发场景,动态集群资源共享场景,亲和调度场景等。Volcano 针对于这些大数据特有场景进行了定制化开发。提供了 Pod delay creation,Queue,Zone aware scheduling 等,获得了很好的功能体验和性能提升。


在本次演讲中将介绍 Kubernetes 运行大数据工作负载的探索和实践,以及 Volcano 针对大数据工作负载的优化,并演示相应的功能和性能提升等。


内容大纲


  1. Kubernetes 运行大数据作业的现状

  2. Kubernetes 运行大数据的痛点

  3. Volcano 针对大数据的方案设计

  4. 性能方面的提升

  5. 后续的改进计划


听众受益点


  1. 如何在社区中运营一个开源项目

  2. 如何使用 Kubernetes 来运行大数据

  3. 如何优化 Kuberentes 来支持 计算类任务


讲师介绍


王雷博


华为 基础服务产品部/主任工程师


华为云基础服务产品部主任工程师,曾就职于 NEC,Platform computing,IBM,Oracle 等公司。拥有 10 年以上大规模分布式计算、高性能计算领域的从业经验。熟悉云原生和大数据领域的开源生态系统。专注于大规模集群资源管理,资源调度,作业调度引擎的开发。


目前主要负责 Volcano 云原生批量计算平台的研发工作。Volcano 社区致力于在 Kubernetes 上构建一个批处理调度系统,提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。Volcano 目前已广泛应用在大数据,AI,基因容器等服务领域。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/beijing/schedule


2020-02-05 19:551396

评论

发布
暂无评论
发现更多内容

读《Software Systems Architecture》(19)—— The Concurrency Viewpoint

术子米德

架构师成长笔记

读《Software Systems Architecture》(24)—— Introduction to the Perspective Catalog

术子米德

架构师成长笔记

读《Software Systems Architecture》(25)—— The Security Perspective

术子米德

架构师成长笔记

力扣每日一练之二维数组上篇Day4

京与旧铺

6月月更

读《Software Systems Architecture》(18)—— The Information Viewpoint

术子米德

架构师成长笔记

读《Software Systems Architecture》(23)—— Archiving Consistency Across Views

术子米德

架构师成长笔记

gogs使用webhook部署react单页应用

Nick

ci 持续集成 React 6月月更 gogs

读《Software Systems Architecture》(22)—— The Operational Viewpoint

术子米德

架构师成长笔记

字符串

Jason199

js 字符串 6月月更

读《Software Systems Architecture》(26)—— The Performance and Scalability Perspective

术子米德

架构师成长笔记

[数据分析实践]-文本分析-U.S. Patent Phrase-1

浩波的笔记

数据分析

【愚公系列】2022年06月 通用职责分配原则(三)-低耦合原则

愚公搬代码

6月月更

中台的细节

卢卡多多

中台 6月月更

python停车时间计算,时分秒计算(split()函数)

写代码两年半

Python 6月月更

CentOS环境基于nginx搭建负载均衡

乌龟哥哥

6月月更

InfoQ 极客传媒 15 周年庆征文|漫谈公网网络延迟

耳东@Erdong

运维 6月月更 InfoQ极客传媒15周年庆 网络延迟

读《Software Systems Architecture》(16)—— The Context Viewpoint

术子米德

架构师成长笔记

读《Software Systems Architecture》(17)—— The Functional Viewpoint

术子米德

架构师成长笔记

在线JSON转TSV工具

入门小站

工具

读《Software Systems Architecture》(21)—— The Deployment Viewpoint

术子米德

架构师成长笔记

读《Software Systems Architecture》(27)—— The Availability and Resilience Perspective

术子米德

架构师成长笔记

【协程】LifecycleScope源码解析

yechaoa

android 协程 6月月更 LifecycleScope

莫把功能当能力!从企业架构视角看警察在火锅店站岗

涛哥 数字产品和业务架构

企业架构

c语言选择,循环语句概述

工程师日月

6月月更

读《Software Systems Architecture》(20)—— The Development Viewpoint

术子米德

架构师成长笔记

Java中检查字符串是否是有效日期

okokabcd

Java

读《Software Systems Architecture》(28)—— The Evolution Perspective

术子米德

架构师成长笔记

flutter系列之:Material中的3D组件Card

程序那些事

flutter 程序那些事 6月月更

Java Core 「8」字节码增强技术

Samson

学习笔记 Java core 6月月更

远程办公-如何提高开会效率?| 社区征文

石云升

远程办公 开会 会议 6月月更 初夏征文

JVM调优简要思想及简单案例-JVM是什么?

zarmnosaj

6月月更

Kubernetes 运行大数据工作负载的探索和实践_ArchSummit_王雷博_InfoQ精选文章