写点什么

Kubernetes 运行大数据工作负载的探索和实践

  • 2020-02-05
  • 本文字数:744 字

    阅读完需:约 2 分钟

Kubernetes 运行大数据工作负载的探索和实践

ArchSummit 北京 2019 大会上,王雷博讲师做了《Kubernetes 运行大数据工作负载的探索和实践》主题演讲,主要内容如下。


演讲简介


随着 Kubernetes 的成熟,越来越多的大数据用户希望将 Spark 作业运行在 Kubernetes 之上。Spark 从 2.3 版本开始已经可以运行在 Kubernetes 之上,然而目前 Kubernetes 默认调度器对于大数据场景的支持还有很多不足,例如高并发场景,动态集群资源共享场景,亲和调度场景等。Volcano 针对于这些大数据特有场景进行了定制化开发。提供了 Pod delay creation,Queue,Zone aware scheduling 等,获得了很好的功能体验和性能提升。


在本次演讲中将介绍 Kubernetes 运行大数据工作负载的探索和实践,以及 Volcano 针对大数据工作负载的优化,并演示相应的功能和性能提升等。


内容大纲


  1. Kubernetes 运行大数据作业的现状

  2. Kubernetes 运行大数据的痛点

  3. Volcano 针对大数据的方案设计

  4. 性能方面的提升

  5. 后续的改进计划


听众受益点


  1. 如何在社区中运营一个开源项目

  2. 如何使用 Kubernetes 来运行大数据

  3. 如何优化 Kuberentes 来支持 计算类任务


讲师介绍


王雷博


华为 基础服务产品部/主任工程师


华为云基础服务产品部主任工程师,曾就职于 NEC,Platform computing,IBM,Oracle 等公司。拥有 10 年以上大规模分布式计算、高性能计算领域的从业经验。熟悉云原生和大数据领域的开源生态系统。专注于大规模集群资源管理,资源调度,作业调度引擎的开发。


目前主要负责 Volcano 云原生批量计算平台的研发工作。Volcano 社区致力于在 Kubernetes 上构建一个批处理调度系统,提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。Volcano 目前已广泛应用在大数据,AI,基因容器等服务领域。












完整演讲 PPT 下载链接


https://archsummit.infoq.cn/2019/beijing/schedule


2020-02-05 19:551466

评论

发布
暂无评论
发现更多内容

企业采购比价:品牌采购时借用淘宝商品详情接口来采购比价

tbapi

淘宝商品详情接口

【JIT/极态云】技术文档--标准组织

武汉万云网络科技有限公司

低代码

⭐️ GitHub Star 数量前十的工作流项目

NocoBase

GitHub 开源 工作流 工作流引擎 工作流自动化

淘宝API接口探索:图片搜索拍立淘与商品评论的深度挖掘

代码忍者

API 接口 pinduoduo API

HyperWorks基于 Shrink Warp Mesh 的零部件网格剖分

智造软件

仿真 仿真软件 Hypermesh

双 11 营销活动数量、转化率双提升,火山引擎数智平台为此都做了什么?

字节跳动数据平台

TiDB v8.x Tiproxy组件

TiDB 社区干货传送门

8.x 实践

荣誉再加码!天翼云揽获SD-WAN & SASE大会两项大奖!

科技热闻

【线上发布会预约中】资源有限,性能无限:GreptimeDB Edge 赋能车端数据处理新高度

Greptime 格睿科技

数据库 汽车 性能报告

TiDB连接的探活功能探索

TiDB 社区干货传送门

TiDB 源码解读 6.x 实践 数据库连接

TiDB基于硬件部署估算 (RU)容量功能探索

TiDB 社区干货传送门

TiDB 源码解读 新版本/特性解读

探索 Go 语言中的内存对齐:为什么结构体大小会有所不同?

左诗右码

Go

【GreatSQL优化器-04】贪婪搜索算法浅析

GreatSQL

SD-WAN技术如何优化TikTok直播网络?

Ogcloud

SD-WAN SD-WAN组网 SD-WAN服务商 tiktok直播 tiktok直播网络

如何理解ArkTS不支持structural typing

威哥爱编程

华为 HarmonyOS Open Harmony ArkTS HarmonyOS NEXT

“老爷机”训不动Lora?一台云电脑就可以让你轻松炼丹

Finovy Cloud

LoRa 云电脑

山西省等保测评公司名单【2025】

行云管家

网络安全 等保 山西

【等保小知识】信息系统怎么定义?等保测评多久一次?

行云管家

信息系统 等保 等保测评

携手上海证券,共同见证市场活跃背景下交易服务新趋势

非凸科技

上海证券 非凸科技

ticdc 同步延迟指标与原理解析

TiDB 社区干货传送门

6.x 实践

YOLOP 多任务算法详解

地平线开发者

自动驾驶 算法

CST软件如何使用Poser人体摆姿势

思茂信息

cst cst使用教程 CST软件

【JIT/极态云】技术文档--钉钉自建组织

武汉万云网络科技有限公司

低代码

如何通过SD-WAN实现多云平台的高效互联?

Ogcloud

SD-WAN 多云管理 SD-WAN组网 多云互联 多云部署

【创新视角】解锁淘宝商品详情API:让商品主图与详情图“跃然屏上”,重塑购物体验魅力!

代码忍者

API 接口 pinduoduo API

DR Auto-Sync:TiDB 同城两中心自适应同步复制技术解析

TiDB 社区干货传送门

新版本/特性解读

如何设置自动化测试断言?

老张

软件测试 自动化测试 接口测试 质量保障

Kubernetes 运行大数据工作负载的探索和实践_ArchSummit_王雷博_InfoQ精选文章