Kubernetes 运行大数据工作负载的探索和实践_ArchSummit_王雷博_InfoQ精选文章

Kubernetes 运行大数据工作负载的探索和实践

在 ArchSummit 北京 2019 大会上，王雷博讲师做了《Kubernetes 运行大数据工作负载的探索和实践》主题演讲，主要内容如下。

演讲简介：

随着 Kubernetes 的成熟，越来越多的大数据用户希望将 Spark 作业运行在 Kubernetes 之上。Spark 从 2.3 版本开始已经可以运行在 Kubernetes 之上，然而目前 Kubernetes 默认调度器对于大数据场景的支持还有很多不足，例如高并发场景，动态集群资源共享场景，亲和调度场景等。Volcano 针对于这些大数据特有场景进行了定制化开发。提供了 Pod delay creation，Queue，Zone aware scheduling 等，获得了很好的功能体验和性能提升。

在本次演讲中将介绍 Kubernetes 运行大数据工作负载的探索和实践，以及 Volcano 针对大数据工作负载的优化，并演示相应的功能和性能提升等。

内容大纲：

Kubernetes 运行大数据作业的现状
Kubernetes 运行大数据的痛点
Volcano 针对大数据的方案设计
性能方面的提升
后续的改进计划

听众受益点：

如何在社区中运营一个开源项目
如何使用 Kubernetes 来运行大数据
如何优化 Kuberentes 来支持计算类任务

讲师介绍：

王雷博

华为基础服务产品部/主任工程师

华为云基础服务产品部主任工程师，曾就职于 NEC，Platform computing，IBM，Oracle 等公司。拥有 10 年以上大规模分布式计算、高性能计算领域的从业经验。熟悉云原生和大数据领域的开源生态系统。专注于大规模集群资源管理，资源调度，作业调度引擎的开发。

目前主要负责 Volcano 云原生批量计算平台的研发工作。Volcano 社区致力于在 Kubernetes 上构建一个批处理调度系统，提供高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力。Volcano 目前已广泛应用在大数据，AI，基因容器等服务领域。

完整演讲 PPT 下载链接：

https://archsummit.infoq.cn/2019/beijing/schedule

评论

发布

暂无评论

企业采购比价：品牌采购时借用淘宝商品详情接口来采购比价

淘宝商品详情接口

【JIT/极态云】技术文档--标准组织

武汉万云网络科技有限公司

⭐️ GitHub Star 数量前十的工作流项目

GitHub 开源工作流工作流引擎工作流自动化

淘宝API接口探索：图片搜索拍立淘与商品评论的深度挖掘

API 接口 pinduoduo API

HyperWorks基于 Shrink Warp Mesh 的零部件网格剖分

仿真仿真软件 Hypermesh

双 11 营销活动数量、转化率双提升，火山引擎数智平台为此都做了什么？

字节跳动数据平台

TiDB v8.x Tiproxy组件

TiDB 社区干货传送门

荣誉再加码！天翼云揽获SD-WAN & SASE大会两项大奖！

【线上发布会预约中】资源有限，性能无限：GreptimeDB Edge 赋能车端数据处理新高度

Greptime 格睿科技

数据库汽车性能报告

TiDB连接的探活功能探索

TiDB 社区干货传送门

TiDB 源码解读 6.x 实践数据库连接

TiDB基于硬件部署估算 (RU)容量功能探索

TiDB 社区干货传送门

TiDB 源码解读新版本/特性解读

探索 Go 语言中的内存对齐：为什么结构体大小会有所不同？

【GreatSQL优化器-04】贪婪搜索算法浅析

SD-WAN技术如何优化TikTok直播网络？

SD-WAN SD-WAN组网 SD-WAN服务商 tiktok直播 tiktok直播网络

如何理解ArkTS不支持structural typing

威哥爱编程

华为 HarmonyOS Open Harmony ArkTS HarmonyOS NEXT

“老爷机”训不动Lora？一台云电脑就可以让你轻松炼丹

山西省等保测评公司名单【2025】

网络安全等保山西

【等保小知识】信息系统怎么定义？等保测评多久一次？

信息系统等保等保测评

携手上海证券，共同见证市场活跃背景下交易服务新趋势

上海证券非凸科技

ticdc 同步延迟指标与原理解析

TiDB 社区干货传送门

YOLOP 多任务算法详解

地平线开发者

自动驾驶算法

CST软件如何使用Poser人体摆姿势

cst cst使用教程 CST软件

【JIT/极态云】技术文档--钉钉自建组织

武汉万云网络科技有限公司

如何通过SD-WAN实现多云平台的高效互联？

SD-WAN 多云管理 SD-WAN组网多云互联多云部署

【创新视角】解锁淘宝商品详情API：让商品主图与详情图“跃然屏上”，重塑购物体验魅力！

API 接口 pinduoduo API

DR Auto-Sync：TiDB 同城两中心自适应同步复制技术解析

TiDB 社区干货传送门

新版本/特性解读

如何设置自动化测试断言？

软件测试自动化测试接口测试质量保障