QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

K8s 为 AI 应用提供大规模 GPU 算力之实践

  • 2019-08-11
  • 本文字数:442 字

    阅读完需:约 1 分钟

K8s 为 AI 应用提供大规模 GPU 算力之实践

QCon北京2019大会上,李程讲师做了《K8s 为 AI 应用提供大规模 GPU 算力之实践》主题演讲,主要内容如下。


演讲简介


华为云 CCI 服务管理数百个 GPU 卡,为华为云 EI 服务及外部客户提供 AI 计算平台,在该过程中积累了大量面向 AI 计算的优化经验。AI 计算加速的关键是 GPU 管理,K8S 资源调度优化,面向 AI 计算框架和模型的 Job/Task 调度。通过这些优化手段可以使得 128 块 GPU 卡的线性加速比达到 0.8+。本次议题将介绍如何通过开源项目 K8S + Kata 容器搭建 AI 计算平台,最大化 GPU 及 AI 芯片算力的使用效率,并给出测试结果。最后我们也会对未来的技术改进做出展望。

听众受益

  1. 了解基于 K8S 的 AI 框架的现状;

  2. 了解大规模 GPU 在 AI 分布式训练场景下的应用;

  3. 了解 K8S 在人工智能场景下的优化思路。


讲师介绍


李程


华为 高级软件架构师


2011 年加入华为,先后参与网络软件平台、SDN、公有云容器服务等产品的架构设计工作,目前任华为 Serverless 容器服务 CCI 架构师。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019-08-11 00:001761

评论

发布
暂无评论
发现更多内容

传统大数据迁移遇到的问题与解决方案

镭速

大数据迁移

12个强大的 JavaScript 动画库,可帮助你提升用户体验

互联网工科生

JavaScript 动画库

腾讯云生态以退为进,让「半条命」撑起「半边天」

ToB行业头条

安全检测演进,AIGC融合模糊测试开启新时代

云起无垠

网路安全

产教融合 | 力软联合重庆科技学院开展低代码应用开发培训

力软低代码开发平台

两行代码实现Redis消息队列,简单易用

高端章鱼哥

redis 消息列队

使用融云 CallPlus SDK,一小时实现一款 1V1 视频应用

融云 RongCloud

android 音视频 通信 API CallPlus SDK

ShutdownHook妙用

FunTester

用户级协议和框架:DPDK、SPDK和VPP的业务场景和发展趋势

统信软件

在对接自有账户体系时,FinClip 是怎么做的?

Onegun

用户 账户管理 账户体系

NFTScan 正式上线 TON NFTScan 浏览器!

NFT Research

NFT\

GaussDB技术解读系列丨运维自动驾驶探索

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号9月PK榜

Mac电脑十六进制编辑器 010 Editor 激活永久版

胖墩儿不胖y

代码编辑器 Mac软件

HiAI Foundation助力端侧音视频AI能力,高性能低功耗释放云侧成本

HarmonyOS SDK

huawei HarmonyOS

Vue 和 React 前端框架的比较

高端章鱼哥

Vue React

多场景PAI-Diffusion中文模型家族大升级,12个模型、2个工具全部开源

阿里云大数据AI技术

人工智能 阿里云

lrc下载安装 图像处理软件Lightroom Classic 2023 mac中文激活版

mac

图像处理软件 苹果mac Windows软件 lrc2023 Lightroom Classic

矩视快问快答

矩视智能

机器视觉 深度学习、

【玩转鲲鹏 DevKit系列】如何快速迁移无源码应用?

华为云开发者联盟

后端 开发 华为云 华为云开发者联盟 企业号9月PK榜

跟单交易所开发,合约跟单交易系统开发

V\TG【ch3nguang】

中国智能卡车“遥遥领先”:卡车NOA落地5000万公里0事故,全球首个

Openlab_cosmoplat

人工智能 自动驾驶

数据库重构之路,以 OrientDB 到 NebulaGraph 为例

NebulaGraph

数据库

企业文件传输遇到的问题与解决方案

镭速

大文件传输 数据文件传输

XMind for mac (XMind思维导图)v23.08中文激活版

mac

XMind 思维导图软件 苹果mac Windows软件

软件测试/测试开发丨学会与 AI 对话,高效提升学习效率

测试人

人工智能 AI 软件测试 ChatGPT

十种数据库缓存相关的技术和机制

树上有只程序猿

数据库

关于Taro你需要了解这些

Onegun

小程序 taro 小程序架构

什么是网络营销?做网络营销怎么用代理IP?

巨量HTTP

IP

数据艺术,成就科学现代的全面预算管理模式

智达方通

数据分析 数据驱动 智达方通 数据叙事

软件开发文档大全(项目管理、开发、实施、交付、评审、投标支撑)

金陵老街

Vue java;

K8s 为 AI 应用提供大规模 GPU 算力之实践_QCon_李程_InfoQ精选文章