写点什么

K8s 为 AI 应用提供大规模 GPU 算力之实践

  • 2019-08-11
  • 本文字数:442 字

    阅读完需:约 1 分钟

K8s 为 AI 应用提供大规模 GPU 算力之实践

QCon北京2019大会上,李程讲师做了《K8s 为 AI 应用提供大规模 GPU 算力之实践》主题演讲,主要内容如下。


演讲简介


华为云 CCI 服务管理数百个 GPU 卡,为华为云 EI 服务及外部客户提供 AI 计算平台,在该过程中积累了大量面向 AI 计算的优化经验。AI 计算加速的关键是 GPU 管理,K8S 资源调度优化,面向 AI 计算框架和模型的 Job/Task 调度。通过这些优化手段可以使得 128 块 GPU 卡的线性加速比达到 0.8+。本次议题将介绍如何通过开源项目 K8S + Kata 容器搭建 AI 计算平台,最大化 GPU 及 AI 芯片算力的使用效率,并给出测试结果。最后我们也会对未来的技术改进做出展望。

听众受益

  1. 了解基于 K8S 的 AI 框架的现状;

  2. 了解大规模 GPU 在 AI 分布式训练场景下的应用;

  3. 了解 K8S 在人工智能场景下的优化思路。


讲师介绍


李程


华为 高级软件架构师


2011 年加入华为,先后参与网络软件平台、SDN、公有云容器服务等产品的架构设计工作,目前任华为 Serverless 容器服务 CCI 架构师。












完整演讲 PPT 下载链接


https://qcon.infoq.cn/2019/beijing/schedule


2019-08-11 00:001836

评论

发布
暂无评论
发现更多内容

C 语言函数完全指南:创建、调用、参数传递、返回值解析

小万哥

程序人生 编程语言 软件工程 C/C++ 后端开发

0.9uA 低功耗低压差稳压器

芯动大师

三分钟部署一个免费妙鸭相机!

鹤涵

人工智能 LoRa Stable Diffustion

拥抱梦想夏令营:2024年暑假招生计划发布,助力青少年成长

科技热闻

我的2024书单

hackstoic

阅读

WorkPlus AI助理为企业提供智能客服的机器人解决方案

BeeWorks

应对 DevOps 中的技术债务:创新与稳定性的微妙平衡

禅道项目管理

DevOps 自动化测试 技术债务 禅道项目管理

布隆过滤器(Space/Time Trade-offsin Hash Coding with Allowable Errors)

乐只

布隆过滤器 计算机科学与技术 论文解读

WorkPlus安全专属的即时通讯解决方案,助力企业高效沟通协作

BeeWorks

IM即时通讯如何引领数字化时代的沟通革命?

BeeWorks

WorkPlus支持平台级定制,助理企业自主掌控业务和生态

BeeWorks

docker日志设置大小、build cache清理及业务日志清理

智慧源点

Docker

DevSecOps|极狐GitLab IaC 安全扫描,保障云原生安全

极狐GitLab

大模型Chatbots评估新视角:结合定性与程序方法的实践经验

Baihai IDP

程序员 AI LLM 白海科技 Chatbots

“云+冷链”新场景,华为云助力前海粤十“物畅其流”

华为云开发者联盟

后端 物联网 华为云 华为云开发者联盟

WorkPlus Meet打造高质量的视频会议体验,助力实时远程协作

BeeWorks

WorkPlus完备的企业级功能堆栈,打造高效的企业移动平台

BeeWorks

聚道云软件连接器助力某新能源行业公司实现付款流程自动化

聚道云软件连接器

案例分享

学员 Luke 的复盘 - 大纲

Luke

K8s 为 AI 应用提供大规模 GPU 算力之实践_QCon_李程_InfoQ精选文章