写点什么

使用 TensorFlow 和 Kubernetes 构建 GPU 加速工作流

  • 2018-01-10
  • 本文字数:832 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Daniel Whitenack 在最近举行的北美 2017 KubeCon+CloudNativeCon 大会上分享了如何使用 TensorFlow 和 Kubernetes 进行基于 GPU 的深度学习。

他以物体检测为例子介绍了一种典型的人工智能工作流程。该工作流程包括预处理、模型训练、模型生成和模型推理。这些步骤都可以运行在 Docker 容器里。

模型训练一般是通过框架来完成的,如 TensorFlow 或 Caffe。在这一阶段,GPU 可用于帮助提升性能。深度学习在使用 TensorFlow 或其他框架时,需要借助 GPU 在图像数据上训练模型。

模型训练可以运行在 Kubernetes 集群的 GPU 节点上。Kubernetes 为多 GPU 节点提供了一个非常好的框架,按照如下步骤可实现更好的工作流:

  • 将数据正确地分配代码(pod)。

  • 在正确的节点上处理数据。

  • 在正确的时间触发正确的代码。

该工作流程也可以用于跟踪哪个版本的代码和数据产生了哪些结果(用于调试、维护和合规的目的)。

Kubernetes 为此提供了基础支持,也因为它具备了可移植性和可伸缩性,所以非常适用于机器学习项目。

Whitenack 介绍了一个叫作 Pachyderm 的开源项目,它支持数据管道,并为 Kubernetes 提供了数据管理层。工作流中一般会包含多个数据预处理和后处理作业。Pachyderm 提供了统一的框架用于调度多步骤工作流、数据管理和向 GPU 分配工作负载。

Pachyderm 框架的特性包括:

  • 数据版本:版本化的数据可存储在 Amazon S3 数据库里。

  • 用于分析的容器。

  • 分布式管道或数据处理 DAG。

  • 数据监管:可用于合规和调试。

Whitenack 在现场进行了演示,使用 Pachyderm 和 Kubernetes 实现了一个 AI 工作流。示例应用程序实现了图像到图像的转换,将卫星图自动转成地图。他在例子中使用 TensorFlow 进行模型训练和推理。

如果读者对 Pachyderm 框架感兴趣,可以参考机器学习示例开发者文档 Kubernetes GPU 文档,或者直接加入 Slack 通道

查看英文原文 Building GPU Accelerated Workflows with TensorFlow and Kubernetes

2018-01-10 18:003064
用户头像

发布了 322 篇内容, 共 144.2 次阅读, 收获喜欢 148 次。

关注

评论

发布
暂无评论
发现更多内容

【论文速读】| CHEMFUZZ: 大语言模型辅助模糊测试用于量子化学软件缺陷检测

云起无垠

从小白到高手 我只用了30天【全栈开发与测试定向培养班】

测试人

软件测试

LLM 推理优化探微 (4) :模型性能瓶颈分类及优化策略

Baihai IDP

程序员 AI LLM 白海科技 企业号 4 月 PK 榜

高质量ChatGPT Prompts 精选

蓉蓉

#人工智能 ChatGPT GPT-4 Prompt

从小白到高手 我只用了30天【全栈开发与测试定向培养班】

测吧(北京)科技有限公司

测试

户外LED电子广告屏市场

Dylan

技术 广告 应用 LED LED显示屏

活动预告|NineData 创始人&CEO叶正盛将参加QCon全球软件开发大会,共话AI大模型技术在数据库DevOps的实践

NineData

数据库 DevOps Qcon AI大模型 NineData

Automation Anywhere 在 Google Cloud 上为数百家企业带来 Gemini 模型驱动的流程自动化

财见

前端代码规范 - 代码注释

南城FE

前端 代码质量 代码 代码注释

从小白到高手,我只用了一个月

霍格沃兹测试开发学社

MES系统怎么解决车间生产调度难的问题?

万界星空科技

mes 万界星空科技 生产管理 生产调度 车间管理

华为云发布CodeArts API,为API护航

华为云开发者联盟

API 华为云 华为云开发者联盟 华为云CodeArts 企业号2024年4月PK榜

观测云产品更新 | 监控器、查看器、基础设施容器等

观测云

监控

分享:在 Apifox 中使用 CryptoJS 进行 AES 加密

Apifox

前端 后端 Apifox CryptoJS AES 加密

微信团队分享:来看看微信十年前的IM消息收发架构,你做到了吗

JackJiang

即时通讯;IM;网络编程

万界星空科技低代码平台,快速搭建MES系统

万界星空科技

低代码 低代码平台 mes 万界星空科技

Redis Pipelining 底层原理分析及实践

vivo互联网技术

redis pipelining

8毫秒即可出站:浪潮云海筑基云收费站

财见

百度一站式数据自助分析平台(TDA)建设

百度Geek说

数据分析 企业号 4 月 PK 榜 一站式自助分析BI

实况窗助力美团打造鸿蒙原生外卖新体验,用户可实时掌握外卖进展

HarmonyOS SDK

HarmonyOS

MES与WMS的区别

万界星空科技

wms mes 生产管理 仓库管理系统 智能仓库

使用TensorFlow和Kubernetes构建GPU加速工作流_语言 & 开发_Srini Penchikala_InfoQ精选文章