HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

使用 TensorFlow 和 Kubernetes 构建 GPU 加速工作流

  • 2018-01-10
  • 本文字数:832 字

    阅读完需:约 3 分钟

看新闻很累?看技术新闻更累?试试下载 InfoQ 手机客户端,每天上下班路上听新闻,有趣还有料!

Daniel Whitenack 在最近举行的北美 2017 KubeCon+CloudNativeCon 大会上分享了如何使用 TensorFlow 和 Kubernetes 进行基于 GPU 的深度学习。

他以物体检测为例子介绍了一种典型的人工智能工作流程。该工作流程包括预处理、模型训练、模型生成和模型推理。这些步骤都可以运行在 Docker 容器里。

模型训练一般是通过框架来完成的,如 TensorFlow 或 Caffe。在这一阶段,GPU 可用于帮助提升性能。深度学习在使用 TensorFlow 或其他框架时,需要借助 GPU 在图像数据上训练模型。

模型训练可以运行在 Kubernetes 集群的 GPU 节点上。Kubernetes 为多 GPU 节点提供了一个非常好的框架,按照如下步骤可实现更好的工作流:

  • 将数据正确地分配代码(pod)。

  • 在正确的节点上处理数据。

  • 在正确的时间触发正确的代码。

该工作流程也可以用于跟踪哪个版本的代码和数据产生了哪些结果(用于调试、维护和合规的目的)。

Kubernetes 为此提供了基础支持,也因为它具备了可移植性和可伸缩性,所以非常适用于机器学习项目。

Whitenack 介绍了一个叫作 Pachyderm 的开源项目,它支持数据管道,并为 Kubernetes 提供了数据管理层。工作流中一般会包含多个数据预处理和后处理作业。Pachyderm 提供了统一的框架用于调度多步骤工作流、数据管理和向 GPU 分配工作负载。

Pachyderm 框架的特性包括:

  • 数据版本:版本化的数据可存储在 Amazon S3 数据库里。

  • 用于分析的容器。

  • 分布式管道或数据处理 DAG。

  • 数据监管:可用于合规和调试。

Whitenack 在现场进行了演示,使用 Pachyderm 和 Kubernetes 实现了一个 AI 工作流。示例应用程序实现了图像到图像的转换,将卫星图自动转成地图。他在例子中使用 TensorFlow 进行模型训练和推理。

如果读者对 Pachyderm 框架感兴趣,可以参考机器学习示例开发者文档 Kubernetes GPU 文档,或者直接加入 Slack 通道

查看英文原文 Building GPU Accelerated Workflows with TensorFlow and Kubernetes

2018-01-10 18:002959
用户头像

发布了 322 篇内容, 共 140.1 次阅读, 收获喜欢 145 次。

关注

评论

发布
暂无评论
发现更多内容

「最新永久激活版」DaVinci Resolve Studio 19 ( 达芬奇影视后期调色剪辑) v19.0B5激活版

Rose

蓝易云 - 中小型企业为什么纷纷选择云服务器?

百度搜索:蓝易云

运维 服务器 云服务器 服务器租用 高防服务器

蓝易云 - 在云上使用过哪些外网暴露服务,简单说一下优缺点(nginx-ingress,treafik,云alb,云loadblance)

百度搜索:蓝易云

nginx 运维 云服务器 Traefik loadbalance

AI技术图像编辑软件:Luminar Neo for Mac/win 激活版

你的猪会飞吗

苹果软件下载 Mac破解软件

Rhinoceros 8 (犀牛8 中文最新版) v8.9下载

Rose

阿里云 EMR StarRocks VS 开源版本功能差异介绍

阿里云大数据AI技术

大数据 数据仓库 OLAP EMR

如何冲破大模型时代的算力关卡?天翼云给出答案

脑极体

AI

作为ToB市场总监的你 被老板质疑过花销太大吗?

客户在哪儿AI

ToB营销 ToB获客 ToB增长 ToB销售

Workflow通用并发控制组件:ResourcePool资源池

1412

c++ 开源项目 workflow 并发’

「空投」对于项目来说是好是坏?

TechubNews

Marked 2 for Mac(文件预览工具) v2.6.38免激活版

Rose

选择户外LED显示屏的4个理由

Dylan

互联网 广告 信息 LED LED显示屏

得物AB实验平台数据驱动决策实践

得物技术

大数据 架构 统计学 企业号2024年7月PK榜

项目提效神器:10款顶级项目工单管理系统

爱吃小舅的鱼

项目管理 项目管理系统 工单管理 项目工单管理 项目工单管理系统

网络爬虫开发:JavaScript与Python特性的小差异

我再BUG界嘎嘎乱杀

Python JavaScript 爬虫 开发语言

Ghost Buster Pro for mac(苹果电脑内存清理专家) v3.3.2激活版

Rose

麻省理工IOT教授撰写的1058页Python程序设计人工智能实践手册!

我再BUG界嘎嘎乱杀

Python 人工智能 程序设计 后端 开发语言

借助大模型能力,晓多科技智能客服的效率与服务双提升

新消费日报

人工智能:重塑语言翻译的未来

天津汇柏科技有限公司

人工智能 语言翻译

分享 | 建设全渠道反欺诈平台 持续提升交易风险管控能力

芯盾时代

金融 反欺诈 风控系统 风险检测

DBeaverUE for Mac(数据库管理软件) v24.1.3 旗舰激活版

Rose

RazorSQL for Mac(多功能SQL数据库编辑器) v10.6.1注册激活版

Rose

Dynamic Wallpaper for Mac 个性化高清动态壁纸软件 苹果壁纸下载

Rose

VMware ESXi 8.0U3 macOS Unlocker & OEM BIOS Huawei (华为) 定制版

sysin

macos esxi OEM

Magic Disk Cleaner for Mac(磁盘垃圾清理工具) v2.8.1激活版

Rose

Sketch for mac(专业矢量绘图设计软件) v100.2中文激活版

Rose

蓝易云 - MySQL的Json类型个人用法详解

百度搜索:蓝易云

json MySQL 云计算 运维 数据

Dato for Mac(菜单栏时钟软件) v5.3.1激活版

Rose

DBeaverEE for Mac(数据库管理) v24.1.3 企业激活版

Rose

使用TensorFlow和Kubernetes构建GPU加速工作流_语言 & 开发_Srini Penchikala_InfoQ精选文章