【AICon】AI 大模型超全落地场景&最佳实践 了解详情
写点什么

看 TensorFlow 如何从 AI 工具变身 AI 产品

  • 2020-03-06
  • 本文字数:1624 字

    阅读完需:约 5 分钟

看 TensorFlow 如何从 AI 工具变身 AI 产品

8 月 16 - 19 日,与零一万物李开复、蔚来李斌、面壁智能李大海,及工商银行、交通银行、华夏银行等 100+ 行业专家相聚 FCon x AICon

IDC 发布的报告显示,2017 年大数据全球市场规模将达 324 亿美元,年复合增长率为 27%,其中市场增长最快的领域是数据存储领域(53.4%)。而 BBC 预测,人工智能市场 2020 年全球市场规模将达到 183 亿美元。


企业伴随着业务的发展会积累海量的数据,而如何利用这部分数据给企业再次创造价值已经成为目前各个大数据及 AI 行业所关注的重点。


对于结构化数据(表格及数据库等)和非结构化数据(图片音频等)的分析方法及工具选择也是多种多样的。而 TensorFlow 则由于其开源和功能强大等众多优点受到众多专家的追捧。并且开发者也热情高涨地积极贡献。


但 TensorFlow 的配置和使用非常复杂,尤其在分布式环境中。TensorFlow 本身的出发点是作为一个 AI 工具存在的,而要将其产品化则存在着诸多问题需要解决。



Supporting the Cloud Native Ecosystem


2017 年 3 月 29-30 日,由 CNCF 主办的 KubeCon 在柏林拉开序幕,才云(Caicloud)首席大数据科学家郑泽宇和云开源高级工程师赵慧智受邀在会上做 TensorFlow 运行在 Kubernetes 上的技术演讲,并和大家分享了在提供这一 TensorFlow as a Service(TaaS)的技术点实现方式及解决方案。


简单来说,才云在为企业提供大数据及 AI 解决方案的同时,还为大数据及 AI 的开发者和科研机构提供一个可以实现 TensorFlow 产品化的解决方案,尤其解决其在分布式环境系统中的诸多问题。


通过基于 Kubernetes 的 TensorFlow,并且在 Kubernetes 上支持 GPU 和可视化的 UI 封装,使得 TensorFlow 可以在其原有的功能不为损失的情况下,极大的简化和封装 TensorFlow 在分布式中遇到的诸多问题,在此之上提供更多的功能。


这次才云的演讲主要包括:


1、分布式 TensorFlow 在机器学习中的作用和发展


2、How to enable GPU on Kubernetes


3、TensorFlow On Kubernetes


4、TaaS (TensorFlow as a Service)


以下是具体演讲内容摘要:TensorFlow 虽然在国内外大型企业都已经得到了广泛的应用,但是在广大中小型 IT 企业以及传统企业中,要将其应用于生产环境却仍然存在挑战。


在单机环境下,即使使用目前最先进的 GPU 都无法满足其计算量的要求。而在集群环境下, TensorFlow 存在高门槛、难配置、难管理等问题。


如下图所示,传统的分布式 TensorFlow 没有把 CPU 跟 GPU 进行虚拟化。只能直接使用物理 GPU 资源,无法让利用率最大化。



传统分布式 TensorFlow 带来管理方面的难题,比如:训练任务队列,用户权限管理,集群管理,模型服务管理,模型自动部署,资源管理,训练任务调度等等。



如下图所示,当分布式系统使用 K8S 对 GPU 虚拟化后,原生的 K8S 对于 GPU 的支持很弱。


但是,通过才云的平台虚拟化后,可以对 GPU 进行更加灵活自由的调度使用, 从而提升深度学习任务的训练速度。



同时,才云两位大数据专家在大会上演示了 Caicloud 的 TaaS 界面:



而且,还从环境搭建,模型训练,监控管理及模型在线服务等板块把原生态 TensorFlow 跟 TaaS 平台的对比。



以下页面展示的是 TaaS 训练资源池里,可以支持多个用户,同时提交多个任务。通过这样的 TaaS 平台,我们可以任务管理,资源调度,任务状态监控,及任务优先级调度。最大化提升集群的资源使用率,及任务的执行效率。



最后,介绍了才云的产品平台:才云的 Caicloud 平台依托于物理机,虚拟机,微软云,AWS 云平台,阿里云平台,创建了 K8S 集群。在多个 K8S 集群之上,我们建立了 Caicloud CLaaS 容器集群管理平台,平台之上有:分布式深度学习平台 TaaS,CI/CD 工具 Cyclone,以及 Cargo。



在这次 KubeCon 中,才云专家与 OpenAI 及 Google GCE Manager 分别讨论了如何部署 TensorFlow on Kubernetes 及其技术点实现方式和 GPU 在 GCE 中的 upstream 现状和后续研发工作。



左起:Vicki Cheung、赵慧智、Jonas Schneider、郑泽宇



才云首席大数据科学家郑泽宇在柏林 KubeCon 上演讲



才云云开源高级工程师赵慧智在柏林 KubeCon 上演讲


本文转载自才云 Caicloud 公众号。


原文链接:https://mp.weixin.qq.com/s/jU19P3CNH2v_WdgflSMLRw


公众号推荐:

AIGC 技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话 30 位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选 10 余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

2020-03-06 20:46815

评论

发布
暂无评论
发现更多内容

Hybrid App 选用什么前端框架更好

Onegun

flutter React Native Hybrid

从GitHub火到了头条!共计1658页的《java岗面试核心》,拿走不谢

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

Spring源码探索-核心原理下(AOP、MVC)

Java你猿哥

spring aop Spring MVC

解密HTTP协议:探索其组成部分与工作原理

做梦都在改BUG

Java 计算机网络 网络协议 HTTP

数据解析NFT Q1市场表现:NFT生态正向Polygon聚拢,蓝筹项目"保值"难

NFT Research

数据分析 NFT

百度工程师的软件质量与测试随笔

百度Geek说

测试 软件质量 测试技术 智能测试 企业号 4 月 PK 榜

使用Python实现一个简单的垃圾邮件分类器

海拥(haiyong.site)

三周年连更

Java 源码重读系列之 HashMap

U2647

源码 hash map #java

SpringCloud 网关实现线程池异步批量保存请求日志

Java你猿哥

spring Spring Cloud Java工程师 日志表

一文解读基于PaddleSeg的钢筋长度超限监控方案

飞桨PaddlePaddle

人工智能 图像识别 飞桨

分享:作业帮在多云环境下的高可用双活架构优化实践

OceanBase 数据库

数据库 oceanbase

安全测试前置实践2-安全渗透测试

京东科技开发者

测试 安全测试 功能测试 网络安全渗透测试 企业号 4 月 PK 榜

ChatGPT背后的AI背景、技术门道和商业应用(万字长文,建议收藏)

京东科技开发者

人工智能 AI ChatGPT 人工智能ChatGPT 吗? 企业号 4 月 PK 榜

投放视频广告时,如何快速与第三方播放器兼容?

HarmonyOS SDK

HMS Core

京东技术专家首推:微服务架构深度解析,GitHub星标120K

Java你猿哥

数据库 架构 微服务 ssm Java微服务

CUDA编程基础与Triton模型部署实践

阿里技术

cuda 模型部署

如何把Ai绘画工具放到我们的App中

Onegun

AI AIGC

cad看图:MiniCAD 中文版

真大的脸盆

Mac Mac 软件 cad cad看图

什么是接口定义? 接口定义的概念和用途详解

Apifox

前端 接口 后端 API 接口定义

技术不行还说Java卷!靠468页SpringBoot企业级项目实战成功逆袭

做梦都在改BUG

Java 微服务 Spring Boot 框架

分享:CUDB for OceanBase分布式数据库产品规模应用

OceanBase 数据库

数据库 oceanbase

关于Blender你想了解的都在这里

Finovy Cloud

blender 3D软件

在桌面养只捣蛋鹅 Desktop Goose让你的mac桌面更有趣!

理理

抖音桌面宠物鹅 桌面宠物鸭 Mac版 Desktop Goose怎么关闭 Desktop Goose下载

OceanBase 4.1 发版 | 一个面向开发者的里程碑版本

OceanBase 数据库

数据库 oceanbase

Github发布6天,Star55K+,这套笔记足够你拿下90%的Java面试

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

Redis分布式锁一定注意两个坑

做梦都在改BUG

Java redis 分布式锁

阿里P8面试官让我吃透这份10W字Java面试题,终于拿下Java高级岗Offer

做梦都在改BUG

Java java面试 Java八股文 Java面试题 Java面试八股文

4月22日,云数据库技术沙龙【杭州站】

NineData

MySQL 数据库 开发者 Clickhouse 沙龙预告

未来已来,OpenHarmony 3.2 Release发布,迈入发展新阶段

OpenHarmony开发者

OpenHarmony

聊聊简单又不简单的图上多跳过滤查询

华为云开发者联盟

大数据 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

横扫一线大厂面试的高并发笔记到底有多硬核?

小小怪下士

Java 程序员 后端 高并发 java面试

看 TensorFlow 如何从 AI 工具变身 AI 产品_AI&大模型_才云科技_InfoQ精选文章