Caicloud Clever v1.3.0 震撼发布:开发、生产无缝衔接的 AI DevOps

2020 年 3 月 03 日

Caicloud Clever v1.3.0 震撼发布:开发、生产无缝衔接的 AI DevOps

Caicloud Clever 是才云 Caicloud 基于自身云容器技术打造的人工智能云平台,从硬件资源管理到模型高效开发,再到模型的自动部署,Caicloud Clever 可以贯穿企业 AI 应用开发的整个过程,为用户提供一站式、高效、易用的开发与交付体验。新年伊始,才云 Caicloud 隆重推出 Caicloud Clever v1.3.0,为 AI DevOps 开启开发、生产无缝衔接的新篇章。目前,Caicloud Clever 已经在餐饮、能源、金融、通信等行业的龙头企业有成功落地经验,助力企业服务数亿中国人。

现如今,人工智能在学术界和工业界屡现重大突破,而 Kubernetes 作为一个容器编排平台,也在短短几年间迎来了迅速崛起。在许多专家看来,它们的结合似乎可以为企业业务创新带来无限的可能性——智慧城市、联网汽车、智慧医疗……它们不仅为企业提供了利用技术抢占未来市场的机遇,也为整个社会接入智慧文明提供了初步尝试。


但是,开发、部署机器学习产品也意味着大规模的复杂性,以下图某 500 强企业的供应链预测项目为例:



某 500 强企业供应链预测


可以发现,模型训练代码只是很小的一部分,企业在开发过程中还需对海量数据进行预处理,对模型进行持续评估,并进行迭代更新。而除去复杂的开发环节,企业还要兼顾开发进度监控和最实际的落地部署,这些都对传统操作系统提出了严峻挑战。


事实上,这也是业界看好 Kubernetes 和 AI “联姻”的原因。容器为流程运行提供了紧凑的环境,它们易于扩展,能在各种环境中移植——从开发到测试再到生产——可以将大型完整应用程序分解为有针对性、易于维护的微服务,完美契合 AI 应用开发的各个阶段。


针对以上背景,基于 Kubernetes 的人工智能云平台 Caicloud Clever 在即将发布的 1.3.0 版本中做了大量优化,新增 AI DevOps 支持,致力于解决企业 AI 模型开发、上线的诸多痛点。


亮点一:精准化资源调度


AI 产品本质上是由数据驱动的,为了保证模型的准确度和鲁棒性,海量计算资源不可或缺。但鉴于计算资源成本高昂,企业也在迫切寻找高效合理利用资源的有效解决方案。


得益于 Caicloud Compass 强大的资源管理能力(基于 Kubernetes 原生能力优化),Caicloud Clever 可以自动按需调度包括 GPU 在内的计算资源,让用户在无需关注物理资源的情况下托管训练任务、应用服务等。它还支持基于 Workspace 的资源隔离,允许用户针对不同项目、团队定制 Workspace 资源,按策略最大化资源利用率。


亮点二:模块化开发集成


除了计算资源,AI 产品开发的挑战还在于需要将许多不同的软件库集合在一起,也就是构建完整的软件生态系统。针对这方面的需求,Caicloud Clever 也做了大量优化,提供多种预定义任务模板,支持多语言多框架开发环境,大大降低了企业进入门槛:


  • 支持一键托管 Jupyter 等开发环境;

  • Caicloud Clever Jupyter 预置 TensorFlow、PyTorch、MXNet、Caffe 等框架;

  • 支持 Python、Shell 等脚本开发及自定义开发环境;

  • 开发环境可与任务模块关联,用户可从任务模块直接进入对应开发环境;

  • Caicloud Clever 细粒度引导,方便工程师快速上手训练。


亮点三:版本化数据运维


对于机器学习/深度学习模型的“粮食”——数据,Caicloud Clever 提供数据仓库、模型仓库等集装式版本化数据管理,进一步简化了数据的调用、共享方式,让数据能以更有效的方式在 AI 模块中流动。


在任务模块,用户可以通过点选把目标数据集用于数据清洗或训练;在模型仓库中, 各类模型可以按版本快速部署;在工程流中,Caicloud Clever 也提供按条件更新服务的支持。真正实现了 AI 流程中的各个模块以数据相互连接。


亮点四:可视化训练管理


而为了方便算法科学家、服务运维者、项目管理者等不同角色从不同角度审视任务表状态,把控任务进度。Caicloud Clever 支持可视化创建 TensorFlow、PyTorch 等框架的分布式多卡集群训练任务,支持实时训练日志及 GPU 等资源实时监控。保障项目的顺利进行和按时完成,促进团队合作。


亮点五:工程化 AI 全流程安排


考虑到 AI 产品开发涉及多个步骤,每个步骤所需的技能各异。Caicloud Clever 以工程流图连接模块、数据以及人,提高团队协作力及工程效率,加速工程化。


在 Caicloud Clever 平台上,用户可以创建从数据清洗、模型训练到模型服务等不同阶段的任务模块,涵盖 AI 全流程。工程师、科学家可以在任务模块上进行开发,架构师、项目经理可自由编排 AI 模块至工程流图,快速将功能模块拼接成工程项目。


亮点六:自动化生产部署


此外,Caicloud Clever 也支持工程流图一键式发布为生产流水线,所见即所得,无缝衔接 AI 工程开发与生产落地。用户可基于工程流图持续迭代开发,在不同迭代发布不同版本的流水线,流水线按条件触发流图流程,实现 AI 工程实验到生产的自动化部署。


把握创新机遇 敏态成就商机


随着 AI 技术和云计算的蓬勃发展,Kubernetes 愈发呈现出向上支持高并发、数据类和 AI 类应用业务的趋势——越来越多的公司正在把 Kubernetes 作为运行其工作负载的平台,而 AI 类业务正是一项日益重要的工作负载。


面对变化,寻找方向迈出第一步往往是最难的。AI 为企业提供了降低运营成本、改善决策和服务客户的新形式,而像 Caicloud Clever 这样基于 Kubernetes 的平台,势必会成为帮助企业采用 AI 和机器学习的首选协同平台。所以,你选好你的第一步了吗?


本文转载自才云 Caicloud 公众号。


原文链接:https://mp.weixin.qq.com/s/9oXPreWEC3-lavImR0J-kQ


2020 年 3 月 03 日 17:28244

评论

发布
暂无评论
发现更多内容

TOGAF实用教程(IT帮)

周金根

企业架构实施简介

周金根

登门槛效应 - 请求帮忙,从小事开始。

石云升

登门槛效应 得寸进尺效应

“链”上普洱,云南省区块链中心走进大美普洱

CECBC区块链专委会

区块链+ “链”上普洱 数字云南 分布式产业

第八周作业

qihuajun

影响企业架构项目成功的8个重要步骤

周金根

Android | xml和view的那些事

哈利迪

android

Java面试胜经001| 阿里Java面试题118道

BUZHIDAO

Java 面试

第八周学习总结

qihuajun

【总结】性能优化2

小胖子

ARTS-WEEK8

一周思进

ARTS 打卡计划

关于架构的几件小事:架构决策

北风

架构 架构设计 架构师 架构设计原则

java并发系列 :实战篇,微服务日志的伤痛,一并帮你解决掉

南方有乔木兮

Spark 窗口函数 I

马小宝

spark 窗口函数 spark window functions

比 996 更可怕的是职场 PUA

非著名程序员

职场 职场成长 职场误区 职场 PUA

两个单向链表是否存在合并元素

周冬辉

一个成都程序猿眼中的成都和天府软件园,先从蚂蚁金服说起…

why技术

程序员 成都 蚂蚁金服

搞事情?Spring Boot今天一口气发布三个版本

YourBatman

Spring Boot 新特性

JVM系列之:String.intern和stringTable

程序那些事

Java JVM GC 常量池 字符串

首个区块链金融应用规范出炉,标准先行避免“先污染后治理”

CECBC区块链专委会

技术规范 应用评估规则 话语权 政府积极推进

8week

一叶知秋

OMG组织的企业架构建模规范

周金根

架构师训练营 第八周 总结

Poplar

ARTS 打卡(2020.07.13-2020.07.19)

小王同学

产业区块链一周新动态

CECBC区块链专委会

多项扶持政策 产业研究高涨 学会协会成立 应用频繁落地

Java有效面试题

老大哥

Java 面试

ARTS 打卡第 4 周

Scotty

全栈新星 -- Dart

金刚狼

flutter dart 全栈 aqueduct

设计数据库

左洪斌

编程核心能力之重构

顿晓

学习 重构

AI与劳模的交点:拼多多农研大赛释放的产业能量

脑极体

Caicloud Clever v1.3.0 震撼发布:开发、生产无缝衔接的 AI DevOps-InfoQ