QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

解析 UCloud 人工智能与英特尔背后的技术故事(上)

  • 2019-11-13
  • 本文字数:2751 字

    阅读完需:约 9 分钟

解析UCloud人工智能与英特尔背后的技术故事(上)

“企业要构建自己的 AI 在线服务系统并非易事,无论是 IT 基础设施的建设还是 AI 框架的部署,都需要耗费大量人力、物力。如果在 IT 系统、AI 框架上选择失误,则会前功尽弃,这给 AI 项目的发展和普及制造了很高的门槛。我们的目标是帮助用户像使用云主机、云存储这些成熟的云产品一样使用 AI 在线服务。通过充分利用英特尔®至强®处理器 E5 产品家族的高可扩展性及英特尔®AVX,我们的 UAI-Service 正逐渐走近这一目标。”

——UCloud 创新产品线总监 叶理灯


在人工智能(Artificial Intelligence,AI)如火如荼的今天,很多初创企业和传统企业都选择以 AI 为契机开拓市场,但同时也面临着缺乏高效部署 AI 能力的难题。为此,UCloud 基于英特尔®至强®服务器平台,充分发掘和利用英特尔®高级矢量扩展(英特尔®AVX)指令集相关处理单元的潜能,推出了 UCloud AI 在线服务(UCloud AI online Service,UAI-Service*),其具备的大规模分布式计算平台可以满足企业在图像识别、自然语言处理等多个 AI 领域的在线服务应用需求。

面临挑战

企业的 AI 之路并非坦途大道:无论是初创企业踏上 AI 创新之旅,还是传统企业希冀借助 AI 之力调转航向,实现转型或升级,AI 系统的设计、部署和运维都需要巨大、多维度的投入且困难重重,在决策选型过程中稍有不慎,都会带来巨大的沉没成本,令许多企业望而生畏。


AI 的高成本正侵蚀企业的总拥有成本(Total Cost of Ownership, TCO ):AI 能力提升的背后,可能会给企业带来巨大的成本开支,如何在性能和成本之间达到平衡?这一问题让许多企业决策者感到苦恼。

解决方案

UCloud UAI-Service:面向初创企业、传统企业 AI 转型而生的 UCloud UAI-Service,旨在提供易部署、易运维、更安全以及多 AI 框架支持的 AI 在线服务节点,可助力企业完成 AI 模型部署这一关键环节,并在图像识别、机器学习等多个 AI 领域满足企业用户的需求。


英特尔®至强®处理器 E5 产品家族及英特尔®AVX:通过与英特尔的紧密技术合作,UAI-Service 一方面巧妙地利用云主机中英特尔®至强®处理器 E5 产品家族的空闲处理能力,将其英特尔®AVX 能力用于支持和加速 AI 在线服务;另一方面,利用该处理器产品家族强大的可扩展性进行弹性部署,用低成本获得高性能,降低用户的 TCO。

成果

真正推动 AI 技术的普及,助其持续发展:UCloud 推出的 UAI-Service 将身处技术“深闺”中的 AI 技术和应用进一步平民化、实体化。通过 PaaS 的方式,让更多有志于在 AI 领域开拓进取的企业能够获取出色的 AI 部署能力,进而让整个 AI 产业实现“小步快跑”的前进节奏。


更有效利用空闲计算资源、节约用户成本支出:UAI-Service 创新地利用英特尔®至强®处理器 E5 产品家族的空闲处理能力,是对空闲计算资源再利用的有效尝试,其成功实践令成千上万的数据中心处理器的空闲能力得以充分利用。这既降低了企业用户的 TCO,也达到了环保节能的效果。


横空出世的 AlphaGo,让 AI 成为近两年来人们持续关注的热点。而 AI 也正在走出象牙塔,走近普通企业和大众,并开始在经济和民生层面扮演起越来越重要的角色。从机器学习、模式识别到自动驾驶、机器视觉,不但众多初创企业将 AI 研发作为扬帆起航的契机,许多传统企业也将其作为自身转型升级所必备的利器。


但 AI 系统的建设并非易事,企业 AI 系统的建设可分为“数据收集”、“模型训练”及“模型部署”三个步骤,每个步骤都会带来复杂的 IT 系统建设及运维工作。随着各类大数据、云计算技术方案的日趋成熟,“数据收集”和“模型训练”的工作正逐渐转移到云上,形成了成熟的云化方案,而 AI 模型部署的云化还存在许多问题:一方面,多种多样的 AI 框架需要企业制订和执行不同的部署策略,难免因此产生高昂的运营成本;另一方面,主要用于模型训练的 GPU 平台在模型部署中不仅部署成本较高,而且在扩展性上的表现也不够理想。


UCloud 推动的 UAI-Service,就是针对上述 AI 模型部署难题而生的创新方案。UCloud 的工程师们创造性地利用了虚拟云主机上英特尔®至强®处理器 E5 产品家族的空闲计算资源,借助英特尔®AVX 的能力,来提供专注于 AI 模型部署的 AI 在线服务。英特尔®至强®处理器强大的可扩展性也帮助 UAI-Service 获得了快速便捷部署的能力,并显著降低了企业运行 AI 在线服务的成本支出。

让使用 AI 服务像使用云主机一样便捷

“简单来讲,AI 的三部曲可以分为大数据收集,AI 模型训练和 AI 在线服务。”UCloud 创新产品线总监叶理灯这样描述企业 AI 系统建设,“此前,针对前两步,UCloud 都已经为用户提供了成熟的云主机、云存储、云网络等解决方案。”



但三部曲的最后乐章,却还面临诸多问题。一方面,企业用户在基于 AI 进行业务创新时,常常面临众多的业务流程,如何将不同的业务流程与 AI 在线服务一一映射,这对 AI 在线服务的部署、可管理性及可扩展性提出了巨大的挑战;另一方面,面对众多的 AI 框架,企业运维人员总有无从着手的烦恼,因为他们需要为各个框架开发和配置不同的接口,工作量巨大。为解决 AI 系统建设这“最后一公里”的问题,UCloud 提供了 UAI-Service,它能基于大规模分布式计算平台为用户提供 AI 在线服务。


在实际任务部署中,UAI-Service 为用户提供了“两步走”的部署模式。首先,向用户提供 SDK 工具包,内含接口代码框架、代码和数据打包模板以及第三方依赖库描述模板。用户只需根据 SDK 工具包内的代码框架编写接口代码,准备好相关代码和 AI 模型以及第三方库列表,就可以通过打包工具一键完成任务的在线部署。


任务打包完毕后,用户可以通过 UAI-Service 分布式的 AI 在线服务 PaaS 平台进行后续管理和维护。该平台可以同时管理上千个计算节点,每个计算节点都是同构节点,具有相等的计算能力,并拥有自动请求负载均衡、自动资源管理的功能。用户只需要将业务部署在平台上,就无须操心其后续的运维。



“UAI-Service 给用户带来的最大优势,就是省去了部署 AI 在线服务时的大量繁琐工作,让用户可以将宝贵的资源聚焦在自身的业务上。”在 UCloud 叶理灯看来,如果每一个企业用户在部署自己的 AI 服务时,都需要通盘考虑容灾、安全性、资源调度或者负载均衡,那么企业在人力资源和成本上的支出将是沉重不堪的。


UAI-Service 将这些工作都内化为 SDK 包和 PaaS 平台服务,用户只需要像使用云主机或者云存储服务那样,轻松将所需的功能或服务配置在一起就可以使用,而且 UAI-Service 还可以自动将分布式部署的四大要素——负载均衡、自动扩容、分布式容灾以及海量计算资源进行有效配置。


在下一篇中,我们将继续介绍 UAI-Service 平台的另一优势,以及 UAI-Service 如何借力英特尔技术以发挥其更强的 AI 能力等方面的技术解读。


本文转载自公众号 UCloud 技术(ID:ucloud_tech)。


原文链接:


https://mp.weixin.qq.com/s/PCtKJ7zarFDIpjvDQ024Sg


2019-11-13 09:52724

评论

发布
暂无评论
发现更多内容

火山引擎DataLeap:更强数据目录搜索能力,做到一步找数

字节跳动数据平台

大数据 数据中台 数据研发 企业号 8 月 PK 榜

华秋亮相2023世界汽车制造技术暨智能装备博览会,推动汽车产业快速发展

华秋电子

【SOP】最佳实践之 TiDB 业务写变慢分析

TiDB 社区干货传送门

性能调优 管理与运维 故障排查/诊断 应用适配

如何在数据库迁移中保证数据一致性?

java易二三

MySQL 数据库 编程 计算机

合合信息通过ISO/IEC国际标准双认证,为全球用户提供高合规标准AI服务

合合技术团队

人工智能 数据安全 个人信息保护

一种新的告警收敛方式“先知预警”,为您的系统健康护航 | 京东云技术团队

京东科技开发者

系统稳定性 预警监控 企业号 8 月 PK 榜

易点天下KreadoAI正式上架亚马逊云科技Marketplace全球商业化加速落地

新消费日报

SpringCloud-Hystrix服务熔断与降级工作原理&源码 | 京东物流技术团队

京东科技开发者

SpringCloud Hystrix 熔断降级 企业号 8 月 PK 榜

TiDB 多集群告警监控-初章-监控融合、自动告警处理

TiDB 社区干货传送门

监控 实践案例 集群管理

通过docker安装单机版minio简单测试br通过s3存储备份恢复数据

TiDB 社区干货传送门

备份 & 恢复

关于搭建海外社交APP源码的干货

山东布谷网络科技

海外直播源码

基于Web3D+GIS智慧森林防火监测预警系统

2D3D前端可视化开发

智慧森林防火 森林火灾预警系统 森林火灾监测系统 森林数字防火 森林智能防火

绍兴市属于哪个省?是几线城市?有正规等保测评机构吗?

行云管家

等保 等级保护 等保测评 绍兴

数据库内核之Binder

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne 超融合数据库

如何规划税务数智化建设

用友BIP

税务管理

入门级教程:使用Flask进行Python Web开发

Apifox

flask 后端 web开发 Python编程 Python Web框架

创新赛制,顶尖赛题!| 2023第二届粤港澳大湾区(黄埔)国际算法算例大赛十赛道虚位以待!

ModelWhale

人工智能 深度学习 数据竞赛 琶洲 粤港澳大湾区

【PCSD考试笔记】

TiDB 社区干货传送门

TiDB 底层架构

物理机是什么?有什么优势?可以上堡垒机吗?

行云管家

等保 堡垒机 等级保护 物理机

JDK1.6在生产环境引起的坑

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

从生态的角度看容器和虚拟化的区别

品高云计算

Duplicate File Finder Pro for mac(重复文件查找) 7.1.3中文版

mac

苹果mac Duplicate File Finder 查找删除重复文件

TiProxy 原理和实现

TiDB 社区干货传送门

新版本/特性发布 TiDB 源码解读 6.x 实践 TiKV 源码解读

TiDB 优雅关闭

TiDB 社区干货传送门

TiDB 源码解读 6.x 实践

如何判断线程池任务执行完?

王磊

java面试

TiProxy 尝鲜

TiDB 社区干货传送门

实践案例 6.x 实践

【华秋推荐】物联网入门学习模块 ESP8266

华秋电子

物联网

合合信息与科瑞物业达成合作,数字名片提供企业数智化转型新机遇

合合技术团队

人工智能 合作 数字名片

@ControllerAdvice注解使用及原理探究 | 京东物流技术团队

京东科技开发者

spring 注解 源码解析 企业号 8 月 PK 榜 @ControllerAdvice

解析UCloud人工智能与英特尔背后的技术故事(上)_文化 & 方法_UCloud技术_InfoQ精选文章