写点什么

TensorFlow 企业版来了,商业 AI 平台:“这日子没法过了”

  • 2019-11-19
  • 本文字数:3552 字

    阅读完需:约 12 分钟

TensorFlow企业版来了,商业AI平台:“这日子没法过了”

谷歌于今年 10 月份推出 TensorFlow 企业版,补足企业市场短板。谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。


TensorFlow Enterprise 最重要功能之一是它将提供长期的技术支持。针对某些版本,谷歌将提供长达三年的补丁程序,所有补丁和错误修复将在 TensorFlow 主线代码存储库中提供。另外,谷歌还将向正在构建 AI 模型的公司提供来自 Google Cloud 和 TensorFlow 团队的工程协助。


由于目前市场上的商业通用 AI 平台(软件即服务,下简称商业 AI 平台)跟 AI 云服务在功能上高度重合,且商业模式不及云服务,谷歌提供企业版之后,这些 AI 平台初创企业压力倍增。

大数据和云企业的施压

从 2018 年到现在,AI 行业就频繁传出 AI 公司倒闭潮的预测。业内不断的有声音认为“90%的 AI 企业面临倒闭”,“会有一波大的洗牌”。


谷歌的 DeepMind 在过去三年里,亏损 10 亿美元,但未来还有 10 亿的预算投入。AI 创业企业,没有谷歌之于 DeepMind 的背景,就得有自我造血功能,方能活下去。比如当初做“三维视觉感知”的强 AI 企业,也得朝主流的“深度学习+人脸识别”转移,进入安防行业落地。


而商业 AI 平台通常的落地场景是金融领域,如银行业的风控、精准营销;零售行业,如智能推荐、销售预测…


如今,大多数企业都在谈数字化转型,为了保持企业的营收持续增长。风控、精准推荐也是主流大数据企业的关键业务。而 AI 平台型初创企业跟主流大数据企业相比起来优势并不明显。



机器学习流程原型是首先清理数据,然后提取特征,最后经过转换的输入通过一个机器学习模型以创建预测结果。


机器学习算法只是其中一环。数据是机器学习应用的重中之重,数据准备占据了 60%以上人天成本。传统大数据企业在数据治理上积累了多年的经验,数据治理能力、数据存储集群管理能力也是一些大数据企业的天然技术壁垒。当商业 AI 平台落地业务时,还是要面对各种脏数据,需要投入大量人力时间解决数据问题。


挣到钱,有自我造血能力才能活下去,才能进化得更好。与大数据企业同食一块蛋糕,在这些落地场景里,AI 平台即服务的优势并不明显,那么盈利能力堪忧。


另外不可忽视的是机器学习平台同样需要管理和维护工具。云服务的优势恰恰是维护容易,且形式灵活,可支持私有云部署。


另外类似谷歌这类的主流云服务功能上不仅提供了精准推荐、预测,还有强 AI 功能如语音识别和图像处理等功能,这些强 AI 能力通常也有大厂的 AI 实验室予以保证。并且云服务可按需付费,商业模式清晰且受过验证。对于谷歌和国内的 BAT 云服务来说,是在云服务应用广泛的基础上叠加 AI 能力,比起平台即服务,AI 销售压力较小,可有更多的力量投入到长期性的技术研发中。

开源的逼迫力量

2015 年 11 月,谷歌第二代深度学习框架 TensorFlow 横空出世。


2015 年注定成为开源的分水岭。谁也不曾料到,后面几年在人工智能领域里,涌起的开源浪潮有多猛烈。


与 TensorFlow 同一时期,微软亚洲研究院开源机器学习工具包 DMTK。


2016 年 9 月百度发布“Paddle”,腾讯也在当年发布 Angel。


2016 年 11 月亚马逊宣布将 MXNet 作为官方深度学习平台。


2017 年 1 月,Facebook 推出机器学习框架 PyTorch。


2017 年,Uber 开源了 Horovod。


AI 框架上承应用、下接芯片,是 AI 产业的软件支柱,包含几个层次,比如底层的芯片、含数据存储的大数据集群;再一层是计算框架,类似 Spark 这样的 ML 框架、TensorFlow 这样的 DL 框架;再往上一层是高级 API 和分布式调度框架,如 Angel;最上一层,是 AI 业务应用,如推荐系统、智能问答、人脸识别…每个层次均有对应的开源软件可组合使用。


这些开源平台背后技术力量雄厚,且各有优点。


比如 TensorFlow 基于 Python,写的很快并且具有可读性;在多 GPU 系统上的运行更为顺畅;代码编译效率较高;提供 API 的支持,可直接解决各种机器学习任务。在工业界,TensorFlow 使用率达到最高。


比如 Uber 开源参数服务器 Horovod 通过 AllReduce 来实现机器间模型同步,由于底层使用 MPI、支持 RDMA 等高性能网络,可以利用带宽并行。同时与主流深度学习打通,Tensorflow,PyTorch 等,有良好生态方便上手。


利用开源的项目,开发人员就能完成基本的任务,在开源的推动下,中国出现了近千家 AI 创业公司,仅次于排名第一的美国。


商用 AI 平台需要在多个主要环节强于开源软件,才能叫好并叫座。目前开源还是商业化 AI 平台即服务的强有力的对手,并且这次提供的 TensorFlow 企业版服务提供了高达 3 倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。TensorFlow 企业版针对实际使用的硬件和平台都做了优化,更好的提升了企业 AI 平台的性能。

AutoML

使用 AutoML 是目前比较主流的机器学习平民化方法,被一些 AI 平台当作杀手锏。同时 AutoML 被认为是解决十万 AI 人才缺口的救星。


2018 年 1 月,当时的谷歌云首席科学家李飞飞和谷歌云研发负责人李佳宣告 Cloud AutoML 的问世。


机器学习涉及到数据预处理、特征工程、模型调参等环节。还需要人工选择参数,设计模型,验证调整,如此反复。AutoML 让这些自动完成,相当于让 AI 来设计 AI。与专业调参建模相比,AutoML 的优势在于使用门槛低,解决一些重复性劳动。


在真实世界里,技术是流动的,永远不会静止,永远不会完结,永远不会完美。

–《技术的本质》


目前的 AutoML 的缺点也是很明显的,首先是一个黑盒的模块,大量的数据预处理、特征或者模型的尝试,专家没有办法干预,因此可能会带来一些效率低下的问题,消耗大量算力,其次是 AutoML 只能解决确定性的可量化的目标,对于实际情况,需要在多个不同的业务目标(比如准确率和线上延迟)之间进行权衡,以及可能需要涉及到一些不可以明确量化的目标,比如可解释性,这些情况下目前的 AutoML 是无法有效工作的,甚至有些时候,人也没有办法一下子给出目标,需要不断地探索。


深度学习专家 François Chollet 也曾置评这项技术:“不久之后,AutoML 就会发现他们将面临和强化学习一样的问题:人们会用非常具体的(有缺陷的)方法来解决许多宽泛的问题。”


有些企业的解决方式是引入人机交互的方式,但同样需要专业的人士参与,也不能根本上解决人才缺口的问题。目前的 AutoML 还达不到理想效果,还需多年的努力。

下一个趋势是什么

2016 年,小米的创办人雷军说过:“站在风口上,猪都会飞”。


2016 年初,Alpha Go 击败了代表人类出战的李世石。BAT 在这一年纷纷开始了 AI 布局,给予了大量的人力和财力。


中国互联网在过去的 15 年中,经历过五六个周期,每个周期主题都不太一样。最开始的门户网站,出现了如新浪、网易、搜狐等企业;然后是增值电信业务,腾讯当年靠电信业务上市;再后面是视频网站和社交网站;然后是电商和互联网金融企业,如阿里巴巴、京东。不严格划分,就是三年一个周期。


最近三年,也可以说是 AI 企业涌起的周期,这条赛道同样出现了几百家甚至上千家创业企业。这三年,有开始的创立浪潮,也有最后的寒冬衰退。


商用 AI 平台经历了数年发展,如果现在还没建起明显的技术护城河,没有令人信服的技术优势,对比云服务,功能重合,盈利模式堪忧,靠加强宣传的方式照样解决不了问题。


更不曾想到,在 2019 年底,谷歌在 TensorFlow 市场占有率无敌的背景条件下再次推出企业版,强占企业市场。


趁时势可以起大事,但也要在“风口”中炼出真功夫,“风口”过后才是真较量。


在与技术专家的交谈中,对比商业 AI 平台,专业人士也都表示更看好谷歌的 TensorFlow 企业版策略。


回头去看,这是商业 AI 平台的创建者缺乏远思吗?其实,除商业 AI 平台之外还有很多 AI 落地都经过了战略性收缩。


2018 年 10 月 21 日,特斯拉已经从公司官网的预订页面下架了长期以来提供的“全自动驾驶”选项。马斯克曾在三年前声称,2017 年之前特斯拉将实现全自动驾驶,如今这个目标的实现已无定期。


2015 年 4 月,IBM 成立了独立的 Watson Health 部门;到 2016 年,IBM 第四次转型,Watson 被寄予担纲厚望。2019 年 4 月,投资 50 亿的 IBM 医疗裁员 70%。


微软最初于 2015 年 12 月推出了针对 iOS 和 Android 的语音助手 Cortana(微软小冰)。2019 年 11 月,微软宣布其语音助手 Cortana 战略性收缩,将在 2020 年 1 月 31 日退出 iOS 和 Android 平台(美国除外)。


通用 AI 一直是顶级 AI 专家的梦想,也是谷歌 DeepMind 终极目标。就像前面所说,DeepMind 在未来还有 10 亿的预算投入,这样的投入,对于一般企业来说,是望而却步的存在。


这些 AI 的小败局,不过就是告诉今天的你,有哪些技术已能见效,有哪些技术目前还不稳定还不理想;有哪些行业属于刚需,有哪些行业还需继续探索。未来还有什么行业值得投入,这将决定 AI 企业的成败。


2019-11-19 08:288953

评论

发布
暂无评论
发现更多内容

Maya 2024中文特别版 适用于Apple M和 intel/win系统

理理

maya破解版 maya2024

一次goroutine 泄漏排查案例

蓝胖子的编程梦

golang 性能 协程 pprof 线上故障

轻松几秒提升视频清晰度:Perfectly Clear Video Mac版

真大的脸盆

Mac 视频处理 视频增强 Mac 软件 视频画质

不同云平台之间的纳管用什么工具好?有推荐的吗?

行云管家

云计算 云平台

【基础知识】PCB布局设计入门步骤

华秋PCB

工具 电路 PCB 布局 PCB设计

Kubernetes 多集群网络方案系列 1 -- Submariner 介绍

Se7en

程序员如何打破需求魔咒:为什么人越招越多,活越干越累?

小红书技术REDtech

算法 活动回顾

首次解密小红书“种草”机制:大规模深度学习系统技术是如何应用的

小红书技术REDtech

深度学习 机制策略 活动回顾

复旦邱锡鹏教授:语言模型即服务的五类应用手段,你了解多少

小红书技术REDtech

深度学习 nlp

Web前端组件库OpenTiny项目如何使用?

英勇无比的消炎药

开源 前端 OpenTiny UI组件库

【云图说】云数据库GaussDB如何做到卓越性能

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 4 月 PK 榜

金三银四(P5-P7 级)1000 多道 Java 面试题,从基础到架构

采菊东篱下

Java

厦门等级保护测评机构地址在哪里?咨询电话多少?

行云管家

等级测评 厦门

LED显示屏品质如何控制

Dylan

品牌 LED显示屏 全彩LED显示屏

交大翟广涛教授:眼见不实,怎样评价媒体体验质量

小红书技术REDtech

深度学习

Spring Cloud微服务网关Zuul过滤链和整合OAuth2+JWT入门实战

做梦都在改BUG

Java Spring Cloud OAuth2 JWT Zuul

Mac电脑照片编辑修图软件精选 每一款各有千秋!

理理

Mac软件 图片编辑 抠图软件 苹果软件资源

一次排查某某云上的redis读超时经历

蓝胖子的编程梦

redis 性能 线上事故 线上故障 超时

openGemini 1.0版本,带来哪些新特性和性能提升?

华为云开源

数据库 时序数据库 sql

通过4种经典应用,带你熟悉回溯算法

华为云开发者联盟

人工智能 华为云 回溯算法 华为云开发者联盟 企业号 4 月 PK 榜

三维设计新帮手|Blender怎么入门?

Finovy Cloud

blender 3D软件

Codepipeline 跨账号访问 Codecommit

亚马逊云科技 (Amazon Web Services)

AI时代,看用友iuap如何推动数智商业创新

用友BIP

AI 技术大会 数智底座 升级企业数智底座

号外!多个企业数智化领先实践将亮相2023用友BIP技术大会

用友BIP

技术大会 用友iuap 升级企业数智化底座 央国企数智化转型

一站式指标平台 Kyligence Zen 功能详解

Kyligence

数据分析 指标平台

低代码是什么意思

优秀

低代码

mysql invalid conn排查

蓝胖子的编程梦

MySQL 性能 线上故障 超时 连接池

NFT游戏开发交易系统搭建方案

薇電13242772558

NFT

软件测试/测试开发丨Dubbo 接口测试原理及多种方法实践总结

测试人

dubbo 软件测试 接口测试

一次系统延迟性优化案例

蓝胖子的编程梦

golang 性能 延迟 线上事故 线上故障

Nautilus Chain 上首个 DEX PoseiSwap 模型解析

鳄鱼视界

TensorFlow企业版来了,商业AI平台:“这日子没法过了”_AI&大模型_Tina_InfoQ精选文章