写点什么

百分点技术大咖深度解读:数据中台的迷失与前行

  • 2020-03-08
  • 本文字数:3540 字

    阅读完需:约 12 分钟

百分点技术大咖深度解读:数据中台的迷失与前行

数据中台今年很火,火得有点突如其来,也让很多用户为之迷失。


这波由互联网巨头们带起来的中台热潮,看似偶然,其实必然。它让我们真正意识到数据形成资产化之后带来的巨大价值,以及企业与机构在未来的竞争中构建起数据资产体系和组织架构调整的重要性。


当数据中台成为大势所趋之际,对于各大传统行业而言,不禁要问:如何打造适合自身业务的数据中台?互联网公司的数据中台战略固然有其可取之处,但是邯郸学步则可能导致满盘皆输。事实上,数据中台终究只是一个代名词而已,形成适合自身业务的数据资产管理体系,通过数据资产化实现为前台业务提供“养料”和支撑,才是传统企业打造数据中台的核心本质。


正所谓,无论是互联网公司,还是传统企业,无论采用何种方式方法,在数据中台建设中,没有同途殊归,只有殊途同归。

01 为什么需要数据中台

以互联网公司为代表的数字原生企业,其天生就是数字化的,但绝大部分互联网企业也是发展到一定阶段之后,才开始着力于数据中台的建设。百分点大数据操作系统负责人贾喜顺直言,互联网企业典型的特征就是野蛮生长,当无序膨胀、快速发展到一定阶段之后,往往需要通过数据中台来更加高效驱动和管控业务。


而大部分传统行业用户,大多数都经历了多年的信息化建设,从过去的数据仓库、数据管理,到后来的大数据平台、数据治理,是企业数据资产化稳步演进的过程。而当前,传统行业正处于向数字企业转型的过程中,数据中台则是数据资产化演进的下一个阶段,它在数字化转型中可谓是至关重要。


正所谓是,先有业务数据化,才有数据业务化,传统企业需要数据中台这个中枢来让数据驱动业务,实现数字化的快速创新。在百分点看来,数据中台是集合数据采集、融合、治理、组织管理、智能分析为一体的整体平台,将数据以服务方式提供给业务前台使用,以提升业务运行效率、持续促进业务创新。


“如果将前台比作计算机的应用程序,后台比作计算机的存储,那么中台就是计算机的内存。数据中台的作用就是将前台的快速响应和后台变化周期慢的矛盾协同起来,将前台中的稳定通用业务能力‘内存化’到中台,将后台中频繁使用的能力抽取到中台中。现在,数据中台这个‘内存’的容量正在变得越来越大,”贾喜顺这样形容数据中台。



百分点是国内为数不多在多个行业拥有数据中台建设丰富经验的公司


以百分点某大型集团用户为例,其业务横跨数十个行业,拥有超过 2000 家的子公司,业务体量和复杂度巨大,几乎每一家公司都拥有多套业务系统和数据标准,在集团整体的数字化转型过程中,将数据汇总、拉通、流动、共享,通过数据来驱动业务应用和创新,成为该集团在数字化转型过程中遇到的最大挑战。


对此,贾喜顺表示:“像这样的用户在传统行业中非常具有代表性,拥有丰富的内部数据,却没有建成数据资产管理体系,无法实现数据资产化,也无法通过数据来支撑集团和各个子公司的业务创新。”


在贾喜顺看来,数据中台将会是企业在数据层面的一个标准化支撑,通过数据中台去支撑前端百花齐放的数据应用,并且应用产生的大量数据再次回流到数据中台之中,形成完整的数据闭环,驱动企业数据生态的形成。

02 好的数据中台是什么样

毫无疑问,当前关于数据中台的建设并没有一个标准化的定义,大家的理解都是五花八门。目前除了互联网企业之外,很多企业普遍处于数据中台建设的构思规划或者刚刚起步的阶段。贾喜顺用三点总结了当前企业在建设数据中台中面临的主要挑战


首先,大部分企业理念转变不到位,没有明白数据中台建设是一个长期过程,与传统的 IT 项目周期有着非常大的区别,业务部门必须从上到下去推动和配合数据中台的建设。“很多时候,数据中台建设并不是技术层面的问题,而是理念是否转变的问题。”


其次,企业需要在组织层面去保障数据中台的建设,需要单独成立部门或组织。“哪怕是阿里、腾讯、京东这样的互联网巨头,也已经将数据中台独立成部门,去统筹集团所有的数据。”


最后,是需要合格的团队、技术和产品,去完成实现数据中台的过程。“很多传统企业,其实在人才、技术储备上相对较差,这也是像百分点这样的厂商所能够去弥补的。”


那么,一个好的数据中台又会是什么样的?这恐怕是所有企业与机构接下来都将需要去深度思考的话题。


在百分点看来,数据中台必须要与自身业务实际情况去考虑。“同样是喝水,如果是一家人,自家挖一口井就可以满足喝水需求;如果是一个村子的人,则可以挖一口大井,用水泵抽水;而如果是一个城市,则需要建立自来水厂,来满足千家万户的喝水需求。”



百分点数据中台全景图


不过,数据中台的建设流程不管大小和复杂程度,数据中台的建设都需要围绕着数据的联络,包括数据的接入、清洗、加工、整合,并最终起到支撑应用层的服务。“数据中台不管大小,其链路完整性是非常有必要的,并且在数据标准和数据治理层面是必不可少,只有把数据标准统一了,才可以支撑起整个数据生态。”此外,考虑到企业与机构的成长性,百分点还强调了数据中台的扩展性和灵活性,“数据中台必须足够的健壮,可以支撑业务的弹性变化。”


从宏观层面来看,好的数据中台可以很好地盘活企业数据资产,并且建立起将装的数据资产管理体系,形成数据生态闭环,可以有效地支撑起基于数据的业务快速创新,并且有利于打破内部的固有利益和部门墙,推动企业在组织架构层面的变革,适应数字化转型。

03 数据中台服务商如何选

数据中台的热潮也带火了各种数据中台公司,从上层做大数据营销的公司,到底层做数据仓库、大数据平台的公司,还有用友、金蝶这些传统信息化软件公司,甚至阿里云这样的云厂商,每一家都从自身所擅长的领域去延伸到数据中台市场,希望在数据中台市场分的一杯羹。


不过,面对如此多的数据中台服务商,用户应该如何选择?笔者认为,从三个层面去考虑会更加合理。


首先,需要关注服务商在技术层面的积累,比如像数据仓库、大数据平台等,看是否具有相应的技术经验和强大的技术团队。


其次,需要关注数据中台服务商是否有健全的产品与工具,包括从数据接入、清洗、ETL 处理、可视化等整个体系的产品与工具,这些产品与工具是否经受过大量项目的沉淀与检验。



第三,需要关注数据中台服务商是否有丰富的行业经验和业务沉淀,像政府机构、金融、零售等行业非常符合和需要数据中台建设,虽然每一家企业或机构的数据中台需求迥异,但是供应商在同行业积累下的经验,有助于其在其他用户的数据中台建设。


最后需要关注交付能力,一个数据中台项目,其中数据治理部分就是非常不轻松,涉及到数据标准制定、数据拉通等等,基本上脏活累活占了大半。很可能出现,像一些云厂商不愿意干,小的创业公司又 hold 不住的局面。

04 数据中台未来趋势在哪

“如果当一个数据中台建设起来之后,你的数据科学家、数据分析师还需要在数据整理、加工上花费大量精力和时间的话,那么这样的数据中台肯定不代表着未来的发展趋势。”贾喜顺如是说。


在百分点看来,数据中台某种程度就是面向 AI 的,尤其是当前 AI 应用开始逐渐进入到各行各业之中,需要大量的基础数据集来训练和支撑,数据中台的建立,有利于 AI 模型的训练和 AI 应用的创新。“数据中台应该使用起来非常方便,不仅仅是专业人员才能使用,而是让更广泛的人群直接使用工具和数据,来支撑产品的创新。”


其次 AI 技术来优化和改造数据中台也将成为重要的趋势。“AI 可以让数据中台更加敏捷和高效。像百分点已经在数据中台的底层工具和产品层面开始融入一些 AI 技术,可以在数据标注、数据治理上快速便捷的处理数据;此外,通过 AI 还可以自动生成脚本等。”贾喜顺认为,AI 在数据中台的占比会越来越大,“除了底层之外,对于上层业务做一些 AI 层面的支持,比如 NLP、问答机器人、自动翻译等。”



第三,数据中台的定制化会更加容易。对于数据中台的一大疑惑就是,用户的需求造成的定制化程度严重,数据中台无法形成通用性的产品,造成数据中台项目的交付难度极大。贾喜顺表示:“数据中台的产品和工具将会更加灵活,朝着组件化的方向发展,可以通过积木式的产品搭建来满足用户需求,遇到个性化需求也可以快速通过组件进行定制化的开发。”


总体而言,数据中台将会朝着底层更智能、上层使用更加简单的方向发展。

写在最后

从长期来看,数据中台其实跟企业大小并没有直接关系,不同大小和类型的企业都需要数据中台。数据中台将逐渐成为一种基础能力,这种基础能力将会是企业在数字化时代中所必须具备的。


无论如何,数据中台的建设将会是一个长期、螺旋上升的过程,也将会对企业的组织架构产生深远影响。


就如大型机之父 Frederick Brooks 在《人月神话》中提到:这个世界上没有银弹。数据中台的建设没有一劳永逸的办法,企业与机构要想短期内就实现效果恐怕是不太现实,企业更需要从战略层面进行更多思考,再配合选择合适的数据中台服务商,方能在数据中台建设之路上走的稳当。


2020-03-08 16:441110

评论

发布
暂无评论
发现更多内容

Dubbo 正式支持 Spring 6 & Spring Boot 3

阿里巴巴中间件

spring 阿里云 云原生 Spring Boot dubbo

2022总结,强风吹拂

程思扬

总结 年终总结 经验分享、

mmdetection训练数据遇到的问题

Geek_7ubdnf

Python 机器学习

如何使用企业账户进行协作?

Towify

粒子滤波 PF(Particle filter)算法

Geek_7ubdnf

机器学习

数维图可视化编辑器超10项功能升级,您的需求就在其中

2D3D前端可视化开发

数据可视化 数字孪生 三维可视化 web3d web组态软件

更可靠、更高效的华为云ECS,助力企业业务迅速起飞

秃头也爱科技

Python报错:ModuleNotFoundError: No module named 'xxx'

Geek_7ubdnf

Python

Linux安装与卸载软件

Geek_7ubdnf

Linux

Spring+Vue增删改查实例

Geek_7ubdnf

Vue springboot

浅谈服务接口的高可用设计

京东科技开发者

负载均衡 接口 后端 混沌工程 企业号 1 月 PK 榜

智能图像处理:基于边缘去除和迭代式内容矫正的复杂文档图像校正

合合技术团队

图像处理 图像预处理 人工智能’

Serverless 奇点已来,下一个十年将驶向何方?

阿里巴巴中间件

阿里云 Serverless 云原生

如何使用滑块实现切换图片功能?

Towify

如何使用免适配云鹰模组实现多网可切?——实践类

阿里云AIoT

安全 物联网 物联网安全 技术标签

Python报错:ImportError cannot import name 'imresize'

Geek_7ubdnf

Python

中移链合约常用开发介绍 (二)多索引表的使用

BSN研习社

10分钟玩转阿里云物联网平台设备接入、管理、运维——实践类

阿里云AIoT

安全 物联网 物联网安全 技术标签

Win10桌面图标显示问题

Geek_7ubdnf

windows

用大数据服务医疗行业,华为云大数据BI,为医院智能决策提供保障

秃头也爱科技

华为云为瑞星量身打造下载加速方案,助力瑞星完成产品升级

秃头也爱科技

conda安装报错:PermissionError [Errno 13] Permission denied

Geek_7ubdnf

Python

2022年IAA行业品类年度表现总结

易观分析

视频 IAA

【玩转 Cloud Studio】 Cloud Studio的入门教程

Geek_7ubdnf

studio

pip安装报错:UnicodeDecodeError 'utf-8' codec can't decode byte 0xc3 in position 4

Geek_7ubdnf

Python

电脑音视频暂停再继续,声音突然变大

Geek_7ubdnf

windows

Spring Cloud Alibaba 2022.0.0.0 版本发布啦!

阿里巴巴中间件

阿里云 云原生 Spring Cloud Aliababa

还在自建MQTT物联网平台?快来试试开源MQTT托管型物联网平台——实践类

阿里云AIoT

安全 物联网 物联网安全 技术标签

再获殊荣!图数据库 NebulaGraph 获得 ITPUB 2022 创新产品奖

最新动态

华为云ECS弹性可扩展,为企业提供可靠、稳定、灵活、高效的计算环境

秃头也爱科技

Spring获取Bean的9种方式

小小怪下士

Java spring 程序员 springboot

百分点技术大咖深度解读:数据中台的迷失与前行_文化 & 方法_百分点科技技术团队_InfoQ精选文章