写点什么

百分点技术大咖深度解读:数据中台的迷失与前行

  • 2020-03-08
  • 本文字数:3540 字

    阅读完需:约 12 分钟

百分点技术大咖深度解读:数据中台的迷失与前行

数据中台今年很火,火得有点突如其来,也让很多用户为之迷失。


这波由互联网巨头们带起来的中台热潮,看似偶然,其实必然。它让我们真正意识到数据形成资产化之后带来的巨大价值,以及企业与机构在未来的竞争中构建起数据资产体系和组织架构调整的重要性。


当数据中台成为大势所趋之际,对于各大传统行业而言,不禁要问:如何打造适合自身业务的数据中台?互联网公司的数据中台战略固然有其可取之处,但是邯郸学步则可能导致满盘皆输。事实上,数据中台终究只是一个代名词而已,形成适合自身业务的数据资产管理体系,通过数据资产化实现为前台业务提供“养料”和支撑,才是传统企业打造数据中台的核心本质。


正所谓,无论是互联网公司,还是传统企业,无论采用何种方式方法,在数据中台建设中,没有同途殊归,只有殊途同归。

01 为什么需要数据中台

以互联网公司为代表的数字原生企业,其天生就是数字化的,但绝大部分互联网企业也是发展到一定阶段之后,才开始着力于数据中台的建设。百分点大数据操作系统负责人贾喜顺直言,互联网企业典型的特征就是野蛮生长,当无序膨胀、快速发展到一定阶段之后,往往需要通过数据中台来更加高效驱动和管控业务。


而大部分传统行业用户,大多数都经历了多年的信息化建设,从过去的数据仓库、数据管理,到后来的大数据平台、数据治理,是企业数据资产化稳步演进的过程。而当前,传统行业正处于向数字企业转型的过程中,数据中台则是数据资产化演进的下一个阶段,它在数字化转型中可谓是至关重要。


正所谓是,先有业务数据化,才有数据业务化,传统企业需要数据中台这个中枢来让数据驱动业务,实现数字化的快速创新。在百分点看来,数据中台是集合数据采集、融合、治理、组织管理、智能分析为一体的整体平台,将数据以服务方式提供给业务前台使用,以提升业务运行效率、持续促进业务创新。


“如果将前台比作计算机的应用程序,后台比作计算机的存储,那么中台就是计算机的内存。数据中台的作用就是将前台的快速响应和后台变化周期慢的矛盾协同起来,将前台中的稳定通用业务能力‘内存化’到中台,将后台中频繁使用的能力抽取到中台中。现在,数据中台这个‘内存’的容量正在变得越来越大,”贾喜顺这样形容数据中台。



百分点是国内为数不多在多个行业拥有数据中台建设丰富经验的公司


以百分点某大型集团用户为例,其业务横跨数十个行业,拥有超过 2000 家的子公司,业务体量和复杂度巨大,几乎每一家公司都拥有多套业务系统和数据标准,在集团整体的数字化转型过程中,将数据汇总、拉通、流动、共享,通过数据来驱动业务应用和创新,成为该集团在数字化转型过程中遇到的最大挑战。


对此,贾喜顺表示:“像这样的用户在传统行业中非常具有代表性,拥有丰富的内部数据,却没有建成数据资产管理体系,无法实现数据资产化,也无法通过数据来支撑集团和各个子公司的业务创新。”


在贾喜顺看来,数据中台将会是企业在数据层面的一个标准化支撑,通过数据中台去支撑前端百花齐放的数据应用,并且应用产生的大量数据再次回流到数据中台之中,形成完整的数据闭环,驱动企业数据生态的形成。

02 好的数据中台是什么样

毫无疑问,当前关于数据中台的建设并没有一个标准化的定义,大家的理解都是五花八门。目前除了互联网企业之外,很多企业普遍处于数据中台建设的构思规划或者刚刚起步的阶段。贾喜顺用三点总结了当前企业在建设数据中台中面临的主要挑战


首先,大部分企业理念转变不到位,没有明白数据中台建设是一个长期过程,与传统的 IT 项目周期有着非常大的区别,业务部门必须从上到下去推动和配合数据中台的建设。“很多时候,数据中台建设并不是技术层面的问题,而是理念是否转变的问题。”


其次,企业需要在组织层面去保障数据中台的建设,需要单独成立部门或组织。“哪怕是阿里、腾讯、京东这样的互联网巨头,也已经将数据中台独立成部门,去统筹集团所有的数据。”


最后,是需要合格的团队、技术和产品,去完成实现数据中台的过程。“很多传统企业,其实在人才、技术储备上相对较差,这也是像百分点这样的厂商所能够去弥补的。”


那么,一个好的数据中台又会是什么样的?这恐怕是所有企业与机构接下来都将需要去深度思考的话题。


在百分点看来,数据中台必须要与自身业务实际情况去考虑。“同样是喝水,如果是一家人,自家挖一口井就可以满足喝水需求;如果是一个村子的人,则可以挖一口大井,用水泵抽水;而如果是一个城市,则需要建立自来水厂,来满足千家万户的喝水需求。”



百分点数据中台全景图


不过,数据中台的建设流程不管大小和复杂程度,数据中台的建设都需要围绕着数据的联络,包括数据的接入、清洗、加工、整合,并最终起到支撑应用层的服务。“数据中台不管大小,其链路完整性是非常有必要的,并且在数据标准和数据治理层面是必不可少,只有把数据标准统一了,才可以支撑起整个数据生态。”此外,考虑到企业与机构的成长性,百分点还强调了数据中台的扩展性和灵活性,“数据中台必须足够的健壮,可以支撑业务的弹性变化。”


从宏观层面来看,好的数据中台可以很好地盘活企业数据资产,并且建立起将装的数据资产管理体系,形成数据生态闭环,可以有效地支撑起基于数据的业务快速创新,并且有利于打破内部的固有利益和部门墙,推动企业在组织架构层面的变革,适应数字化转型。

03 数据中台服务商如何选

数据中台的热潮也带火了各种数据中台公司,从上层做大数据营销的公司,到底层做数据仓库、大数据平台的公司,还有用友、金蝶这些传统信息化软件公司,甚至阿里云这样的云厂商,每一家都从自身所擅长的领域去延伸到数据中台市场,希望在数据中台市场分的一杯羹。


不过,面对如此多的数据中台服务商,用户应该如何选择?笔者认为,从三个层面去考虑会更加合理。


首先,需要关注服务商在技术层面的积累,比如像数据仓库、大数据平台等,看是否具有相应的技术经验和强大的技术团队。


其次,需要关注数据中台服务商是否有健全的产品与工具,包括从数据接入、清洗、ETL 处理、可视化等整个体系的产品与工具,这些产品与工具是否经受过大量项目的沉淀与检验。



第三,需要关注数据中台服务商是否有丰富的行业经验和业务沉淀,像政府机构、金融、零售等行业非常符合和需要数据中台建设,虽然每一家企业或机构的数据中台需求迥异,但是供应商在同行业积累下的经验,有助于其在其他用户的数据中台建设。


最后需要关注交付能力,一个数据中台项目,其中数据治理部分就是非常不轻松,涉及到数据标准制定、数据拉通等等,基本上脏活累活占了大半。很可能出现,像一些云厂商不愿意干,小的创业公司又 hold 不住的局面。

04 数据中台未来趋势在哪

“如果当一个数据中台建设起来之后,你的数据科学家、数据分析师还需要在数据整理、加工上花费大量精力和时间的话,那么这样的数据中台肯定不代表着未来的发展趋势。”贾喜顺如是说。


在百分点看来,数据中台某种程度就是面向 AI 的,尤其是当前 AI 应用开始逐渐进入到各行各业之中,需要大量的基础数据集来训练和支撑,数据中台的建立,有利于 AI 模型的训练和 AI 应用的创新。“数据中台应该使用起来非常方便,不仅仅是专业人员才能使用,而是让更广泛的人群直接使用工具和数据,来支撑产品的创新。”


其次 AI 技术来优化和改造数据中台也将成为重要的趋势。“AI 可以让数据中台更加敏捷和高效。像百分点已经在数据中台的底层工具和产品层面开始融入一些 AI 技术,可以在数据标注、数据治理上快速便捷的处理数据;此外,通过 AI 还可以自动生成脚本等。”贾喜顺认为,AI 在数据中台的占比会越来越大,“除了底层之外,对于上层业务做一些 AI 层面的支持,比如 NLP、问答机器人、自动翻译等。”



第三,数据中台的定制化会更加容易。对于数据中台的一大疑惑就是,用户的需求造成的定制化程度严重,数据中台无法形成通用性的产品,造成数据中台项目的交付难度极大。贾喜顺表示:“数据中台的产品和工具将会更加灵活,朝着组件化的方向发展,可以通过积木式的产品搭建来满足用户需求,遇到个性化需求也可以快速通过组件进行定制化的开发。”


总体而言,数据中台将会朝着底层更智能、上层使用更加简单的方向发展。

写在最后

从长期来看,数据中台其实跟企业大小并没有直接关系,不同大小和类型的企业都需要数据中台。数据中台将逐渐成为一种基础能力,这种基础能力将会是企业在数字化时代中所必须具备的。


无论如何,数据中台的建设将会是一个长期、螺旋上升的过程,也将会对企业的组织架构产生深远影响。


就如大型机之父 Frederick Brooks 在《人月神话》中提到:这个世界上没有银弹。数据中台的建设没有一劳永逸的办法,企业与机构要想短期内就实现效果恐怕是不太现实,企业更需要从战略层面进行更多思考,再配合选择合适的数据中台服务商,方能在数据中台建设之路上走的稳当。


2020-03-08 16:441102

评论

发布
暂无评论
发现更多内容

阿里内部出品的这5份Java资料的含金量有多高,你不会还不知道吧

会踢球的程序源

Java 程序员 面试 java面试 构架师

Dock优化工具:HyperDock mac中文激活版

真大的脸盆

Mac Mac 软件 优化工具

STM32F103RCT6驱动SG90舵机-完成正反转角度控制

DS小龙哥

三周年连更

游戏内嵌社区服务开放,助力开发者提升玩家互动与留存

HarmonyOS SDK

HMS Core

华为云场景化解决方案 助力制造业企业数字化转型

YG科技

InfluxDB vs TDengine,用数据“说”性能

TDengine

大数据 tdengine Influxdb 时序数据库 InfluxDB Cluster

CSS文本平衡排版 text-wrap:balance

南城FE

CSS 前端 设计

【倒计时4天】金融服务用户体验专场沙龙开启预约

易观分析

金融 经济

测试环境治理之MYSQL索引优化篇

京东科技开发者

MySQL 性能优化 测试环境 企业号 4 月 PK 榜

IDEA导入多模块maven项目时部分模块未成功加载

redcoder54

IDEA springboot

软件复杂度的思考与解决之道

阿里技术

技术成长 软件复杂度

早有尔闻 | 低碳赋能,创新发展

Openlab_cosmoplat

工业互联网 开源社区

Fabarta 获过亿元人民币 Pre-A 轮融资,打造面向 AI 的图智能 Infra

Fabarta

Groovy def关键字妙用

FunTester

百度CTO王海峰做客《中国经济大讲堂》:文心一言,读书破万亿

飞桨PaddlePaddle

飞桨 文心一言

深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测

汀丶人工智能

人工智能 机器学习 深度学习 损失函数

轻医美面部抗衰品牌“娅蔻”宣布将进军江苏市场

科技热闻

基于多场景化解决方案,华为云助力制造业企业走出数字化转型困境

YG科技

小白福利 | Window前言

GreatSQL

MySQL greatsql greatsql社区

前端面试题之性能优化大杂烩

肥晨

三周年连更

国内服务器终于支持ChatGPT接入到公众号了

派大星

ChatGPT

一文详解 PoseiSwap,Nautilus Chain 上的首个 DEX

西柚子

GitHub重磅上线!开源分布式架构原理设计笔记

小小怪下士

Java 程序员 分布式 分布式架构

华为云助力制造企业解锁数字化转型困局

YG科技

华为云数字化转型解决方案 助力制造业企业迈向智能化

YG科技

明修"栈"道——越过Android启动栈陷阱

vivo互联网技术

flag Activity启动 应用栈Task

css动若脱兔转换视差效果

格斗家不爱在外太空沉思

CSS 三周年连更

Java如何实现手动连接数据库(mysql或oracle)|超级详细,建议收藏

bug菌

MySQL oracle 三周年连更

打破制造业数字化转型困境:华为云助力企业填补数据空白和简化管理

YG科技

Java面向对象编程高级

timerring

Java

如何设计一个几十万在线用户弹幕系统

做梦都在改BUG

百分点技术大咖深度解读:数据中台的迷失与前行_文化 & 方法_百分点科技技术团队_InfoQ精选文章