写点什么

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践

  • 2020-03-08
  • 本文字数:3718 字

    阅读完需:约 12 分钟

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践

百分点数据中台的设计理念

在政府和企业数字化转型中,数据中台可以说是数据资产化演进至的新阶段,传统企业建设大数据平台的需求,也日益转换为对建设数据中台的需求。


原因在于,过去搭建数据资产平台的理念,未解决数据人员与业务人员之间存在的隔阂:数据人员不懂业务,导致数据过于技术化;业务人员不懂技术,无法使用数据。而随着数据中台概念的普及,以及传统企业中业务人员自身能力的提升,促使业务人员产生自主需求,希望借助平台获得分析数据的自主能力。并且,客户也有依托自身数据,发挥自身数据价值驱动业务发展的需求。



我们认为,要想让数据中台去支撑前台百花齐放的数据应用,首先数据层面要提供标准化的支撑,并且将前台应用所产生的大量数据回流到数据中台之中后,还可以形成完整的数据闭环,最终驱动企业和政府客户形成自身完整的数据生态。


为了做到这点,百分点将数据中台分为四个层次,从透明化的大数据技术平台到智能化的数据资产工具,再到行业化的数据资产,最终实现场景化的数据应用。



一是为数据筑巢,“用数据说话”。


万物互联所产生的数据爆发式增长,带来了实时数据分析需求的日益增长,尤其当数据量达到亿级、百亿级甚至万亿级规模,大多数企业和政府客户自身不具备技术团队,缺乏技术运维能力。


因此,如何标准化、透明化设计建立数据中台这个中枢神经,更快速地响应业务的变化成为最大挑战。


百分点在搭建万亿级大数据平台的建设实践中,将大数据技术组件能力透明,用户能够清晰了解各组件的技术能力,并判断是否与自身需求吻合,并且因为组件能力透明,后续也可在运维监管中做精细化管理。


现在,这个平台正承载着万亿级数据的存储、处理和应用,能够支持线上 2000+亿/天、峰值 500+万/秒的数据处理,且在实时性、稳定性、异构存储能力方面同样表现优异,在本地化部署万亿级大数据平台方面引领行业前沿。


此外,每个行业或者企业依托数据中台建设行业化数据资产时,需要建立一些规范与标准,百分点在大量实践基础上,将这些行业标签体系、数仓构建规范、数据标准与质量体系,形成丰富的行业性标准,并沉淀到工具中,落地实践时可以直接复用到更多行业,降低了实施中 60%的人力和时间成本


在安装部署上,百分点大数据操作系统 BD-OS 现在 只需要一个人、两个小时、三个步骤就能完成。未来,每一个普通人都能具备使用和操作大数据的能力,能够随时利用数据智能技术产品解决实际业务问题。

智能化的数据工具

二是将数据从“能用”转变为让更多人“易用”。


现阶段,各家数据工具大同小异,为了让数据中台在数字政府、媒体出版、零售快消等领域落地,百分点的独特性 在于,不仅结合 AI 让数据中台更加敏捷和高效,还能助力数据智能化,让数据平台更简单,更好用。


基于此,百分点 智能化数据工具实现了三个目标


第一,抛开技术的思维,降低使用门槛,让业务人员也能够轻松使用数据、用好数据;第二扩充平台的使用人群,数据中台的使用不再局限于技术人员,业务人员同样也能玩转数据中台;第三,降低管理实施的成本,智能化工具能够复用于不同项目中,节省 60%的人力和时间成本。


那么,这三个目标是如何实现的?


赵群表示,百分点通过数据仓库、机器学习平台和动态知识图谱平台等进行数据治理,从而形成了数据集、标签、知识图谱和智能分析等智能化数据工具。


如下图,百分点将智能化数据工具整体模块架构分为三层。



百分点智能化数据工具整体模块架构


以百分点智能分析工具为例


百分点智能分析工具将 BI 结合 AI,大量使用深度学习和自然语言处理技术,通过结合智能推荐、智能问答、智能挖掘等 增强分析能力,促使分析效率更高、门槛更低、数据分析能力更普惠。


当用户使用 智能推荐 时,可以直接通过语音问答的方式,询问“各订单来源的总支付订单量的占比为多少?”系统就会自动推荐所有适合该问题的图表,并将展示效果排序,不需要客户再进行任何的操作。


同理,对于数据治理工具,基于智能化的设计理念,实现了为前台业务自动化推荐数据标准、数据质量稽核的能力,大大提高了数据治理效率。


值得注意的是,百分点智能化的分析工具,不仅降低了技术门槛,基于 智能分析工具核心技术引擎,更能将实施成本缩减超过 50%。


百分点自主研发了异构任务执行引擎,集中负责与底层集群的交互,可支持知识多云、多集群甚至异构场景。智能工具通过 Rest API 提交,执行任务管理、协同和监管方案,再协调向各个数据集群制作 Shell、Python、Hive 等查询任务,最终实现智能分析工具的任务提交、执行、状态获取和结果查询,以及优先任务的判断。

同时研发了行业领先的基于统一数据模型、内存、Pipeline 的交互式数据融合引擎。结合生产流水线的设计,业务人员通过拖曳的方式,就能够轻松操作平台,解决业务问题,还能以 Pipeline 的方式,随时发送命令,实时查看结果。

行业化的数据资产

三是,彻底解决“数据用不起来”的问题。


在百分点服务众多客户后发现,“数据用不起来”往往是因为数据不规范,且业务部门未能深度参与。数据治理成功与否的关键,就在于是否能全局思考,结合各个业务部门规范数据,制定标准化体系。


那么,到底该如何将数据资产化,从而为前台应用提供更标准、更有营养的“养料”?


基于多年实践经验,百分点重点面向政府、公共安全、媒体出版、零售快消等行业打造了行业化数据资产体系,主要分为两个维度:数据资产标准实施路径和业务驱动数据流通的敏捷闭环

数据资产标准实施路径

百分点数据资产标准实施路径以标准为主导,兼顾组织和项目。只要建立了先进的标准,那么数据治理就都可以按项目方式进行。


百分点的数据资产标准实施路径为“五大体系、十一个步骤”。五大体系即数据接入、数据处理、数据治理、数据组织和数据服务,而十一个步骤则是五大体系的十一个完整运作过程。


五大体系中,第一步数据接入,做业务的盘点和数据接入;第二步是数据处理,做数据勘探和数据预处理;第三步治理数据,主要定义数据标准,将数据标准化;第四步数据组织,建设数据仓库,基于数据仓库,进行数据加工处理、资产化,形成数据资源目录;最后进行数据服务,做数据开放共享。

业务驱动数据流通的敏捷闭环

企业做大数据,本质需求是利用基于大数据的某个应用,盘活数据,挖掘数据价值。由此,百分点探索出一套真正有序的敏捷方式:由业务驱动数据流通为主导,强调价值和分享,真正做到数据“越用越好”。


那么这个敏捷方式该如何打造?


第一,业务驱动数据流通。


首先为业务人员提供敏捷的获取方式、自助接入的方案,实现自己接入数据,加工数据。其次,从业务的角度理解数据、加工数据和分析数据。最后,重点突破数据流通价值,沉淀并共享数据产品的价值模式。


第二,建立数据价值评估体系。


评估维度包括信息完成度、数据质量、使用情况、主观评价及响应速度。最终基于这五个维度,得到数据得分。


第三,完善数据运营管理体系。


划分责任,组织数据运营管理团队,制定运营体系;责任到人、激励到部门、资产到公司,考核组织对数据的共享方式,最终实现跨部门数据共享。


同时,敏捷闭环中存在四个角色:数据使用者、数据责任人、部门和公司。数据使用者对数据进行使用,并提交数据使用的反馈,并在这两个过程中,实现“数据越用越好”;评价反馈到数据责任人,责任人根据指标优化数据,满足使用者需求;部门则通过了解部门资产情况、促进数据共享;而公司则可以沉淀数据资产、组织激励考核方式,拥有了管理抓手。


那么在敏捷闭环形成后,它的驱动力和效果如何展现?依然从四个角色入手。


在敏捷闭环之外,四个角色均有各自的诉求:



对公司来说,


  1. 数据资源利用如何最大化?

  2. 如何打破“部门墙”?



对部门来说,


  1. 如何用数据帮助业务?

  2. 数据平台怎样提供数据分析的自主能力?

  3. 如何解决数据“只进不出”、不会使用数据的问题?



对数据负责人来说,


  1. 如何获得个人成就感?

  2. 如何获得认同?



对数据使用者来说,


  1. 有什么数据?

  2. 什么数据有用?

  3. 如何使用?

  4. 如何获得使用数据的成就感?


以上这些诉求及问题,都能在敏捷闭环中得到解决:


公司层面,拥有了数据管理的量化指标,能够看到部门间数据共享利用情况;

部门层面,有了数据资源共享的考核压力,同时通过数据平台的智能化工具及 SAAS 的能力,获得自主能力;

数据责任人层面,有了数据排名,能够通过他人反馈提升自身成就感;

而对于数据使用者来说,通过数据得分等各维度,能够发现高价值的数据,查看案例等。

最终,在敏捷闭环的驱动下,会沉淀出高价值的数据。


万物互联时代,数据已不是稀缺物品,“好数据”才是企业开展新型运营、创造价值的中枢系统,而数据中台承担着这一中枢系统的最核心作用。回看百分点数据中台透明化、智能化、行业化、场景化的设计理念与实践,百分点正在从让数据“能用”转变为更多人“易用”的道路上越走越远,越走越坚定。


百分点始终认为,传统企业运营数据中台,打造行业化数据资产,是要“将数据越用越好,而不是越管越好”。这就要求企业以高质量数据为基础,保证数据责任到人,充分盘活数据资产,让业务驱动数据流通,从而打造良性生态闭环,促进前台业务创新。


百分点数据中台始终基于业务场景,以为客户创造价值为原则。未来百分点仍将笃定让数据智能在企业和政府数字化转型中发挥力量,不断助力数字政府、智慧警务等领域的数据中台落地。


2020-03-08 16:44946

评论

发布
暂无评论
发现更多内容

测试面试真题|从手工到测开,一位测试媛宝妈的 BAT 大厂逆袭之旅

霍格沃兹测试开发学社

软件测试 | 测试开发 | 一文搞定 Postman 接口自动化测试

测吧(北京)科技有限公司

测试

计算机网络——封装成帧和透明传输

StackOverflow

编程 计算机网络 9月月更

kube-prometheus 监控系统使用与总结

CTO技术共享

测试面试真题|抖音的广告系统前后台,该如何测试?

霍格沃兹测试开发学社

阿里MaxCompute生态团队负责人—李睿博 : 参与开源,让自己的履历与众不同|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

数据库 线上讲座 Apache IoTDB 企业号九月金秋榜

干货分享|使用 Istio 实现灰度发布

北京好雨科技有限公司

istio #Kubernetes#

深入理解MYSQL之缓存

C++后台开发

MySQL 数据库 缓存 中间件 后端开发

EMQ走进亚马逊云科技:携手云端,共筑「面向未来」的IoT基础设施底座

EMQ映云科技

物联网 IoT 解决方案 亚马逊云科技 9月月更

测试人生 | 30 而立之年的蜕变,6 个月完成从国企到 BAT 大厂测开的华丽转身

霍格沃兹测试开发学社

软件测试 | 测试开发 | iOS自动化真机测试验证环境过程中常见问题解析

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 《穿越时空的git》之创建版本库和常用命令操作

测吧(北京)科技有限公司

测试

性能测试知识科普(二):测试策略

老张

性能测试

大厂校招SSP获得者—张金瑞 :开源项目,求职者的最佳简历|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

开源 求职 Apache IoTDB 企业号九月金秋榜

企业FAQ页面案例展示及FAQ站点搭建技巧

Baklib

企业 FAQ

Saas企业数字化必不可少的工具——帮助中心

Baklib

SaaS 企业 数字化 帮助中心

软件测试 | 测试开发 | Python中日志异步发送到远程服务器

测吧(北京)科技有限公司

测试

提质增效,安全灵活,阿里云EDA上云方案让芯片设计驶入高速路

阿里云弹性计算

HPC EDA 高性能计算 芯片开发

JS-内置对象API-Array(数组)-(二)-不改变原数组的API-篇

Sam9029

JavaScript 前端 9月月更

用户组角色绑定(原生element-plus-ui表格)

青柚1943

Element Plus Vue3 Typescript

软件测试 | 测试开发 | JAR 文件规范详解

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | app自动化测试(iOS)元素定位(新手篇)

测吧(北京)科技有限公司

测试

搭建在线帮助中心是企业最重要的第一步

Baklib

企业 在线文档 帮助中心 帮助文档

Onedev v7.4.14 路径遍历漏洞分析(CVE-2022-38301)

墨菲安全

网络安全 开发安全 漏洞分析 软件供应链安全

软件测试 | 测试开发 | iOS 自动化测试踩坑(一): 技术方案、环境配置与落地实践

测吧(北京)科技有限公司

测试

软件测试 | 测试开发 | 一文彻底理解 Cookie、Session、Token

测吧(北京)科技有限公司

测试

个推直播预告:9月26日,一线专家分享APP数字化运营方法与实践

个推

数字化 用户画像 标签体系

【Vue2】简易Vue2-简易图书借阅管理

Sam9029

Vue 前端 9月月更

获得多家大厂SSP的清华应届毕业生—田原:大厂各轮面试中开源经验有什么用|《大神详解开源 BUFF 增益攻略》讲座回顾

Apache IoTDB

数据库 开源 求职 Apache IoTDB 企业号九月金秋榜

软件测试 | 测试开发 | 不懂PO 设计模式?这篇实战文带你搞定 PO

测吧(北京)科技有限公司

测试

阿里云PolarDB-X 荣获“2022 OSCAR 尖峰开源项目及开源社区”奖

阿里云数据库开源

阿里云 分布式数据库 开源数据库 PolarDB-X 可信开源

一切为了让数据价值升华,解密百分点数据中台的设计理念与实践_文化 & 方法_百分点科技技术团队_InfoQ精选文章