写点什么

大数据的下一站:数据中台

  • 2018-09-17
  • 本文字数:1962 字

    阅读完需:约 6 分钟

伴随着移动互联网和物联网的发展,大数据概念开始产生,但并不是所有的数据都能称为大数据,IT 调研与咨询服务公司 Gartner 对“大数据”的定义是:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据行业发展现状

根据中国信通院发布的中国大数据发展调查报告:2017 年中国大数据总体规模为 4700 亿元人民币,同比增长 30%,2017 年大数据核心产业规模为 236 亿元人民币,增速达到 40.5%,预计 2018-2020 年增速保持在 30% 以上。

在大数据应用上,接近 2/3 的企业已经成立相关数据分析部门,企业对数据分析的重视程度进一步提高,其中应用大数据实现了智能决策的企业占比最高,达到了 55.2%,其次,46.6% 的企业表示应用大数据后提升了运营效果,35.9% 的企业应用大数据后能够更好地管理风险。

大数据得到快速发展的一个重要原因是智能手机的普及,用户行为被有效记录下来,全球数据量开始呈现爆发性增长,目前,大数据的来源主要包括:

  • 移动设备的传感器收集了大量用户的行为数据;
  • 电子地图产生大量的用户轨迹数据,揭示了人们的流动规律和生活习惯;
  • 电商应用带来了网上交易数据,包括购买喜好、支付渠道、物流运输等。

在技术层面上来说,数据采集与传输、数据存储与管理、计算处理、查询与分析和可视化展现构成数据分析生态结构,近几年,相应技术层级的企业都如雨后春笋般涌现。而目前,数据体量、产业规模以及云计算高速发展所推动的基础设施成本都已不再是问题,大数据能否创造真实的商业价值和回报是大数据企业真正关心的核心问题。

开放数据是合作的基础

TalkingData 创始人兼首席执行官崔晓波认为,互联网公司之间的战役已经结束了。所有企业主战场不在线上而在线下,不管是互联网巨头还是产业巨头都在思考如何利用互联网、数据和相关技术的能力改变线下产业。而且,选择合作伙伴应该遵循一个原则:愿意真的开放数据,愿意给实体产业赋能

目前,中国已进入数据时代,企业核心竞争力是数据,不管是数据中台还是数据平台,提供的是一个核心能力,基于这一核心能力需要和别人互利共赢。简单说就是如何管理渠道、管理合作伙伴,这是中国企业首先要过的一关。第二才是如何把这个东西做大,其后才是生态环节。

大数据需要合法连接

数据的收集一直被人们担心是否侵犯了个人隐私,对此,崔晓波认为美国对信息隐私主要采取普通法保护的模式,由法院最终确定哪些行为构成侵犯隐私权。中国的个人信息保护制度才刚刚建立,只有几部法律分别界定了个人信息保护的内容,对如何保护个人信息还没有统一的说法,所以,需要结合我国的国情形成我们特有的个人信息保护理论和个人信息保护制度。

对企业而言,他们应该考虑数据如何做到安全合法连接,国家鼓励数据互联互通,政府部门之间数据也需要互联互通,但是由于规则不清楚,大多公司都不敢去做。所以企业需要摸清合规的界限在哪里,做到合法连接;数据连接、关联之后,再提供类似于安全沙箱的环境,将数据在里面做整合,来保证应用、建模时的数据安全。

大数据需要沉淀为产品

虽然,在基础科研方面,中国跟美国还有一些距离,但在大数据应用市场上,中国的应用和需求是比较强劲的,因为中国企业更关心应用和落地,解决应用才能给客户创造价值。

过去,所有大数据企业都在做项目,并没有更多资源把能力沉淀成产品和平台。比如很多可共用的数据服务没有服务化、产品化,很多产品总是做重复的动作。

今年,数据中台成为大数据行业的热门概念,它最先是从阿里引出的,是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。

在不久前举办的 TalkingData T11 数据智能峰会上,红杉中国专家合伙人车品觉先生指出,数据中台把数据与数据的技术,再与整个人才架构或公司架构结合以后,能孵化出更多的创新出来,形成创新的前端。

未来,基于数据时代,可能有很多公司平台出现。现在几大互联网巨头都在做自己的平台,不过更多是为企业自身服务。但创业公司由于体量比较小,既缺少客户,也缺乏聚合数据的能力,这就需要数据中台提供赋能。如何让服务头部企业探索出来的能力和方法,更好地去赋能整个产业链中的中小企业,是未来几年着力探索的工作。

崔晓波认为数据中台需要具备数据管理、数据工程和数据科学的能力。现在不同的数据中台有很多,有的企业把数据中台做成了软件中台,堆砌工具,这往往是 IT 部门主导的。但是所有数据中台的核心应该是数据,最核心的思想是数据如何共享,所以数据中台是否成功的唯一检验标准就是是否有足够的共享能力。

2018-09-17 01:533460
用户头像

发布了 83 篇内容, 共 48.2 次阅读, 收获喜欢 187 次。

关注

评论

发布
暂无评论
发现更多内容

RDMA网络实践

天翼云开发者社区

云计算 存储 RDMA

小度搭载AI技术进军手机市场:AI技术会是手机市场的一剂强心针吗

石头IT视角

Zebec 生态旗下 NFT协议 PlazaDAO宣布进军BRC20生态,有什么规划?

股市老人

Flink的函数体系

阿泽🧸

flink 三周年连更

QUIC协议在天翼云CDN全站加速产品中的应用

天翼云开发者社区

云计算 QUIC

OpenVINO: 一款全面的深度学习应用程序优化工具

IT蜗壳-Tango

三周年连更

linux上SVN出现 "Unable to connect to a repository at URL 'svn://xx.xx.xx.xx/xxx' 和 No repository ...

北桥苏

svn linux\

解决easyswoole的swServer_start_check: onTask event callback must be set at报错

北桥苏

php swoole

ChatGPT 中文指令指南,教会你如何使用chatgpt实现中文你想要的答案

汀丶人工智能

ChatGPT

并发编程:ErrGroup的正确使用

Jack

Java 如何在 Array 和 List 之间进行转换

HoneyMoose

滋灌中小企业,分销伙伴和华为来做“送水人”

脑极体

分销

开源赋能 普惠未来|统信软件寄语2023开放原子全球开源峰会

开放原子开源基金会

Shell脚本中的echo命令

梦笔生花

echo Shell命令 三周年连更

C++异常和错误处理机制:如何使您的程序更加稳定和可靠

小万哥

c++ 程序员 面试 后端 开发

Django笔记二十四之数据库函数之比较和转换函数

Hunter熊

Python MySQL django cast

音视频八股文(11)-- ffmpeg avio 内存输入和内存输出。内存输出有完整代码,网上很少有的。

福大大架构师每日一题

c ffmpeg 福大大

长三角生物医药产业加速跑,飞桨螺旋桨为创新药企、医药技术伙伴装上AI大模型引擎

飞桨PaddlePaddle

飞桨 科学计算 飞桨螺旋桨 文心生物计算大模型

今天开讲,6 大演讲主题、5 位技术大咖!龙蜥大讲堂 5 月精彩直播预告抢先看

OpenAnolis小助手

开源 操作系统 内核 龙蜥社区 龙蜥大讲堂

为什么ChatGPT用强化学习而非监督学习?

OneFlow

解决nginx配置负载均衡时invalid host in upstream报错

北桥苏

nginx

AI 大底座,大模型时代的答卷

Baidu AICLOUD

大模型训练

怎么在 vue 中使用 form 清除校验状态?

海拥(haiyong.site)

三周年连更

基于 TiDB + Flink 实现的滑动窗口实时累计指标算法

PingCAP

MySQL 数据库 开源 分布式 TiDB

天翼云“息壤”荣膺第六届数字中国建设峰会“十大硬核科技”称号

天翼云开发者社区

云计算 算力 超算

「微服务的细节」—— 如何支持多协议?

袁世超

微服务 协议

深入解析PHP代码审计技术与实战【网络安全】

网络安全学海

编程 网络安全 信息安全 渗透测试 WEB安全

云原生日志收集机制和日志处理流程规范

穿过生命散发芬芳

日志分析 三周年连更

大咖说丨云计算:数字世界的“中枢神经”

天翼云开发者社区

云计算

飞书深诺电商广告素材搜索实战

飞书深诺技术团队

向量检索 Milvus 以图搜图

测试环境

乌龟哥哥

三周年连更

大数据的下一站:数据中台_大数据_覃云_InfoQ精选文章