嘉宾 | 赵松 某知名电动汽车大数据专家
数据中台,自概念诞生以来已经足足 10 年。但时至今日,它仍然是企业数字化转型中最具有争议的技术理念。有企业通过中台建设尝足甜头,当然也有企业数千万成本打水漂,中台究竟是建还是拆的争论连年不休。
在日前的 InfoQ《超级连麦. 数智大脑》直播中,某知名电动汽车大数据专家赵松表示,数据中台建设的最终目的是要为业务创造价值。然而,一些数据中台项目在落地实施后,却未能达到预期效果,导致项目失败,其主要原因在于:
第一,只提供工具,不提供业务价值。如果只是将数据中台交付给业务方,而没有提供相应的业务解决方案,那么数据中台就很难发挥其应有的作用;
第二,缺乏全域视角。数据中台应当打通全域数据,为不同层级的业务用户提供支持。如果数据中台的建设范围有限,那么其价值就会大打折扣。
赵松拥有 10 多年汽车行业数据中台建设经验,在直播中,他根据自身经历,分享了确保数据中台顺利建设和落地的方法,以及企业进行数据管理的策略和路径。
在他看来,在数据管理过程中,数据指标口径的统一非常关键,其经验是通过标准化的流程管理来自各方的需求,并结合技术工具支持这一系列流程的落地。
以下内容根据对话整理,篇幅有删减,点击链接可观看直播回放:https://www.infoq.cn/video/iBN4mNvboJPH6UmzK2OX
争议不断,车企建中台的背景和初衷是什么?
InfoQ:您在汽车行业从业已经多年,也主导实施过多个车企的数字化平台和数据中台项目,在您看来数据中台的建设对于企业数字化转型而言有什么意义?
赵松:近年来,数字化转型已成为各行业热议的话题,大数据是其前身。如今,数字化转型的概念变得更加普及,它不仅包括大数据和数据中台,还涉及业务系统的转型、组织结构和流程的变革,形成了一个完整的体系。
在整个企业数字化转型中,我个人理解数据中台发挥着核心作用,具体而言,数据中台被视为价值引擎,因为它能够展现数据价值,赋能公司各个层级,包括高层、中层和基层。数据中台在公司的经营决策和管理中发挥着重要作用,打破了过去数据孤岛的局面,实现了数据的全面连接,并支持决策所需的各种指标数据管理。这样的核心作用实现了数据驱动决策的意义,提高了企业的决策效率,同时也带来了更多的效率提升和成本降低,涉及研发、生产、供应链以及人才协同等各个环节。总的来说,数据中台是一个数据基座,是企业核心能力的集合。
InfoQ:数据中台概念在业界一直保有争议,您个人如何看待这个起伏不定的趋势?背后反馈出来的是什么样的问题?
赵松:数据中台的概念定义可以分为广义和狭义两种。狭义的数据中台主要是指大数据平台,包括大数据的基础组件,如离线和实时数据集成、开发和运维等基于工具的功能。而广义的数据中台则更加综合,它还包括在此基础上构建的数据模型以及由这些数据模型衍生的数据服务。这一理念最早由阿里巴巴在 2015 年提出,最初被称为 One Data,One ID, One Service,后来将 One Data 替换为 One Model。咨询公司的观点更多地将数据中台定义为数字化可复用能力的平台,包括底层的数据开发、集成、数据模型、数据服务和数据应用等能力,使其可在不同场景和领域中被广泛应用。
尽管对数据中台概念的理解可能存在差异,但总的来说可以归纳为以上三种类型:
数据平台型:侧重于构建数据平台,以满足数据管理和分析的需求。
BI 型:侧重于构建 BI 系统,以满足数据可视化和决策支持的需求。
混合型:结合数据平台和 BI 系统的优势,以满足数据管理、分析和可视化等多方面的需求。
从过去的项目实践来看,许多数据中台项目更偏向于数据平台,或者是以整合业务智能为主的项目,也有项目将大数据平台和商业智能结合起来。这些不同类型的项目通常受到部门需求和阶段性需求的影响,并使用数据中台概念来框架化处理。
InfoQ:大家对于这个概念的不同认知或定义,实际上会影响它在企业内部落地的效果?
赵松:数据中台建设的最终目的是要为业务创造价值。然而,一些数据中台项目在落地实施后,却未能达到预期效果,其主要原因在于:
只提供工具,不提供业务价值:数据中台是一个工具平台,它本身并不直接产生业务价值。如果只是将数据中台交付给业务方,而没有提供相应的业务解决方案,那么数据中台就很难发挥其应有的作用。
缺乏全域视角:数据中台应当打通全域数据,为不同层级的业务用户提供支持。如果数据中台的建设范围有限,那么其价值就会大打折扣。在赋能不同角色时,如果只提供一个工具,很难有很好的满意度。
相反,如果将这两者结合起来,在数据中台的基础上实现全域的经营管理支持,通过数据的整合形成数据指标,并通过指标管理体系赋能各个业务角色,可能会带来更高的价值和满意度。
InfoQ:根据您的经历,多家车企建设数据中台主要是基于什么样的初衷和背景?为了解决什么业务问题?
赵松:在启动数据中台的过程中,无论是公司处于从 0 到 1 的阶段,还是从 1 到 10 到 100 的阶段,可能会遇到几类问题:
数据孤岛,即各个部门间存在着独立的系统和数据,形成了数据孤岛和数据烟囱的问题。数据流动性不足,导致部门间数据无法流动,影响业务流程的协作和决策的有效性。
数据准确性不高,包括技术层面和理解层面的偏差,导致数据不准确。
数据不透明,在早期阶段,我们可能面临着看不到数据的问题。管理可能比较粗犷,管理者可能不清楚整个经营流程链路上发生了什么事情,他们需要一个全局的经营驾驶舱,以便了解公司目前整个业务流转的现状。
数据响应不及时,数据需求越来越多,但数据响应速度较慢,需要规模化地支持更多的数据需求。
基于这些背景,数据中台的启动通常会解决公司内部经营过程中的一些核心问题。换言之,在这个过程中,数据中台的建设旨在解决不同层级的问题,比如,管理层需要基于数据做决策和战略制定;中层需要监督目标的实现并做预警和分析;底层需要数据支持任务完成和问题分析。
InfoQ:数据不准确是指标口径的问题导致的吗?又或者可能是由于什么因素影响?
赵松:刚才提到的指标口径问题可能占据了相当大的比重。此外,还可能是技术计算错误,但可能性较小,大概仅占总体的 10%~20%。
指标口径的不一致可能是由于大家对指标理解不同所致。例如,可能存在同名不同义或异名同义的情况。这种情况很常见,通常是因为不同部门使用了含义相同的指标名称,但其名称却不同。举例来说,部门 A 可能将某一指标命名为“订单数”,而部门 B 可能将同一指标命名为“订单量”。
相反,不同含义指标在不同部门可能会被赋予相同的名称,导致含义不同但指标名称相同的情况,这种情况通常出现在不同团队独立进行命名时。当这些指标向上级报告时,可能会出现问题,因为数据看起来不一致。在整个数据中台项目中,解决数据准确性问题至关重要,确保公司所有指标数据的 100% 准确可以创造约 70% 以上的价值。
InfoQ:数据中台概念来自互联网行业,在传统企业中进行建设时,常常会出现一些水土不服的情况。那么在不同行业中,以上所说的这些驱动力或者路径会有什么差异吗?
赵松:确实存在差异。在互联网公司中,由于公司结构相对扁平,部门间数据互通的问题并不严重,因为数据天然地都集中在一起。然而,在传统行业中,尤其是汽车行业和其他制造业,由于供应链较长,建设数据中台需要考虑更多的价值导向策略。因此,在启动数据中台项目时,关键是要以业务为导向。通常情况下,IT 部门可能承担数据中台项目,但他们必须以业务的视角来驱动项目。
具体来说,业务项目通常要解决公司经营过程中的问题,可以将其视为一种诊断工具,为每个角色提供诊断功能。
首先要解决高层管理层的需求,给他们一个灵活且满足各种需求的实时经营数据视图。这包括收入、利润、销量、交付等核心指标。一旦高层需求得到满足,接下来就可以从上到下推动项目,涉及到各个部门间的数据流动,这样阻力就会比较小。因此,从上而下是一个较好的策略。
另一方面,从下而上更多地解决一线员工和部门之间的数据需求,包括每天的报表和数据报告。在数据中台建设的过程中,建立指标体系既要从上而下,也要从下而上,形成一个完整的企业数据驱动模型。这样,整个企业在进行业务决策时都可以使用数据,并且数据需求是持续不断的,项目的持续性很重要。在项目不同阶段,可以根据需求来建立相应的体系,例如数据标准、数据管理方法和需求管理。这样的方法可以在项目的不同阶段产生价值。
用流程管理需求,用工具管理流程
InfoQ:在实施数据中台项目时,很多企业会设立专门的部门来负责项目的执行。根据您过去经验,我们是如何构建数据中台部门的?具体与其他业务部门如何协调?
赵松:在构建数据中台的团队时,通常会包括以下角色:数据产品经理、数据分析师、算法工程师、数据应用开发人员(前端和后端)、数据测试人员以及项目经理。在以往的数据中台项目中,团队的组织结构通常采用项目为基础,现在更多流行“铁三角模型”,是指项目经理、技术经理和产品经理三个核心角色共同负责项目的三大职能板块。
在项目实施过程中,团队通常与业务团队进行协作,采用 BP(业务流程)化的方式进行协作。数据中台团队会以小组为单位进行组织,每个小组由数据 BP、数据产品、数据分析以及前后端开发人员组成,并通过 BP 的协作形式为各个业务条线提供支持,例如研发、生产和供应链。
BP 化的协作模式具有以下优势:
能够有效避免由于指标口径不一致而导致的数据理解错误或不准确的问题;
通过统一的 BP 协作形式,各个业务条线的数据需求都能够得到满足,并且数据的口径会得到统一管理;
提高了协同作战的效率和准确性。
InfoQ:在确保数据中台建设顺利落地方面,除了组织架构层面的优化外,流程管理也是至关重要的一环。针对数据管理方面,企业可以制定哪些有效的策略呢?
赵松:在数据管理方面,我们主要围绕数据治理的方法论展开工作,包括对整个数据体系和数据资产的管理。在数据资产的管理中,涉及元数据、主数据标准等方面,并且在落地时,我们通常会结合一些工具来支持这些流程,尽管这一过程可能较为复杂,需要较长的时间和一些问题的驱动来改造和落地。
特别是在指标管理方面,确保指标的准确性和有效性至关重要。指标管理涉及到需求提出、口径确认、流转等一系列流程。我们通常采用 BP 的形式来组织这些流程,确保各个部门对指标的理解和流程一致。
流程的核心包括需求提出、口径确认、业务方和技术方的审批等环节。通过将这些流程固化在指标管理平台上,可以有效地管理指标的落地和变更,避免指标口径的不一致。
此外,在数据管理方面,我们也会关注主数据和源数据的管理。在数据治理体系中,对主数据和源数据的管理通常会更加完善,以确保数据的质量和一致性。
InfoQ:汽车产业链复杂,供应商众多,数据管理挑战比较大。是否可以介绍一下,在您负责过的项目中,踩过什么样的“坑”?对于打通各个业务环节,厘清多条并行数据动线,您有哪些经验?
赵松:在数据管理中,我们常常会遇到一些“坑”,这些问题可能与数据中台启动的背景有关。其中一个常见的“坑”就是数据的准确性问题,几乎每个项目都会遇到,尽管这个问题的严重程度各不相同。另一个“坑”是数据的拉通,不同的组织形式可能会导致不同的挑战。
针对这些挑战,我们可以采取一些方法来解决。首先,我们可以通过指标管理的流程化来避免口径不一致的问题。其次,我们需要及时监控数据,从源头数据的产生到数据的加工和服务输出,每个环节都需要进行监控,以提前发现指标的不准确性。因此,建立一个完善的监控体系至关重要,可以根据实际情况制定相应的监控规则。上面提到的解决口径不准确的问题需要指标管理平台和监控体系的支持,这两个方面是我在项目中最深刻的感受。
InfoQ:针对车企,内部不同子集团之间如何安全地清洗和共享数据?
赵松:子集团之间的数据共享要具体情况具体分析。如果是同一公司下不同子集团,外部数据可以共享,内部数据则要谨慎共享。如果是不同公司,则数据共享的可能性更小。汽车行业一些标准化、公开的数据可以共享,例如销量数据,但公司运营数据等内部数据一般不共享。
InfoQ:随着数字化日渐深入,业务的数据意识越来越强,这意味着数据需求也越来越多,那么,对于数据团队而言,如何与业务更好地协作,实现高效的数据需求管理?
赵松:为了高效管理数据需求,我们需要将流程化标准应用于需求管理中,以减少沟通成本并帮助业务方更清晰地提出需求。在实际工作中,业务方可能会提出口头需求,需要不断反复沟通。通过建立流程,例如业务报表需求的详细描述,包括使用背景、指标描述、频率等,业务方需要填写清晰,从而减少成本,提高效率。
当业务方按照流程操作时,可能不需要额外人力干预,自动化运转。这样一来,我们只需进行评估和分析,并安排需求优先级。通过设立明确的优先级标准(如 P0 表示高优先级、P1 表示中优先级、P2 表示低优先级),所有人都能够更透明地了解需求的优先级,从而提高管理效率,应对更大规模的需求。
InfoQ:这种情况其实是比较理想化的,在业务部门的落地执行过程中是否会面临一些阻力?
赵松:在初始阶段可能会有一些不适应,但通过充分的培训,业务部门的人员可以理解并适应这种方式。综合培训可以帮助他们理解数据的角度,并且使他们能够写出更符合规范的需求。如果没有这样的培训,就会导致频繁的沟通浪费时间。只有经过几次的业务方反复思考后,他们可能会逐渐明白其需求,因为他们更了解业务,而数据只是为他们提供支持。虽然一开始可能会有一些阻力,但通过良好的培训,这些阻力将逐渐消除,因此这一步是必不可少的。否则,交付效率可能无法提高。
InfoQ:关于数据管理的投入产出问题,特别是在当前经济形势下,企业对技术投入产出价值的重视程度增加了。以数据中台为例,它被视为一个价值引擎。在这种背景下,如何最大化数据管理投入的效果以及如何量化其价值成为了关注焦点。您能分享一些相关经验吗?
赵松:价值量化方面,从数据中台的角度来看,有多种方式。首先是以数据资产为衡量标准,例如指标数、标签数、数据表数以及数据服务的 API 调用量等。这些量化指标可以衡量系统的使用情况,例如系统被多少人使用、被多少系统调用,从而形成量化手段。
另一种方法是从业务角度考量,特别是以中台上的数据应用为基础的 BI 系统。这方面可考虑业务覆盖的广度和深度。广度指涉及的部门和人数,比如支持的人数从 10 到 1000 人不等,同时还可以考虑不同管理层级的覆盖程度。深度方面则关注系统的使用时长,尤其是管理人员和其他用户在系统中停留的时长以及其活跃度等。这些深度指标能更好地衡量系统的实际价值,因为只有当系统真正有用时,用户才会频繁使用。
InfoQ:在让业务人员认可技术项目的价值方面,存在一个问题,就是如何确保业务人员真正意识到其价值。有时候,技术 IT 项目可能会陷入技术人员自我满足的状态,您是否遇到过类似情况呢?
赵松:对于技术认知方面的情况,确实存在一些情况是由技术人员主导提出需求的。然而,在实际落地过程中,需求往往是由业务方提出的,尤其是涉及指标体系。业务部门通常需要定期查看数据并生成报告,这在手工操作时会变得繁琐。
举例来说,业务人员可能需要从多个数据源手动获取数据,而将这些数据制作成仪表盘则会极大提高效率。特别是对于销售部门等需要实时数据的部门,数据的频繁更新和可视化展示对其价值至关重要。
至于技术人员开发的工具,在业务人员看来可能并不那么重要。业务部门更关注的是工作流程、工作产出、以及工作目标的实现。因此,解决业务方的实际问题才是真正带来价值的关键。比如,如果业务部门的经营目标和 KPI 是基于特定指标的,那么支持这些指标的计算和实时查看就能够解决他们的需求,为他们带来价值。因此,只要技术团队能够解决业务部门的实际问题,就能够产生真正的价值。
InfoQ:需求由业务部门主导是否会出现大量“伪需求”的出现?在您所在企业,最终落地的项目是由单方面提出还是业务和技术在某种场合或流程下共同碰撞而来的呢?
赵松:在初始阶段,团队可能会处于学习的状态,对业务不够熟悉,这时通常是单方面接收需求并执行。随着对业务的理解加深,进入第二个阶段,团队开始共创,技术团队可以提出反对意见或更好的建议来引导业务需求。第三个阶段可能是在既了解业务又了解技术的情况下,可以通过说服力来推动方案。通常经过一段时间后,第二个阶段会更为常见,团队会共同探讨并做出决策。然而,在实施过程中可能会出现各种情况,有时业务可能会坚持自己的观点,而技术团队可能会选择按照业务需求先行实施。无论如何,业务方是要对结果负责的。
InfoQ:对于许多传统汽车企业来说,它们积累了许多年的技术债。在进行数据中台建设等转型过程中,如何使转型过程更加顺畅?
赵松:举个例子,在过去的一个类似项目中,针对合资汽车企业的营销领域,我们实施了一个成功的数字化营销数据中台项目。我们成立了一个新的数字营销部门,并采用了高效的在线云平台方案,将所有系统都迁移到了云上运行,包括营销服务系统。这种云上的数据中台架构非常高效,因为大型云服务提供商的工具非常成熟,使我们能够更专注于业务方面。
在这个基础上,我们以业务项目为驱动,快速实现了项目目标,而不是按传统方式花费数月甚至更长时间。我们在短短三个月内完成了一个管理层用的大屏,用于实时监控业务销售数据,这种快速实现的模式使得项目的成果迅速见效。需要注意的是,随着项目周期的延长,可能会出现大家对项目进展耐心不足的情况。总结这个项目的成果经验是:
成立专门的部门,保证项目资源和人员投入;
采用云上部署方式,降低成本、提高效率;
聚焦业务,快速迭代,满足管理层需求。
数据部门或将从成本中心变利润中心
InfoQ:过去一年,数据资产入表、“数据要素×”行动计划等一系列政策文件相继发布和实施,这对于整个汽车行业有哪些意义和价值?对于车企的数据管理策略制定又会带来哪些影响?
赵松:这些政策的出台可能会带来一些令人兴奋的变化。过去,数据部门通常是成本中心,但随着数据资产入表政策的实施,它们可能转变为利润中心,实现了真正的数据业务化。
举例来说,类似于金融行业的互联网金融模式,将数据和模型作为利润中心的情况是成功的。这种模式涉及征信评分,其中包含了多种数据,如消费数据、个人数据、社保和公积金等,形成了一个大的模型集合。
对于汽车行业而言,政策的实施将外部数据(如汽车销售数据、营销商数据、舆情数据等)和内部数据(如销售数据、生产数据、车联网数据等)合规地进行流转和利用。这将使得数据成为一个原材料,通过加工成指标或标签,将其应用于各种场景,产生附加值和经济价值,从而促进对底层数据管理的提升。
外部数据的流转相对容易,但内部数据的流转则可能更具挑战性,需要进一步的探索和摸索。目前,外部数据的流转已经有了一些典型案例,比如中汽协将整个汽车行业的销售和产能数据进行收集和加工,然后再输出给各个车企。这为行业的发展带来了新的可能性。
InfoQ:能不能举例车企对于多源外部数据的需求场景?另外,车企在汽车可信数据空间的落地建设方面有何具体策略?
赵松:多源数据场景与可信空间具有关联性,特别是在车企的情况下,外部数据的应用场景包括利用外部数据提升销售转化率,通过网络数据实现数据安全,并在行业中进行可信计算的探索。
外部数据来源包括销量数据、社交媒体上的用户反馈(例如评论、点赞、转发等)、舆情数据等。为了构建可信的数据空间,车企倾向于利用第三方内部数据进行联合建模,以支持销售和营销。这些场景和方法都在行业内得到了广泛探索和应用。
InfoQ:数据入表这个动作本身很简单,但数据资源不等于数据资产,背后的关键问题其实在于“哪些数据是可以入表的”?哪些问题是企业可能容易忽略的?对此,您怎么看?
赵松:所以关于数据入表的标准,我可以基于个人理解分享一些见解。首先,入表的数据必须具有价值。并不是所有数据都具备价值,有些数据可能并不是非常有用。举个例子,指标数据和原始数据都可以被称为数据,但这些原始数据是否有价值并不确定。我们需要定义什么样的数据是有价值的。对于行业的上游、中游或者下游,哪些数据是必需的?
举例来说,供应链可能需要生产数据或销售数据来预测供应链的情况,这对他们来说就是有价值的数据。同样,售后服务提供商可能需要涉及上中下游的数据,以确定对整个价值链有用的数据。因此,有价值的数据可以被视为数据资产进行流通。
另外,数据入表的前提是数据必须是干净的。这意味着数据必须是可信的,不能是脏数据或质量较差的数据。
InfoQ:对于汽车行业的数据在市场上进行流转,目前尚未有明确的规范,因此尚不清楚哪些数据适合流转,哪些不适合流转。除此之外,汽车行业在数据要素的交易流通方面还存在哪些挑战,以及应该由何种角色牵头,车企又可以发挥何种作用?
赵松:挑战主要集中在两个方面。
首先是数据合规性,特别是在处理用户个人信息和隐私方面,必须坚守合规的红线。在数据入表和数据资产的情况下,尤其应避免接触隐私数据,更多地关注非隐私数据的处理,以确保合规性。
其次是数据质量,因为数据质量直接影响数据的可用性和准确性。数据质量包括多个方面,需要解决这些问题以确保数据质量。
在汽车行业中,车企可以通过参与协会等形式发挥重要作用。协会可以扮演牵头或协调的角色,促进数据要素和数据资产入表的流通,推动行业的发展和合规。
InfoQ:综合考虑一系列政策的发布,您个人对未来企业数据要素的落地和数据资产化的应用有何期待或建议?另外,您个人以及所在企业今年的工作重点又会是什么呢?
赵松:在汽车行业,我期待数据能够像我刚才说的那样,从成本中心转变为利润中心,真正成为一种资产,并在交易所上流通,创造经济价值。
我的个人工作重点将主要集中在数据管理和数据体系的建设上。由于早期阶段的数据管理体系相对较为简单粗糙,我将致力于优化我们的数据管理流程和体系建设,以提高效率。这将涉及流程和工具的优化,以更好地支持公司整体数据中台的建设和业务方数据驱动决策的实施。
专题征稿启事
InfoQ 数字化经纬正策划一项专题《数据要素×千⾏百业,数据驱动企业转型创新》,希望通过该专题,从不同⾏业⻆度出发,探讨数据驱动策略在企业转型过程中的应⽤实践,挖掘数据要素×创新场景和案例。借此让从业者和相关利益⽅深⼊了解企业如何管理好数据资产,挖掘数据价值,从⽽助⼒企业在⾯对变⾰时作出更明智的决策,实现⻓期发展。
我们欢迎相关企业实践案例的投稿,或是希望接受我们采访的企业与个人主动联系我们。
评论 1 条评论