速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

长沙银行:躺在数据“金山”上,如何把价值挖掘出来?

  • 2024-04-19
    北京
  • 本文字数:7244 字

    阅读完需:约 24 分钟

长沙银行:躺在数据“金山”上,如何把价值挖掘出来?

长沙银行,是最早将数据驱动赋能科技创新上升到全行战略定位并付诸实践的城商行之一。


不过,在这个过程中,长沙银行面对的挑战不仅仅是技术更新,组织结构调整、人才队伍建设、人员思维方式的转变同样充满考验。前期通过构建“16213+”体系架构,将数据中台作为核心部分,长沙银行具备了数字化转型的必备“硬件”,随后其在智能风控、智慧运营、数字经营等业务领域不断深化数据应用,数据逐步在促进业务创新、提升决策质量等方面起到关键作用。同时,长沙银行在数据标准的统一、数据指标的管理,以及数据质量的控制上也做出了系统性的努力。


本文中,InfoQ 通过与长沙银行数据团队负责人宋智强的交流,探讨了该行在数据应用和数据治理方面的策略与行动,以及这一切是如何推动其数字化转型。同时,我们也讨论了在目前经济环境下,如何确保数据管理的投入产出比最大化和价值的量化问题。

将“数据驱动”广泛整合进战略规划


InfoQ:是否可以大致介绍一下长沙银行进行数字化转型的背景是什么?


宋智强:从我的角度来看,长沙银行的数字化转型背景是多方面的,综合了市场需求、技术进步和内部策略更新的结果。


首先,是业务发展所需推动了这一转型。过去十年,传统的对公业务市场趋于饱和,寻求增量利润变得困难。与此同时,零售业务板块迎来高速发展阶段,银行也纷纷开启业务上的转型,尤其是向零售转型,这自然带动了对数字化的需求。


第二个驱动力是业态的变化。随着互联网的迅猛发展,银行面临物理网点拓展的瓶颈,而移动端和线上渠道的诉求则日益增强。这促使银行必须提升线上服务能力,以满足日益增长的客户需求,通过数字化转型全面提升服务效率和覆盖范围。


第三,站在技术发展的维度,长沙银行早在 2015 年便建设了 Hadoop 大数据平台,初期更多是用于报表、统计分析,但怎么把数据变为生产力来支持前面提到的业务转型,也是转型的契机之一。正好在 2018 年长沙银行完成新核心项目的落地,我们解决了历史遗留的、相对比较重的包袱,在技术和业务上都准备好迈向新的阶段。


InfoQ:长沙银行是最早将数据驱动赋能科技创新上升到全行战略定位并付诸实践的城商行之一。具体而言,我们相应制定了什么样的数据战略?


宋智强:我们行的数据战略是伴随着全行三年战略规划和数字化转型规划提出来的,目标是“打造以科技驱动的数字银行”,希望通过构建数字银行体系,全面提升服务和竞争能力。因此数据驱动作为一个核心概念,早早地被整合进科技条线与业务条线的战略规划中,并坚持“小步快跑,急用先行,价值优先”原则,落实到每年的重点工作中。


比如在数据基础设施建设上,最开始只有一套基于 Hadoop 的离线数据计算,后面逐步引入实时数据计算、内外部数据服务平台、数据开发平台等。为了强化数据分析、人工智能的支持,又陆续建设了数据实验室、人工智能模型平台等。同时,整个数据标准管理、数据治理流程、数据资产盘点,也都是在战略引导下规划和推进的,有效的保障了高质高效地把数据资源变成数据资产。


此外,长沙银行在数据应用方面,也从一些简单的存款、贷款经营报表统计,通过对数据价值的挖掘和数字化场景的探索,逐步延伸到渠道数字化运营、风险智能化决策、营销精准化触达,以及利用数字化、智能化手段来进行企业内部管理各方面的提质增效。


同时,长沙银行与多个头部互联网企业开展了深度合作,共同推进数字化转型项目。


InfoQ:近几年,长沙银行在金融科技组织架构方面动作频频,成立了金融科技部、数据中心、开发中心。您所在的部门在数字化转型中主要扮演什么角色?承担哪些具体工作?


宋智强:金融科技部、数据中心和开发中心,我们称为“一部两中心”。其中金融科技部主要负责整体的科技规划和架构统筹,而数据中心专注于数据运维和基础设施建设,开发中心则致力于研发交付,通过技术实现满足业务需求,同时提升企业的数字化水平。


具体到我所在的数据技术团队——作为开发中心的一部分,我们主要负责数据中台、数据分析、人工智能相关的技术和场景建设,与传统的交付团队相比,不仅要基于现有数据平台和数据产品响应来自业务部门的应用需求,更多地还要从自身数据专业领域出发,主动换位思考参与到业务部门具体数字化场景建设中,帮助业务插上数据驱动的“翅膀”。


因此在具体工作划分上,数据技术团队会根据需要分成两部分人员:一部分以数据中台相关能力建设为主,专注于常规研发以及对业务用数的支撑,通过不断提升数据价值链的高效率、高质量生产,推动数据资产的业务应用;另一部分则以数据分析、人工智能赋能为主,更侧重于利用专业化知识技能和技术,与业务部门开展深度赋能合作,协助业务完成各类数字化、智能化场景搭建。

数字经营最大的挑战是思维转变


InfoQ:长沙银行根据自身情况搭建了“16213+”数字化转型体系架构(即一组云数据中心,六大中台,双网双柜,一个智能营销平台,三大生态,以及基于金融科技的若干创新应用),其中,数据数字化中台具体指的是什么(是否与大家认知中的数据中台一致)?


宋智强:“数据数字化中台”是长沙银行数字化转型体系的关键组成部分,在我看来,它的概念和职能实际上与大家普遍认知里的数据中台区别不大,包括基础平台能力、数据开发、数据利用服务能力以及数据管理等方面。


只是我们的实施路径可能与同业有点不一样,我们了解到有些同行是在 2019 至 2020 年期间开始构建数据中台时搭建的基础数据平台,而长沙银行的数据中台其实是在已有的数据平台基础上扩展而来。


“16213+”中的“6”除了数据数字化中台,另外还有产品、运营、财务、风控和人力等中台。


确实从六大中台来看,除了数据中台,其它几个中台都带有一定业务属性,之所以被单独突出,我想背后是反映了银行系统发展的特点和对数据能力的重视。相较于其他五大中台,数据中台并不直接关联到特定的金融业务,但却是全行业务必要的基础数据服务和能力支撑。它支撑着银行各业务领域不断增长的数据需求,从渠道到运营、从营销到风控、从财务到人力,所有业务都是数字化需要深化的对象,都依赖于数据中台提供的存算能力、汇聚能力、服务能力等,所以我们把数据单拎出来作为核心能力在构建。


银行是数据比较密集的行业,我们以前常开玩笑说,躺在金山上,但是没有把价值挖掘出来,数据中台就是必要的“挖掘机”。


InfoQ:是否可以进一步介绍长沙银行数据数字化中台建设的历程和阶段性成果?在这个过程中,最大的难点是什么?


宋智强:数据数字化中台建设的历程,我感觉就是一段伴随业务快速发展的过程。长沙银行从 2018 年成为湖南首家上市银行,到 2023 年迈入资产万亿行列,五年时间数据中台建设也几乎是每年一个新台阶。2019 年,在长沙银行内部被称为数字驱动的元年,这一年我们围绕数据中台规划建设了开发、计算、洞察、开放四大基础能力。


2020 年,我们在持续构建技术能力的同时,为了能将“数据用起来”,全面提升了数据中台的服务能力和应用能力,并在此基础上搭建了智能营销、智能风控两大平台,以及数据分析实验室。


在 2021 至 2022 年期间,我们主要经历了技术与业务的融合过程,业务的流程、人员的操作逐步转移到数字化程度更高的系统平台上,并进而变成业务人员日常工作的一部分。例如,在智能化营销的初期,很少有人利用标签和系统进行客户圈选和策略配置;然而,随着系统技术支持的加强,业务数据驱动模式的转变,智能营销平台逐步变成营销活动开展不可或缺的支撑。再比如风控场景,也从原来以专家规则、手工部署为主转变为业务使用系统构建风控特征、自主建模、自助进行决策配置的形式。


2022 至 2023 年,长沙银行提出了数字经营开局战和数字经营进阶战,进一步将数字化经营的工作逻辑推广到了全行范围,这一转变也意味着我们不再局限于制作简单的数据报表、支持一次性的名单营销等,而是协助业务从客户洞察分析出发,到活动策略设计,再到活动的持续跟踪,并根据效果进一步迭代,通过拉通系统流程和数据链路,支持实现了数字经营的闭环。


转型过程中,我认为最大难点是认知和共识的建立。一方面,业务部门最初可能认为数据类工作是属于技术部门的职责,因此过程参与不足。另一方面,数字化手段带来的成果和价值难以得到认可,比如通过数据或模型选取的客户名单是否真的优于传统专家经验。此外,将传统的人工销售方式转变为数据驱动的数字经营,需要业务人员改变思维方式,这也是一个挑战,思维其实是很难转变的。因此,数据应用能力的推广,数字化认知的拉齐,也是几年数据中台建设推动过程最大的成果。

数据标准统一与提升数据质量的实践


InfoQ:在数据治理的过程中,数据标准如何统一?数据指标如何管理?这块有可以分享的经验吗?


宋智强:统一数据标准和管理数据指标确实是一项比较难、工作量比较大且“费时费力不讨好”的事情。像我们行里仅仅是从字段数量来看,就有约 300 万个,数据表也有 14 万个,要将所有表、字段都完成标准认定、标准对齐甚至是落标,难度可想而知,目前行里真正能对应到业务的数据标准相对还比较少。


当然,从我们角度来看,这个事情并不是说我们不愿意做或不应该做,反而随着业务部门数据赋能的深入,标准化的重要性会越来越凸显。统一的数据标准对于业务部门理解数据、与他人高效沟通是非常重要的。


我们目前采取的策略是优先处理高优先级的数据标准化工作,例如那些高频使用的经营考核类指标。从报表来看,访问量中有 85% 到 90% 集中在这类数据上,所以这部分数据的标准化是我们的首要任务。去年,我们开始对这些关键指标进行标准设定,包括定义它们的口径和识别流程。


此外,监管报送类数据对口径标准、数据质量也非常关键,因为任何错误的报送都可能导致监管问责。

总的来说,聚焦这些典型场景和全行性应用,我们会优先行动。


InfoQ:数据质量决定着数据应用的效果,在我们的业务场景中,哪些因素可能会影响数据质量?具体如何实现数据质量管控?


宋智强:数据从产生到实际应用是一个涉及环节众多和参与人员众多的过程,任何一环缺少把控都会产生或引入数据质量问题。


例如,在系统建设和业务场景构建阶段,业务系统往往不会重点考虑数据标准和质量问题,从而导致数据要素缺失、数据不一致等。而在数据的采集生产过程中,数据团队对业务的理解、研发的质量、人员的专业能力则是影响数据质量的重要因素,尤其是在模型设计时,如果不能很好地理解业务并充分调研,极易导致数据口径不稳定或加工错误的风险。


应用阶段的数据质量问题也很突出,通常跟数据消费方的需求有效性和使用情况有关。以标签资产为例,自从我们开始建设客户标签体系,至今产生了较多未被有效管理和使用的标签,这部分标签的数据质量随时间在逐渐下降。


面对这些挑战,实现有效的数据质量管控显得尤为困难。由于数据标准和数据口径不完善,我们很难界定什么是“正确”的数据,使得质量规则往往偏向技术性校验,如重复性校验和唯一性校验等,这虽能在一定程度上保证研发环节的数据质量,但对于数据缺失、业务准确性的质量保障则相对有限。因此,建立统一数据标准和实施管控流程是保障数据质量的前提。


其次,数据质量问题不仅是技术问题,也是管理问题。关键在于明确数据质量管理的主体责任和统一数据质量问题解决的机制流程,只有数据产生、加工流转、消费各方的权责明确,才能对数据质量工作的推动达成共识,形成合力。

数据驱动下的业务创新与价值量化


InfoQ:面向产品、服务、运营、风控等各个不同金融业务场景,数据数字化中台的建设以及数据管理流程的加持,给业务带来了哪些具体的效益和成果?请结合例子和相关数据进行说明。


宋智强:数字化的成效更多来自于对数据和技术的应用。像运营场景常涉及大量重复性和事务性的工作,我们主要有两方面的提效:

  • 提效一:数据支持决策。例如,集中作业中心涉及业务种类繁杂、业务量大,数据分散在各类不同系统,通过数据汇聚,并构建指标体系和看板,我们解决了部门信息获取难题,加速了管理决策。

  • 提效二:人员能效提升。例如,远程银行部坐席来电工单以前需要人工总结,每笔需要约 10 分钟,通过语音识别结合 AI 大模型,自动化生成总结摘要,将该过程缩短到了 1 分钟,显著提高了人员能效。2023 年全年估计节省了约 2 万工时,预计今年将在此基础上进一步提升。


营销场景方面,我们通过数据驱动发起的活动逐年递增,去年我们行通过智能营销平台,发起了数千次营销活动,触达客户超过 5000 万人次,这在传统营销模式下是不可想象的,数字化手段使营销活动的执行效率实现了倍增。


风控场景方面,业务人员通过数据实验室完成分析建模,通过智能风控平台自主配置风控规则,风控自主能力和效率大大提高。目前风控策略数量已达 9000 多个,策略的迭代可以在一个小时内完成,显著加快了风控模型的更新速度,并减少了线下验证和部署的工作量。


InfoQ:现在其实对于我们数据团队来说,随着业务侧的数据意识越来越强,这意味着数据需求(有时候并非有效需求)也越来越多,我们自己自身会有什么相应的变化吗?


宋智强:数据团队的专业能力和需求吞吐能力能否跟得上业务需求的快速增长是我们面临的挑战。从我的角度看,除了争取更多资源外,团队可以从几个方面进行自我调整和改进:

  • 主动服务:不是等着业务部门提出需求而是主动出击,深入了解他们的重点工作和计划,有节奏、有秩序地承接需求,从而减轻被动接受需求的压力。

  • 主动引导:对于业务部门提出的点状需求,我们尽量将其系统化,比如通过建立更完整的标签体系来支持常规重点客群分析,既满足对快速成果的追求,也不忽视长期和系统性的建设。

  • 技术沉淀:即使是紧密服务于业务,也必须保持技术沉淀的逻辑,比如数据分析和 AI 人员需建立和完善特征库、分析资产等,确保我们的工作不仅仅是应付当下,而是能够长期积累和利用。

  • 能力提升:在数字化驱动下,业务部门对增量的需求会持续增长,我们需要确保自身的能力能够支持持续的创新和模型迭代,特别是在 AI 等领域。


同时,我们也会找一些结合业务的重点项目进行合作,这些项目通常业务也会更愿意投入人力和资源。所以我们也是在引导过程中去抓住这些这种项目,然后更多地把基础工作做好一点,让我们的速度也能更快一点。


InfoQ:如今的经济形势下,企业越来越看重技术的投入产出比,聚焦数据管理的投入效果最大化以及期间的价值量化问题,长沙银行有哪些经验可以分享?采取了哪些措施?


宋智强:要量化数据带来的价值并非易事,数据主要为业务场景服务,如何辨别业务增长与数据价值的关联是一项挑战。通常,要证明数据效果会采用 AB 测试等对比方法,但在实践中,这种直接对比往往被认为要花费更长的时间或更多的投入而缺失。


而数据管理,作为一种对数据进行的管理活动,如果数据的价值都难以评估,那么对数据管理行为的评估就更加棘手。


虽然直接量化可能做不到,但我们可以从解决问题的角度来考虑。例如,在数据治理中,我们专注于解决业务中明确存在的、常见的数据问题及全行性的治理挑战。我们发现,通过集中解决这些问题,可以提升大家对数据治理工作的感知和认可。例如,每年数据治理工作都有其重点,如客户信息治理、财务数据治理等,通过这些专项攻坚治理,使得数据管理的成果更容易被知晓。此外,我们也可以从小范围试点开始,逐步扩大治理范围,将点状问题转化为类别问题进行治理,从而增强对数据管理成效的累积。


随着全行数据意识的提高,数据使用范围的扩大,通过数据管理来降低数据认知成本会变得更加容易接受。另外,随着国家对资产入表的推进,对数据价值和管理的量化讨论也会变得更加具体和必要。

数据资产入表:或激发数据团队积极性


InfoQ:数据资产入表、“数据要素×”行动计划等一系列政策文件相继发布和实施,这对于像长沙银行这样的机构而言,有哪些意义和价值?对于我们的数据管理策略制定又会带来哪些影响?


宋智强:数据资产入表首先带来的是财务报表的变化,如果能够将数据资产在资产负债表进行登记,银行每年大量的数据研发投入和价值数据挖掘,能直接扩大财务报表的资产规模。


其次,从产品创新角度考虑,虽然长沙银行目前尚未推出相关产品,但其他同业机构已经开始利用企业数据资产作为质押物,开展了信用评估和授信服务。这表明,数据资产的认可为金融产品创新提供了新的可能性。


从产业链的发展来看,国家政策的支持促进了数据相关产业的发展,包括数据生产商和服务商,这些企业均被视为科技型企业,为整个行业带来了新的发展机遇。


在银行经营方面,数据资产的入表会促使金融机构更加重视数据在营销和风险控制中的作用。例如,结合政府“数据要素×”行动计划,利用开放的公共数据为经营决策提供支持,甚至促进合规条件下的数据交易或交换,从而增强风险管理的效率和效果。


此外,数据资产在财务层面被认可,对数据团队也具有积极的激励作用。这种认可不仅提高了团队的积极性,也强化了对其工作价值的认知和投入的正向反馈。


InfoQ:综合考虑这一政策背景以及长沙银行自身的数据管理阶段,今年的工作重点是什么?


宋智强:从我们数据团队或开发的角度看,今年的工作重点和未来规划主要体现在几个方面:


首先,从成本和平台的角度,重点在于优化和评估我们的大数据平台。这不仅涉及对平台资源消耗的审视,还包括评估其投入产出比,即投入对支持系统和应用的贡献。同时,考虑到我们银行有近 300 人参与数据生产,我们将专注于提升这一过程的工作效率和响应速度,以节约研发成本并更快地满足业务需求。


其次,在数据治理方面,随着业务人员对数据依赖日增,我们将推动数据标准的制定和高频数据的推广使用,降低使用者认知成本。这包括对客户提示信息、数据仓库内容以及为业务加工的宽表的开放使用。对于使用价值高的数据,将进行重点治理,包括标签和关键指标的管理,并提供血缘追踪工具支持。


第三,从数据应用和智能化的角度,我们将深化与业务部门的合作,利用数据驱动特性,不断将试验性的探索转为常态化的经营策略,提高经营效率。同时,我们将持续推广 AI 能力的应用场景,让业务经营管理变得更智能、更便捷。


此外,我们还计划对分支行人员进行数据技能和数据工作环境的培训,激发他们的创造力,更好地融入数字经营工作。

2024-04-19 18:485643

评论

发布
暂无评论
发现更多内容

Flink高可用性设置-4

小知识点

scala 大数据 flink 流计算

Elasticsearch安装

北漂码农有话说

Golang领域模型-开篇

奔奔奔跑

微服务 后端 领域驱动设计 架构设计 Go 语言

同态加密

soolaugust

学习 加密 同态加密

微服务注册发现配置中心-consul

雪雷

Consul 服务注册与发现 配置中心

Guacamole实战

雪雷

guacamole 远程登录 堡垒机

业务容器化改造

雪雷

Docker 容器 微服务 服务化改造

API统一管理平台-YApi

雪雷

YAPI API接口管理

记一次混合监控的反思

雪雷

监控 zabbix redis监控 监控宝

性能优化-技术专题-并发编程

洛神灬殇

Java 多线程

JVM-技术专题-GCViewer调优GC

洛神灬殇

JVM

一文带你检查Kubernetes应用是否为最佳实践

雪雷

k8s k8s最佳实践

SonarQube集成gitlab/jenkins

雪雷

jenkins sonar gitlab ci 代码扫描

Linux系统检查脚本

雪雷

Shell 系统检测

Apache常用配置指北

亻尔可真木奉

Apache 代理 跨域

Gitlab Pipeline+Supervisor 实战Python项目CI/CD

雪雷

gitlab jenkins CI/CD Supervisor

Jenkins 详解

雪雷

jenkins

Linux自定义快捷工具

雪雷

Linux Shell tools scripts

RabbitMQ实践

雪雷

RabbitMQ 消息队列

MySQL线程状态详解

Simon

MySQL 线程状态

探测mysqldump详细过程

Simon

MySQL

Ceph集群部署

雪雷

分布式存储 Ceph rdb pvc

微服务API网关-Kong详解

雪雷

kong api 网关

Python利用sphinx构建个人博客

雪雷

sphinx Blog

Jenkins部署Python项目实战

雪雷

Python jenkins CI/CD

JVM-技术专题-管程技术分析

洛神灬殇

JVM 管程

Docker+Jenkins+Gitlab+Django应用部署实践

雪雷

DevOps jenkins CI/CD

lower_case_table_names参数详解

Simon

MySQL

Docker Web管理工具

雪雷

Docker shipyard dockerui

记一次混合云API发布的反思

雪雷

iptables API api发布

Serverless初探

雪雷

Serverless Lambda 无服务器云函数

长沙银行:躺在数据“金山”上,如何把价值挖掘出来?_银行_罗燕珊_InfoQ精选文章