写点什么

信也科技副总裁陈磊:数据应用与数据合规如何兼顾?

  • 2023-09-13
    北京
  • 本文字数:5448 字

    阅读完需:约 18 分钟

信也科技副总裁陈磊:数据应用与数据合规如何兼顾?

随着科技的快速进步,金融行业正在经历一场前所未有的变革。无论是客户管理、服务体验还是信贷风控,智能化的脚步已经深度渗透到每一个环节。那么,金融行业的智能应用水平如何?实时平台化的数据建设应该如何做?数据应用与数据合规如何兼顾?


在 9 月 7 日的 InfoQ 超级连麦·数智大脑直播中,极客邦科技创始人 &CEO 霍太稳与信也科技副总裁陈磊展开了主题为《如何处理好金融数智化过程中的数据「养料」》的讨论。


陈磊表示,为了满足金融机构在数据安全和合规性方面的需求,在满足合规要求的基础上,可以尝试以下三个方向:首先,通过多方安全计算(MPC)等隐私计算技术来确保敏感数据在安全的前提下被充分使用。其次,对数据进行分类和分级,针对不同敏感度的数据应采取不同的处理方式。最后,培养企业内部的数据安全文化是非常关键的。


以下是对话全文(经 InfoQ 进行不改变原意的编辑整理):

InfoQ:目前整个金融行业的智能应用水平呈现哪些特点?


陈磊:首先,金融行业和电信业及航空业是数字化最早的领域,和其他行业相比,具有一定的先发优势。这也使得金融行业在接纳新技术方面具有相对开放的态度。例如,在信息化早期阶段,金融行业便已经开始采用小型机和大型机等先进技术。近年来,整个金融行业在智能应用方面表现出“全面开花,全链条覆盖”的特点。无论是客户管理、服务体验、信贷风控,还是企业生态化服务,都有大量典型应用。举几个例子:


在存贷汇业务方面,智能化改造极大地提升了业务效率。例如,以前申请信用卡需要一个月的审批时间,而现在审批过程快速得多。


从消费者或银行客户的角度看,服务体系也经历了大幅改造。线上服务的比例大幅提升,和移动互联网的普及有着密切关系。例如,现在有大量的 7*24 小时智能客服在线提供服务。


智能化已经深度渗透到各个生活场景中,比如,线下面部识别支付方式提升了金融服务在零售场景中的覆盖率。


总体而言,金融行业在智能应用方面虽然还在发展中,但已经达到了相当高的水平。

InfoQ:您认为一个金融机构要进行数据管理和应用,主要有哪些难题?


陈磊:我认为金融机构在数据管理和应用上面临的挑战主要有以下几个方面:


  • 数据来源的多样性:金融机构的数据来源非常丰富,与信息化的发展阶段和众多服务提供商有着紧密的关系,导致数据存在多种格式和标准。因此,如何实现统一的数据规范和标准成为一个关键问题。

  • 数据安全与合规:金融行业对数据安全的要求极高,因为其中涉及大量客户的敏感信息。任何数据泄露都可能给客户带来损失,并对金融机构的声誉和持续经营带来威胁。因此,如何在确保数据安全的同时进行有效的应用,是金融机构需要深入考虑的问题。

  • 数据质量问题:与其他行业一样,金融行业也面临数据质量的挑战。尤其是那些历史遗留问题,从线下到线上转型的过程中可能导致的数据增长问题。这些问题与纯互联网起步的企业相比,会带有更多历史负载。

  • 满足多元化需求:随着用户或消费者对金融服务需求的多元化,如何满足这些多样化的需求也是金融机构面临的一个重要挑战。

  • 人才问题:对于一些中小银行,他们面临着人才梯队的问题。这些机构普遍缺乏专业的数据管理和应用人才,如何有效地利用数据,对他们来说是一个更大的挑战。

InfoQ:企业可以从哪些方面去解决这些挑战?尤其是人才梯度的建设方面。


陈磊:关于数据工作和数字化转型,以及智能化转型的推动方式。实际上,这些转型不是简单地通过自下而上的方式就能完成的。最有效的推动方式是自上而下与自下而上相结合,以形成合力。关键在于,数据建设的成果必须在业务中得以体现。没有顶层的支持和规划,长期的数据建设是很难落地的。因此,顶层设计是第一要务。这通常需要董事长或行长的决策,并需要持续三到五年的努力才能见到成果。


关于数据人才的吸引问题。首先,公司或行业需要建立一种支持数据文化的氛围。在这样的环境下,不仅需要数据工程师,还需要数据分析师和算法工程师共同努力。单一角色的招聘是难以实现数字化深度应用的。


另外,持续的数字化转型还需要注重流程和规范的建设,以确保成功能够被复制。与此同时,工具和平台的建设也是关键,它能降低数据工程和数据应用的门槛,从而提高效率。


很多年前,当我们开始使用大数据技术时,上手难度和学习成本都相对较高。但在最近几年,由于平台化建设取得了显著进步,这些成本逐渐降低。


最后,我想强调的是,整个数据工作,无论是从理念还是从落地的角度来看,都是一个长期的过程。这不仅需要耐心和适当的节奏,还需要阶段性的成果来推动进程。这其中,推动者和执行者的配合和规划是至关重要的。

InfoQ:请您分享一下信也科技在数据管理、数据应用方面的成功经验?


陈磊:从一开始,我们的核心理念就是要将数据和算法应用于商业决策,因为只有到达决策这一层,数据的价值才能得以体现。


在金融场景中,主要有几个关注点:首先是获客,传统金融机构主要通过线下网点进行客户获取。但随着移动互联网的兴起,如何通过线上方式吸引客户成为他们新的关注焦点;其次是风控定价,这是金融的核心模块,尤其在信贷场景中,如何决定一个用户或企业的授信额度和利率是至关重要的;最后是客户服务,在用户使用金融服务后,如何长期高效地维护与客户的关系。


在数据应用体系方面,我们形成了不同的层次,包括数据层和算法层。这些层次涵盖了数据计算和存储资源、离线和实时数据仓库、业务特征存储,以及上层的算法引擎。最终,这些都会体现在数据开发平台和业务智能(BI)平台上,在这样的框架下,数据更容易被加工和应用,同时业务和技术团队也能更顺畅地利用这些数据进行交流。


在早期,由于系统尚不完善,业务的数据需求常常需要较长时间才能得到满足。这种延迟会导致商机的丧失,给业务带来巨大机会损失。


另外我们注意到在获客方面,信息流个社交媒体逐渐成为搜索引擎和电商以外重要的新渠道。为此,我们开发了一套流量管理平台,能有效整合媒体和业务转化数据,这样做不仅提高了数据的时效性和全面性,还进一步使广告投放的效果评估更加及时和准确。


当然,我们在这个过程中也遇到了不少挑战。比如,与多家广告媒体对接时,由于它们的数据格式和 API 接口差异较大,我们需要花费额外时间和精力进行标准化和归一化,这也是考验数据架构能力的。


最后,在风控模块方面,我们的风控系统在多年的迭代后,已经能够处理大规模特征生成,精细化客群划分以及先进算法的自适应应用。这使得每一笔信贷申请都能得到精准的审批,起到了“风险守门员”的角色。其中的一个难点是如何利用非结构化数据,例如声纹数据、图像数据和关联关系数据。以上就是我们在数据管理和应用方面的一些经验。如果您对更多细节感兴趣,欢迎来 Fcon 现场与我们进行交流。

InfoQ:最近财政部发布文件将数据作为资产被纳入会计报表,助力推动数据要素资产化。您认为这一举措对于金融行业意味着什么,会从哪些方面影响金融业数字化进程?


陈磊:当财政部的新文件发布后,我们第一时间进行了学习和研读。该文件特别强调,数据资产在企业财务报表中的体现将成为一项不可或缺的义务。


首先,这无疑是一个重要的里程碑。它符合国家的十四五规划,即让数据成为生产要素,并在实际业务中流通。这从顶层设计上肯定了数据的价值,并推动了数据价值的量化。


其次,这将明显提高金融机构的数据管理水平。无论数据是外部采购的,还是由自家业务生成,或是用于内部业务或外部服务,都需要在财务报表中反映其价值。这将促使金融机构更加重视数据资源,并推动数据的收集、整理和应用。


第三,这将推动数据价值的深度应用。金融机构不仅需要理解数据的价值,还需要深入挖掘和应用数据,以提高金融服务的效率和质量。


第四,这也将促进金融科技和其他企业的发展。以往企业资产的评估并不包括数据,而现在,数据将成为企业附加值的一部分,有助于企业获得更好的金融服务,进而推动企业的创新和快速发展。


最后,虽然数据资产在财务报表中的体现是一个重要步骤,但仍有很多工作需要做,比如数据确权、定价和合理分类等。这是一个非常重要的开始,我们希望与合作伙伴和业内朋友共同探讨如何在各自的业务中实施这一新政。

InfoQ:如何平衡数据的安全、可信和合规性,同时又不过多限制数据的使用?


陈磊:首先,为了满足金融机构对数据安全和合规性的要求,我们遵循各项监管准则。例如,若规定数据不能外流,我们会通过技术手段确保数据在可信环境中进行运算,同时保证数据不离开这一环境。这涉及到近年来比较流行的隐私计算和多方安全计算技术。这些技术目前还在金融“沙盒”测试阶段,大规模推广还需法规支持。


从业务角度看,短期内可能需要承受一定的数据价值折损,但长远来看,我们期望在技术上能有突破,以在保证数据安全的同时,更合理地使用数据。


第二点,我们需要对数据进行分类和分级。并非所有数据都是敏感信息,也不都需要通过隐私计算进行处理。目前,隐私计算效率相对较低,因此,针对不同敏感度的信息,应采取不同处理方式。对于敏感信息,可以使用隐私计算;对于非敏感信息,可以进行脱敏后合理地进行加工和计算。


第三点,无论是金融科技公司还是金融机构,都需要培养数据安全文化。一旦大家明确了安全底线,日常操作将更加安全。


总体而言,实现数据使用效率和数据安全之间的平衡需要大量的监管工作、行业研究和长期实践,以找到一个相对平衡的点。

InfoQ:在金融数字化、智能化的过程里,实时平台化的数据建设会发挥什么样的作用?


陈磊:在移动互联网发展和新应用出现的背景下,金融场景对实时服务的需求越来越大,对应地,对数据的实时处理需求也在增加。在这种环境下,数据平台化变得尤为重要,具体可以从以下几个方面来看:


第一点,平台化的最终目标是提高数据的质量和时效性。通过数据平台,金融机构可以实现实时的数据采集、处理和分析,从而提高数据质量和实时性。


第二点,拥有高质量的数据后,不仅能更好地支持决策,还能通过数据分析来发掘新的商业机会。一个成熟的金融数据平台能为金融机构提供更丰富、更全面的数据资源,为数据分析和挖掘提供丰富的“养料”,进而帮助业务发掘新的机会点。


第三点,平台化的优势是加强数据安全和可靠性的管理。具体来说,通过数据平台可以实现权限的统一分配、合理管控以及任务的实时监控。这不仅增强了数据的安全性,还提高了运维效率。因为实时数据服务对任务的健壮性要求很高,平台化能让我们及时发现并解决问题。


总体而言,数据平台化能为金融机构提供更高效、更可靠,以及更安全和健壮的数据服务。这最终将体现在业务增长和效率提升上。

InfoQ:FCon 金融实时数据平台建设之路专题的亮点有哪些?


陈磊:本次 FCon 会议我们主要关注实时数据应用,涵盖从底层框架到上层应用的广泛领域。讨论将集中在以下几个主题:


从业务角度考虑,我们会探讨实时数据服务的应用场景和价值,以及哪些场景中离线或准实时数据就足够用,无需实时服务;


关于实时数据的开发平台,我们将讨论如何保证服务的阶段性和稳定性,以及如何提高开发效率。同时,会深入到实时数仓的设计和实现,以及与离线数仓的运维难度对比;


我们还会关注实时数据服务的资源管控和任务优化,特别是在 ROI 不高的场景中,如何更有效地使用计算和存储资源;


最后,我们将集中讨论实时数据平台的设计理念、技术难题,以及组件选择等。我们也邀请了金融和金融科技行业的专家,以进行更广泛和有代表性的讨论。

InfoQ:目前大模型在整个金融行业的应用需要注意哪些问题?


陈磊:从年初开始,我们已经在大模型应用方面进行了一些尝试。这些初步应用主要集中在内部服务和应用。从金融行业的角度来看,大模型落地仍面临多重挑战。


首先,大模型的可控性相对较差,而金融行业对结论可靠性有很高的要求。同时,模型的逻辑或结果也需要高度可解释性;


其次,大模型在时效性方面也面临挑战,特别是在需要实时响应的场景。不过,随着底层架构和硬件能力的提升,这些问题有望得到解决;


第三,考虑到金融行业对数据安全和隐私保护有严格要求,如何在输入数据时确保用户隐私和信息安全也是一大挑战。因此,我们也在进行相关的保护措施;另一个关键问题是如何将金融行业的专业知识和数据融入大模型中。这依然是一个探索和应用阶段的问题,目标是形成一个更精准和针对性的行业模型;


从实践和行业交流来看,我们认为大模型有很大的潜力与现有的数据智能技术结合,带来颠覆性的改变。在系统和工程层面,大模型将改进设计、开发、测试以及运维流程。在算法应用层面,它将提升传统机器学习和深度学习方法,比如在文本分析和智能客服应用方面;


最终,大模型和数据技术的结合可能实现从数据到决策的自动化流程。例如,通过对话交互界面进行大量的数据分析和洞察,甚至直接生成详细报表和决策;


总体而言,尽管短期内仍存在挑战,但随着技术和应用场景的持续迭代,我们对大模型在应用场景落地方面持有很大的信心。

关于 FCon


首届FCon全球金融科技大会将于 11 月 19-20 日在上海举办。大会将围绕金融领域数字化转型挑战探索、DevOps 在金融企业落地实践、金融行业大模型应用、创新的金融科技应用、金融实时数据平台建设之路、金融安全风险管控、数据要素流通与数据合规等 10+专题进行交流。


目前大会邀请了汇丰科技中国区的代理总经理马国栋、度小满金融数据智能部总经理杨青先、蚂蚁集团副总裁 & 首席技术安全官韦韬博士、恒生聚源总经理吴震操担任大会联席主席。更多嘉宾仍在邀请中......


我们诚挚地邀请您加入我们,共同探索金融科技的未来,点击链接即可查看全部演讲专题。


目前 5 折 优惠购票,仅限前 100 人,咨询购票可联系:17310043226(微信同手机号)。

2023-09-13 14:023184

评论

发布
暂无评论
发现更多内容

后疫情时代给技术经济发展带来的挑战和机遇

CECBC

区块链技术 林左鸣 机遇与挑战

Python与文件流

Vincent

Python 编程 文件管理

第二周作业

远方

第二周作业

andy

江帅帅:精通 Spring Boot 系列 02

奈学教育

Spring Boot

架构师训练营第二周作业

James-Pang

极客大学架构师训练营

数据库周刊28│开发者最喜爱的数据库是什么?呼兰脱口秀聊程序员转型;MySQL update误操作;PG流复制踩坑;MySQL架构选型;Oracle文件损坏处理……

墨天轮

数据库 oracle 阿里云

Week2命题作业

星河寒水

JVM的未来——GraalVM集成入门

孤岛旭日

Java 云原生 JVM GraalVM

江帅帅:精通 Spring Boot 系列 02

古月木易

Sprint Boot

iOS Universal link 30分钟入门指南

行者

架构师训练营第二周 - 学习总结

Eric

架构是训练营

分布式锁:效率与正确性的衡权

伴鱼技术团队

后端 分布式协同 分布式锁 服务器 分布式架构

环信助力中国游戏社交类APP出“东南亚”记!

DT极客

程序一定要从main函数开始运行吗?

泰伦卢

c++

Easy-Monitor 3.0 开源 - 基于 Egg 的 Node.js 性能监控解决方案

hyj1991

node.js 开源 大前端

ARTS 第 2 周

乌拉里

Week 02 命题作业

卧石漾溪

极客大学架构师训练营

数据分析师这个岗位,可能近几年会消亡

峰池

数据分析 数据 互联网人

02周作业——面向对象设计原则

dao

面向对象设计 极客大学架构师训练营 作业

Java参数传递分析

游侠最光阴

Java

Java 诊断利器 Arthas 优雅排查生产环境

ytao

程序员人人都会遇到的“画饼”,一招教你破解

金刚小书童

程序员 职业规划 技术管理 画饼

Python类型标注

Vincent

编程语言 python3.7

ChaosBlade:从零开始的混沌工程(三)

郭旭东

混沌工程

江帅帅:精通 Spring Boot 系列 01

奈学教育

Spring Boot

第二周作业二:描述熟悉的框架,是如何实现依赖倒置原则

远方

关于问问题和时间管理的感悟

苹果看辽宁体育

程序员 程序人生

解析 Swift 中的 @discardableResult

SwiftMic

swift

江帅帅:精通 Spring Boot 系列 01

古月木易

Spring Boot

第三周作业三:优化 Cache 类的设计

远方

信也科技副总裁陈磊:数据应用与数据合规如何兼顾?_银行_李忠良_InfoQ精选文章