11 月 19 - 20 日 Apache Pulsar 社区年度盛会来啦,立即报名! 了解详情
写点什么

如何让数据安全地发挥其真正价值?

  • 2020-09-25
  • 本文字数:1871 字

    阅读完需:约 6 分钟

如何让数据安全地发挥其真正价值?

你是否经历过这样的场景:和朋友在聊天软件上说着夏天到了,该减肥了。再去打开购物软件的时候,发现首页上多了许多瑜伽垫、弹力带等运动用品的推荐;或许你对这样的“现代科技”惊叹过,抑或许你对这样的“实时监控”惊慌过,但由于这样的事情已经屡见不鲜了,所以你从未因此申诉过自己的数据被“窃取”了。


各类囊括了我们衣食住行需求的 App 让我们的生活更加便捷,电子商务、新零售、物流业也被注入了蓬勃发展的动力。


与此同时 App 的数据安全问题也日益暴露出来,前有第三方 iOS 程序私自监控剪贴板,后有 315 晚会上央视点名某些手机 App 盗窃隐私。


各大类 App 都或多或少存在一些数据安全问题,只是这些问题掩盖在了 App 带给我们的便利之下。



各大类 App 信息安全平均问题数统计 数据来源:信通院《移动应用(App)数据安全与个人信息保护白皮书》


其实我国对公民的隐私安全问题也逐步重视起来,去年已经印发了《App 违法违规收集使用个人信息行为认定方法》,即使 App 经过我们的同意获取到了我们的相关隐私数据,但也无权转让给其他 App。


但是在安全合规的情况下,如何保证我们的生活依旧便捷呢?联邦学习不失为一个解决办法。


联邦学习是什么?

联邦学习就是通过联合多方,在不泄露或汇聚各方原始数据的前提下进行联合建模的一种机器学习框架。



联邦学习框架

当两个不同地区银行的信贷风险部门因为数据量不足以及数据行为不具有普遍性而无法建立合适的信贷风险模型来进行风险防控时,可能两个银行用户不同但其业务特征重叠较多,我们就可以使用**横向联邦学习**赋能两家银行的信贷业务。


当某地区的银行因为弱识别用户的银行 APP 活跃度不够或数据行为覆盖较少而对给其放贷犹豫不决时,则可以引入同一用户群体在电商平台的消费数据和其他金融机构的相关数据,再运用纵向联邦学习进行建模,从而能够有效降低不良贷款率。


而对于用户重叠较少且业务特征也重叠较少的两企业,若想利用双方数据赋能各自业务线,则可以使用横纵结合的联邦学习



三类联邦学习

联邦学习中进行交换的数据是经过加密的模型或梯度,其他人是无法通过这些信息反推出参与方的原始数据的,因而联邦学习在解决数据孤岛问题时具有良好的隐私保护机制。


同时,联邦学习中建立的激励和利益分配机制,让各企业都有动力参与其中,并且都能根据其对联邦任务的贡献程度而获得应有的利益。


联邦学习在 Sophon 上的演绎

为了帮助客户实现隐私保护与数据应用上的平衡以及解决在某些领域存在的数据孤岛问题,Sophon 也提出了自己的联邦学习框架 Sophon FL。



Sophon FL 框架

在底层的数据和设备层中,该框架会支持 CPU、GPU 集群,以及多种类型的输入数据源;


底层上一层是加密层和计算后端层,在此我们会支持同态加密和差分隐私等加密方式,以及 Spark、Tensorflow、Pytorch 等多种计算框架。这样的设计让使用不同后端计算引擎的客户都能参与到 Sophon FL 上的联邦任务中;


再上一层即是联邦学习计算层,其支持基本的安全计算以及在此之上的不同种类的模型训练和联邦学习任务,让不同场景的数据安全应用要求都尽可能得到满足;


在最上层的应用层中,我们会支持诸如反洗钱、反欺诈、风控和精准营销等场景,联邦风控、联邦营销、联邦安防等不会是纸上谈兵了。


Sophon FL 为用户提供多样化选择

多元化的计算框架能够支持如 Sophon,Spark 等多种计算框架;多元化的硬件设备让你本地的 CPU、GPU 等多种硬件设备都能得到支持;多元化的算法种类使得多种联邦计算算法和联邦优化算法都能助力你的智慧化转型大业;多元化的隐私保护让你不论是在《数据安全管理办法》的考验下,还是在 GDPR 的管控下,都不会有数据使用侵权的嫌疑。


Sophon FL 看板展示


“两易两高”便于操作:交互式的操作界面以及清晰化的功能设计让 Sophon FL 易于上手;看板管理让每条联邦学习任务的状态和进程易追踪;良好的通信效率让加密的模型或梯度都能得到高效传输;无论是多种联邦学习算法保障的建模效果,还是全流程建模和模型上线的支持,都能让用户体验高效建模。


实践示例

假设有两个信贷管理部门,分别来自上海的银行 A 和北京的银行 B,他们都面临同样的两个问题,本行信贷档案数据量不足以及相关信贷数据不具有普遍性。如果把 A、B 的数据进行汇聚再建模确实能解决以上两个问题,但同时也将银行的用户隐私进行了泄露,可能面临与“池子状告中信银行”相似的场面。而利用 Sophon FL 则能既进行隐私保护又能让两家银行合法合规地通过联邦计算模型去判断客户的贷款资质和信用情况,实现联邦信贷风控。


数字经济时代,数据既是创造财富的关键,也是智慧化转型的必需,与此同时数据安全及隐私保护也不可忽视。


2020-09-25 10:531207

评论

发布
暂无评论
发现更多内容
如何让数据安全地发挥其真正价值?_大数据_智子AI_InfoQ精选文章