写点什么

360 大数据中心总监:如何制定可奏效的数据安全体系

  • 2019-06-12
  • 本文字数:4106 字

    阅读完需:约 13 分钟

360大数据中心总监:如何制定可奏效的数据安全体系

本文由 dbaplus 社群授权转载。

管理者的认知决定企业数据安全建设能否真正发挥价值

Q1:近年来发生的数据安全事件可以说到了屡见不鲜的程度,在您看来目前乃至今后较长一段时间,企业面临着哪些关键的数据安全隐患和挑战?


A1:首先我认为对企业而言「数据安全」其实并不是一个全新的话题。


为什么这么说呢?企业存在于社会之中,从诞生之日起,为了保证自身的持续正常运转,对内会有一系列的人员合作,对外会和其他的企业以及个人发生事务往来。那么在这个过程中不可避免的会有信息交换,有信息交换自然就会有数据安全风险。


那为什么我们还要提及这个话题呢?因为信息交换的动作对企业而言持续存在。


随着现代社会科学技术的不断演进,信息技术的快速发展和应用,使得全行业信息化的程度全面提升,整个社会的数据正在以前所未有的速度快速增长,呈现出数量大、来源广、种类多的特点,这些数据渗透到了各行各业,并逐渐成为企业的重要生产要素之一。



这个时代数据已经无处不在、如影随形,我们今天讨论的议题也是以大数据为背景展开,来探讨数据安全相关的问题,并不是传统的数据安全。从这个角度来说这也算是一个新的话题。


数据安全这个话题虽然在概念上看比较的单一,但实际上覆盖面广、内容全,同时还涉及到很多重要的因素。


那么对企业而言,会面临哪些安全隐患和挑战其实是一个比较大的话题,从我自身的角度来看,可以分为三个方面:


  • 首先是法规流程方面。随着云计算、大数据技术的逐步应用,数据自身的形态、数据使用的方式都在不断增加和变化,且这种发展趋势会变得越来越快。那么企业在这种大趋势下如何保证在法规流程上的系统性、时代感是需要优先考虑的要素。

  • 其次在系统建设方面。数据安全本身不会产生价值,所以很多时候在系统建设初期为了快速构建,往往把安全相关的能力优先级放低,甚至在很长一段时间缺失。数据在系统中裸奔,一旦出现数据泄漏将会引起不可预知的损失。

  • 另一方面由于在系统建设初期对安全能力的忽视,导致后期增加安全能力会变得更加困难,甚至需要调整系统架构,无形之中增加了企业的投入成本。

  • 最后是管理者认知方面。随着今年来大大小小的数据安全事件频繁发生,给企业和个人带来了严重后果,企业管理层在对保障数据安全上基本高度一致。

  • 但只做到意识形态上的认知是不够的,甚至对企业的安全建设起到反作用。管理者如果只关注数据本身的安全,就会导致安全体系的建设片面,最终无法达到对数据进行安全管控的效果。殊不知要保障数据安全不只是在数据层面。

  • 相反如果管理者对数据安全的建设走大而全的路线,可能这个目标永远都是水中月、镜中花,看似美好却无法达成。我认为最后一点也是最重要的一点,它决定了企业能否真正将数据安全的建设落到实处并发挥其价值。

如何制定真正可奏效的数据安全治理方案

Q2:面对这些数据安全风险,您在制定及落实真正得以奏效的安全治理方案上有什么建议?


A2:正如我之前所说,企业的数据安全体系建设是一个非常大的话题,我还是结合我所从事的工作,谈谈在大数据中心建设过程中所面临的一些具体的问题和挑战以及解决思路和方案。


随着公司的发展、产品形态上的调整,产品覆盖面越来越广,在数据层面呈现出数据海量、存储分散、用途多样的特点。



大数据中心作为公司数据中场部门,除了自身数据平台和服务能力的建设,还要面对来自各个业务部门的数据分析需求,在处理这些需求的过程中遇到了各种数据安全相关的问题。


数据集中存放,如何做到数据平台管理和数据访问的权限分离?每个业务部门有多个角色,每个角色对应的数据权限都可能不一样,如何有效控制?数据一旦发生泄漏风险,如果做到溯源?跨产品的数据如何安全的共享?



类似这样的问题还有很多,这些问题对大数据中心的发展提出了一系列的挑战,可以归纳为四个方面:


  • 平台层面的保障:传统的权限控制通常是以系统功能为中心来进行设计,通过控制用户对功能的访问来达到权限控制的目的。这种控制方式在大数据中心已经捉襟见肘,比如对于同一个数据分析功能,不同产品的分析人员只能操作本产品的数据;

  • 数据层面的保障:大数据中心面向公司所有的产品负责提供数据处理的能力,那么业务数据每天都在平台上流转,如何合理控制数据平台工程师对业务数据的访问;

  • 风险预防和审计:产品的业务形态决定了其系统设计,在其不断演进过程中,数据模型也在不断演进,必然会持续产生一些脏数据,要保证数据的质量,在数据治理环节会加入更多的人工参与,也增加数据泄漏的风险;

  • 流程和制度:哪些数据可以公开、公开的范围是多广?数据可以给哪些人使用?某个业务部门想使用另外一个业务部门的数据,应该走什么样的流程?处理这些事情在很长一段时间都是见招拆招,看起来很灵活其实毫无规则可言。


随着大数据中心业务的不断发展,这些问题带来的影响已经愈发明显,那么该如何有效解决,让大数据中心摆脱困扰,更加高效的去支撑整个公司的产品呢?


其实问题“千千万”,都是数据“惹得祸”。我们要使用数据、分析数据,发挥数据的价值,所以不可避免的要接触数据,数据安全问题也因此产生了。



以终为始,我们在构建数据安全体系的指导原则就是,明确“让数据更加安全的被使用”的目标,打造以“数据”为中心,结合“平台能力”、“隐私管理”、“法规流程”三个要素,构建具有公司特色的数据安全体系,系统化解决数据安全问题,发挥数据的更大价值。


这里需要说明的是数据安全风险会一直存在,安全体系建设是尽可能地降低发生风险的几率,让数据分析人员能使用更多的数据、让数据开发人员尽可能聚焦在数据应用本身。

360 大数据平台安全能力建设

Q3:能否以 360 自身经验为例,具体剖析其大数据平台在安全能力方面的设计思路、架构搭建,以及应用实践?


A3:变动就一定会带来阵痛,在进行大数据平台安全能力建设之初,我们也遇到了不少困难。


首先,在规范治理方面。数据安全能力建设包含了安全规范的治理,这种规范的治理势必会固化数据安全相关流程。


流程上的变动对产品部门会有感知,而安全能力建设的价值又很难呈现给产品,如何平衡这中间的矛盾?


既然大数据中心是整个公司中场部门,负责支撑全公司的数据业务,安全规范的治理采取了自上而下的策略,联合公司法务和隐私相关部门共同制定,最终完成 360 集团数据安全管理规范,让数据的使用合理、合规、合法,这也让我们的治理工作多了一份理解、少了一些阻力。



其次,在系统治理方面。大数据中心的系统建设已经到了一定阶段,按照全新的系统去设计显然不适合,数据安全能力如何和当前系统平滑融合对我们也是一个考验。


这里要说明下很多公司在开发系统之初,往往会优先开发系统中的业务功能,把安全能力的优先级降低或者是做一些简单的安全加固能力,等到想系统化建设安全能力的时候发现已经没有那么简单,系统留出的可改造空间非常受限。


回顾系统治理的过程,我们主要做了两个维度的重构:


  • 一是以数据资产为中心对系统进行了服务化改造;

  • 二是围绕数据的全生命周期建设数据系统安全。


服务化能力让系统高内聚、低耦合,系统功能易于扩展,在增加安全能力的同时也减少了对原有系统的侵入;数据应用的全生命周期让安全治理有一个明确的范围标准,这在最大程度保证了安全能力的全覆盖。


基于这样的设计思想,整个大数据平台的安全能力在原有架构上进行了从“点”到“面”的一个改造。



在数据共享方面,我们知道通常系统允许用户以文件或者图片的形式保存数据,并在保存文件中添加水印信息,用于在信息被非法传播之后的溯源,如果用户对单条数据进行复制传播的话,系统往往不能有效进行控制,


比如在数据查询结果页中通过复制粘贴将信息转发。类似场景还有很多,针对这些数据共享场景,我们引入了纯文本数字水印技术,保证在最小粒度层面的数据溯源能力。



最后以权限系统为例谈谈单系统的治理。如上所说,老的权限系统主要是完成系统鉴权和功能控制,无法支撑大数据中心现有的业务场景,比如对数据层面进行不同维度的访问控制。


那么如何在现有权限模型的基础上进行扩展,以适配当前的业务场景呢?我们对权限做了扩展,将其定义为“资源+操作”一种组合,对于菜单、页面、按钮、表、字段、任务、拓扑等进行了泛化,统一定义为资源,既保证了数据鉴权流程的稳定,又灵活应对了由于数据类型繁多带来的不确定性。



结合数据中心的职能定位和业务场景,将应用、菜单、服务、数据四个维度纳入权限系统管理,给权限系统赋予了新的定位-一站式权限管控中心。


上云一时爽,冲动上云一身霜

Q4:除了企业内部的大数据平台建设以外,在数据上云的大势所趋之下,如何确保云上的数据安全?


A4:十多年前,亚马逊推出云计算服务的时候,云服务还鲜有人问津。十年之后的现在,随着云计算的高速发展,越来越多的企业开始了云化转型。


即使这样,我觉得企业在决定是否云化之前先要回答几个问题:为什么要上云?通过上云要取得的短期目标是什么?中长期目标又是什么?


通过回答这些问题来思考云化对自身来说是否真的需要。实际应用中,云化对一些企业所带来的价值远小于其投入,甚至都无法持续支撑后期的运维,那么这个时候可能就需要规划另外的资源优化模式。


对于已经准备上云的企业来说,首先要确定采用什么样的云化方案。是选择公有云、私有云还是混合云,不同的方案其数据安全策略也是不一样的。


其次不要单纯依赖云服务商提供的数据管理能力。云平台有助于实现数据的集中管理,提升企业的数据共享能力,同时也增加数据泄漏和丢失的风险。数据一定要有备份方案将安全隐患降到最低,比如多云或者异地存储等。


最后要建立全面完善的云服务协议。上云只是企业云化的开始,未来企业系统将会持续运行在云上,在这个过程中云平台自身难免不会不出现问题。如何保证云平台的服务响应速度和解决问题的效率,这不单单依靠云服务商本身的服务标准,而是需要企业结合自身的要求和云服务商共同完成服务协议的制定,让企业尤其是中小企业在产生问题之后可以有更多的话语权,将企业的损失尽可能降到最低。

作者介绍

徐皓


现任奇虎 360 大数据中心技术总监,数据中心技术团队负责人,负责数据中心平台的规划和建设工作,主导并参与了数据中心全新一代平台的研发。曾就职于华为技术有限公司,从事平台相关研发工作,涉及大数据、中间件、云等相关领域。


2019-06-12 08:007077
用户头像
dbaplus社群 数据连接未来

发布了 175 篇内容, 共 76.9 次阅读, 收获喜欢 614 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试 | 为何测试环境难以搭建与维护?

测吧(北京)科技有限公司

测试

软件测试 | 如何找到适合您需求的性能测试工具?

测吧(北京)科技有限公司

测试

Technical comparison of IPQ4019, IPQ4029, and IPQ4018 chips

wifi6-yiyi

ipq4029 wifi5

VMware ESXi 6.7U3u macOS Unlocker & OEM BIOS 集成 Realtek 网卡驱动和 NVMe 驱动 (集成驱动版) UI fix

sysin

esxi

关于TypeScript数据类型

高端章鱼哥

SD-WAN怎样提升Microsoft 365用户体验感

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

软件测试概念与体系

测吧(北京)科技有限公司

测试

软件测试 | 如何选择适合自己业务需求和技术栈的工具?

测吧(北京)科技有限公司

测试

VMware ESXi 6.7U3u macOS Unlocker & OEM BIOS 标准版和厂商定制版 UI fix

sysin

esxi

一键自动化博客发布工具,用过的人都说好(腾讯云篇)

程序那些事

工具 程序那些事 自动发布

Doris 实现原理之高效存取 varchar 字符串

Baidu AICLOUD

大数据

服务器成本太高,如何确定有效主机容量,节约成本?

测吧(北京)科技有限公司

测试

软件测试 | 揭秘设计现实负载测试场景的艺术:实用方法详解

测吧(北京)科技有限公司

测试

mac空间不足怎么办 mac内存满了怎么清理

阿拉灯神丁

MacBook CleanMyMac X mac‘ 电脑软件 杀毒软件

小米面试:如何实现优先级线程池?

王磊

Java 面试

SD-WAN技术助力企业网络应对六大挑战

Ogcloud

SD-WAN 企业组网 SD-WAN组网 SD-WAN服务商 SDWAN

程序员对 VSCode 粘性滚动真的不感兴趣吗?

伤感汤姆布利柏

时序数据库 vs 实时数据库,一文搞懂!

Apache IoTDB

软件测试 | 简历投了一大堆,面试机会没几个?

测吧(北京)科技有限公司

测试

软件测试 | 想做性能测试的你,是否面临以下痛点?

测吧(北京)科技有限公司

测试

详解ReflectionClass类在PHP反射API中的应用

技术冰糖葫芦

API boy API 文档 pinduoduo API API 性能测试

前端性能优化:从系统分析讲到实践策略

秃头小帅oi

软件测试 | 不是已经做了性能测试么,为什么系统一上线就崩溃了?

测吧(北京)科技有限公司

测试

云架构系统如何进行大规模性能测试?

测吧(北京)科技有限公司

测试

软件测试 | 如何解读各种性能测试数据和曲线图?

测吧(北京)科技有限公司

测试

软件测试 | 简化测试数据生成和管理的复杂性

测吧(北京)科技有限公司

测试

360大数据中心总监:如何制定可奏效的数据安全体系_安全_dbaplus社群_InfoQ精选文章