写点什么

360 大数据中心总监:如何制定可奏效的数据安全体系

  • 2019-06-12
  • 本文字数:4106 字

    阅读完需:约 13 分钟

360大数据中心总监:如何制定可奏效的数据安全体系

本文由 dbaplus 社群授权转载。

管理者的认知决定企业数据安全建设能否真正发挥价值

Q1:近年来发生的数据安全事件可以说到了屡见不鲜的程度,在您看来目前乃至今后较长一段时间,企业面临着哪些关键的数据安全隐患和挑战?


A1:首先我认为对企业而言「数据安全」其实并不是一个全新的话题。


为什么这么说呢?企业存在于社会之中,从诞生之日起,为了保证自身的持续正常运转,对内会有一系列的人员合作,对外会和其他的企业以及个人发生事务往来。那么在这个过程中不可避免的会有信息交换,有信息交换自然就会有数据安全风险。


那为什么我们还要提及这个话题呢?因为信息交换的动作对企业而言持续存在。


随着现代社会科学技术的不断演进,信息技术的快速发展和应用,使得全行业信息化的程度全面提升,整个社会的数据正在以前所未有的速度快速增长,呈现出数量大、来源广、种类多的特点,这些数据渗透到了各行各业,并逐渐成为企业的重要生产要素之一。



这个时代数据已经无处不在、如影随形,我们今天讨论的议题也是以大数据为背景展开,来探讨数据安全相关的问题,并不是传统的数据安全。从这个角度来说这也算是一个新的话题。


数据安全这个话题虽然在概念上看比较的单一,但实际上覆盖面广、内容全,同时还涉及到很多重要的因素。


那么对企业而言,会面临哪些安全隐患和挑战其实是一个比较大的话题,从我自身的角度来看,可以分为三个方面:


  • 首先是法规流程方面。随着云计算、大数据技术的逐步应用,数据自身的形态、数据使用的方式都在不断增加和变化,且这种发展趋势会变得越来越快。那么企业在这种大趋势下如何保证在法规流程上的系统性、时代感是需要优先考虑的要素。

  • 其次在系统建设方面。数据安全本身不会产生价值,所以很多时候在系统建设初期为了快速构建,往往把安全相关的能力优先级放低,甚至在很长一段时间缺失。数据在系统中裸奔,一旦出现数据泄漏将会引起不可预知的损失。

  • 另一方面由于在系统建设初期对安全能力的忽视,导致后期增加安全能力会变得更加困难,甚至需要调整系统架构,无形之中增加了企业的投入成本。

  • 最后是管理者认知方面。随着今年来大大小小的数据安全事件频繁发生,给企业和个人带来了严重后果,企业管理层在对保障数据安全上基本高度一致。

  • 但只做到意识形态上的认知是不够的,甚至对企业的安全建设起到反作用。管理者如果只关注数据本身的安全,就会导致安全体系的建设片面,最终无法达到对数据进行安全管控的效果。殊不知要保障数据安全不只是在数据层面。

  • 相反如果管理者对数据安全的建设走大而全的路线,可能这个目标永远都是水中月、镜中花,看似美好却无法达成。我认为最后一点也是最重要的一点,它决定了企业能否真正将数据安全的建设落到实处并发挥其价值。

如何制定真正可奏效的数据安全治理方案

Q2:面对这些数据安全风险,您在制定及落实真正得以奏效的安全治理方案上有什么建议?


A2:正如我之前所说,企业的数据安全体系建设是一个非常大的话题,我还是结合我所从事的工作,谈谈在大数据中心建设过程中所面临的一些具体的问题和挑战以及解决思路和方案。


随着公司的发展、产品形态上的调整,产品覆盖面越来越广,在数据层面呈现出数据海量、存储分散、用途多样的特点。



大数据中心作为公司数据中场部门,除了自身数据平台和服务能力的建设,还要面对来自各个业务部门的数据分析需求,在处理这些需求的过程中遇到了各种数据安全相关的问题。


数据集中存放,如何做到数据平台管理和数据访问的权限分离?每个业务部门有多个角色,每个角色对应的数据权限都可能不一样,如何有效控制?数据一旦发生泄漏风险,如果做到溯源?跨产品的数据如何安全的共享?



类似这样的问题还有很多,这些问题对大数据中心的发展提出了一系列的挑战,可以归纳为四个方面:


  • 平台层面的保障:传统的权限控制通常是以系统功能为中心来进行设计,通过控制用户对功能的访问来达到权限控制的目的。这种控制方式在大数据中心已经捉襟见肘,比如对于同一个数据分析功能,不同产品的分析人员只能操作本产品的数据;

  • 数据层面的保障:大数据中心面向公司所有的产品负责提供数据处理的能力,那么业务数据每天都在平台上流转,如何合理控制数据平台工程师对业务数据的访问;

  • 风险预防和审计:产品的业务形态决定了其系统设计,在其不断演进过程中,数据模型也在不断演进,必然会持续产生一些脏数据,要保证数据的质量,在数据治理环节会加入更多的人工参与,也增加数据泄漏的风险;

  • 流程和制度:哪些数据可以公开、公开的范围是多广?数据可以给哪些人使用?某个业务部门想使用另外一个业务部门的数据,应该走什么样的流程?处理这些事情在很长一段时间都是见招拆招,看起来很灵活其实毫无规则可言。


随着大数据中心业务的不断发展,这些问题带来的影响已经愈发明显,那么该如何有效解决,让大数据中心摆脱困扰,更加高效的去支撑整个公司的产品呢?


其实问题“千千万”,都是数据“惹得祸”。我们要使用数据、分析数据,发挥数据的价值,所以不可避免的要接触数据,数据安全问题也因此产生了。



以终为始,我们在构建数据安全体系的指导原则就是,明确“让数据更加安全的被使用”的目标,打造以“数据”为中心,结合“平台能力”、“隐私管理”、“法规流程”三个要素,构建具有公司特色的数据安全体系,系统化解决数据安全问题,发挥数据的更大价值。


这里需要说明的是数据安全风险会一直存在,安全体系建设是尽可能地降低发生风险的几率,让数据分析人员能使用更多的数据、让数据开发人员尽可能聚焦在数据应用本身。

360 大数据平台安全能力建设

Q3:能否以 360 自身经验为例,具体剖析其大数据平台在安全能力方面的设计思路、架构搭建,以及应用实践?


A3:变动就一定会带来阵痛,在进行大数据平台安全能力建设之初,我们也遇到了不少困难。


首先,在规范治理方面。数据安全能力建设包含了安全规范的治理,这种规范的治理势必会固化数据安全相关流程。


流程上的变动对产品部门会有感知,而安全能力建设的价值又很难呈现给产品,如何平衡这中间的矛盾?


既然大数据中心是整个公司中场部门,负责支撑全公司的数据业务,安全规范的治理采取了自上而下的策略,联合公司法务和隐私相关部门共同制定,最终完成 360 集团数据安全管理规范,让数据的使用合理、合规、合法,这也让我们的治理工作多了一份理解、少了一些阻力。



其次,在系统治理方面。大数据中心的系统建设已经到了一定阶段,按照全新的系统去设计显然不适合,数据安全能力如何和当前系统平滑融合对我们也是一个考验。


这里要说明下很多公司在开发系统之初,往往会优先开发系统中的业务功能,把安全能力的优先级降低或者是做一些简单的安全加固能力,等到想系统化建设安全能力的时候发现已经没有那么简单,系统留出的可改造空间非常受限。


回顾系统治理的过程,我们主要做了两个维度的重构:


  • 一是以数据资产为中心对系统进行了服务化改造;

  • 二是围绕数据的全生命周期建设数据系统安全。


服务化能力让系统高内聚、低耦合,系统功能易于扩展,在增加安全能力的同时也减少了对原有系统的侵入;数据应用的全生命周期让安全治理有一个明确的范围标准,这在最大程度保证了安全能力的全覆盖。


基于这样的设计思想,整个大数据平台的安全能力在原有架构上进行了从“点”到“面”的一个改造。



在数据共享方面,我们知道通常系统允许用户以文件或者图片的形式保存数据,并在保存文件中添加水印信息,用于在信息被非法传播之后的溯源,如果用户对单条数据进行复制传播的话,系统往往不能有效进行控制,


比如在数据查询结果页中通过复制粘贴将信息转发。类似场景还有很多,针对这些数据共享场景,我们引入了纯文本数字水印技术,保证在最小粒度层面的数据溯源能力。



最后以权限系统为例谈谈单系统的治理。如上所说,老的权限系统主要是完成系统鉴权和功能控制,无法支撑大数据中心现有的业务场景,比如对数据层面进行不同维度的访问控制。


那么如何在现有权限模型的基础上进行扩展,以适配当前的业务场景呢?我们对权限做了扩展,将其定义为“资源+操作”一种组合,对于菜单、页面、按钮、表、字段、任务、拓扑等进行了泛化,统一定义为资源,既保证了数据鉴权流程的稳定,又灵活应对了由于数据类型繁多带来的不确定性。



结合数据中心的职能定位和业务场景,将应用、菜单、服务、数据四个维度纳入权限系统管理,给权限系统赋予了新的定位-一站式权限管控中心。


上云一时爽,冲动上云一身霜

Q4:除了企业内部的大数据平台建设以外,在数据上云的大势所趋之下,如何确保云上的数据安全?


A4:十多年前,亚马逊推出云计算服务的时候,云服务还鲜有人问津。十年之后的现在,随着云计算的高速发展,越来越多的企业开始了云化转型。


即使这样,我觉得企业在决定是否云化之前先要回答几个问题:为什么要上云?通过上云要取得的短期目标是什么?中长期目标又是什么?


通过回答这些问题来思考云化对自身来说是否真的需要。实际应用中,云化对一些企业所带来的价值远小于其投入,甚至都无法持续支撑后期的运维,那么这个时候可能就需要规划另外的资源优化模式。


对于已经准备上云的企业来说,首先要确定采用什么样的云化方案。是选择公有云、私有云还是混合云,不同的方案其数据安全策略也是不一样的。


其次不要单纯依赖云服务商提供的数据管理能力。云平台有助于实现数据的集中管理,提升企业的数据共享能力,同时也增加数据泄漏和丢失的风险。数据一定要有备份方案将安全隐患降到最低,比如多云或者异地存储等。


最后要建立全面完善的云服务协议。上云只是企业云化的开始,未来企业系统将会持续运行在云上,在这个过程中云平台自身难免不会不出现问题。如何保证云平台的服务响应速度和解决问题的效率,这不单单依靠云服务商本身的服务标准,而是需要企业结合自身的要求和云服务商共同完成服务协议的制定,让企业尤其是中小企业在产生问题之后可以有更多的话语权,将企业的损失尽可能降到最低。

作者介绍

徐皓


现任奇虎 360 大数据中心技术总监,数据中心技术团队负责人,负责数据中心平台的规划和建设工作,主导并参与了数据中心全新一代平台的研发。曾就职于华为技术有限公司,从事平台相关研发工作,涉及大数据、中间件、云等相关领域。


2019-06-12 08:007120
用户头像
dbaplus社群 数据连接未来

发布了 175 篇内容, 共 78.4 次阅读, 收获喜欢 616 次。

关注

评论

发布
暂无评论
发现更多内容

如何写一篇百万阅读量的文章

六月的雨在InfoQ

内容 个人提升 写作技巧

莫慌!Java 多商户外贸版系统这不就来了么

CRMEB

Okaleido生态核心权益OKA,尽在聚变Mining模式

西柚子

Linux 常用命令(二)

五分钟学大数据

Linux 7月月更

2B和2C

白粥

服务器内存故障预测居然可以这样做!

vivo互联网技术

运维 内存监控 EDAC 内存预测

万字详解“用知识图谱驱动企业业绩增长”

博文视点Broadview

后端服务性能测试能力建设101

RingCentral铃盛

typescript 后端 ansible node,js SDET

LeetCode-67. 二进制求和(java)

bug菌

Leet Code 7月月更

C#入门系列(三十一) -- 运算符重载

陈言必行

7月月更

议程速递 | 7月27日分论坛议程一览

kk-OSC

开源 开放原子全球开源峰会

Kubernetes网络插件详解 - Calico篇 - 概述

巨子嘉

第二届中国Rust开发者大会来啦,完整议程大曝光!

Mike Tang

rust rust conf

STM32+MFRC522完成IC卡号读取、密码修改、数据读写

DS小龙哥

7月月更

期待已久的 RocketMQ Summit 等待你的参与!

阿里巴巴云原生

Apache 阿里云 RocketMQ 云原生 消息队列

为啥谷歌的内部工具不适合你?

laofo

DevOps cicd 研发效能 工具链 谷歌

C# Serialport的发送和接收

IC00

C# 7月月更

入门前端 -- CSS

bo

CSS 前端 7月月更

智能合约dapp系统开发流程技术

开发微hkkf5566

如何使用Docker内的kafka服务

程序员欣宸

Java kafka 7月月更

java零基础入门-异常、线程(上)

喵手

Java 7月月更

SAP ABAP Netweaver 容器化的一些前沿性研究工作分享

汪子熙

SAP abap Netweaver Docker 镜像 7月月更

SAP ABAP 守护进程的实现方式

汪子熙

操作系统 守护进程 SAP abap 7月月更

一文详解Nodejs中fs文件模块与path路径模块

timerring

node.js path FS 签约计划第三季

Qt | 关于如何使用事件过滤器 eventFilter

YOLO.

qt 7月月更

语音聊天app源码——钠斯直播系统源码

开源直播系统源码

直播系统源码 语音聊天系统 语音聊天软件 一对一语音聊天系统

Okaleido生态核心权益OKA,尽在聚变Mining模式

小哈区块

面试突击68:为什么 TCP 需要 3 次握手?

王磊

Java 面试题 网络

一种分布式深度学习编程新范式:Global Tensor

OneFlow

深度学习 编程 分布式

前端食堂技术周刊第 45 期:Vite3.0、第91次TC39会议、Figma背后的CSS、B 站事故复盘、图片优化工具

童欧巴

前端 deno vite TC39 figma

算法题每日一练---第10天:时间显示

知心宝贝

算法 前端 后端 7月月更

360大数据中心总监:如何制定可奏效的数据安全体系_安全_dbaplus社群_InfoQ精选文章