写点什么

360 大数据中心总监:如何制定可奏效的数据安全体系

  • 2019-06-12
  • 本文字数:4106 字

    阅读完需:约 13 分钟

360大数据中心总监:如何制定可奏效的数据安全体系

本文由 dbaplus 社群授权转载。

管理者的认知决定企业数据安全建设能否真正发挥价值

Q1:近年来发生的数据安全事件可以说到了屡见不鲜的程度,在您看来目前乃至今后较长一段时间,企业面临着哪些关键的数据安全隐患和挑战?


A1:首先我认为对企业而言「数据安全」其实并不是一个全新的话题。


为什么这么说呢?企业存在于社会之中,从诞生之日起,为了保证自身的持续正常运转,对内会有一系列的人员合作,对外会和其他的企业以及个人发生事务往来。那么在这个过程中不可避免的会有信息交换,有信息交换自然就会有数据安全风险。


那为什么我们还要提及这个话题呢?因为信息交换的动作对企业而言持续存在。


随着现代社会科学技术的不断演进,信息技术的快速发展和应用,使得全行业信息化的程度全面提升,整个社会的数据正在以前所未有的速度快速增长,呈现出数量大、来源广、种类多的特点,这些数据渗透到了各行各业,并逐渐成为企业的重要生产要素之一。



这个时代数据已经无处不在、如影随形,我们今天讨论的议题也是以大数据为背景展开,来探讨数据安全相关的问题,并不是传统的数据安全。从这个角度来说这也算是一个新的话题。


数据安全这个话题虽然在概念上看比较的单一,但实际上覆盖面广、内容全,同时还涉及到很多重要的因素。


那么对企业而言,会面临哪些安全隐患和挑战其实是一个比较大的话题,从我自身的角度来看,可以分为三个方面:


  • 首先是法规流程方面。随着云计算、大数据技术的逐步应用,数据自身的形态、数据使用的方式都在不断增加和变化,且这种发展趋势会变得越来越快。那么企业在这种大趋势下如何保证在法规流程上的系统性、时代感是需要优先考虑的要素。

  • 其次在系统建设方面。数据安全本身不会产生价值,所以很多时候在系统建设初期为了快速构建,往往把安全相关的能力优先级放低,甚至在很长一段时间缺失。数据在系统中裸奔,一旦出现数据泄漏将会引起不可预知的损失。

  • 另一方面由于在系统建设初期对安全能力的忽视,导致后期增加安全能力会变得更加困难,甚至需要调整系统架构,无形之中增加了企业的投入成本。

  • 最后是管理者认知方面。随着今年来大大小小的数据安全事件频繁发生,给企业和个人带来了严重后果,企业管理层在对保障数据安全上基本高度一致。

  • 但只做到意识形态上的认知是不够的,甚至对企业的安全建设起到反作用。管理者如果只关注数据本身的安全,就会导致安全体系的建设片面,最终无法达到对数据进行安全管控的效果。殊不知要保障数据安全不只是在数据层面。

  • 相反如果管理者对数据安全的建设走大而全的路线,可能这个目标永远都是水中月、镜中花,看似美好却无法达成。我认为最后一点也是最重要的一点,它决定了企业能否真正将数据安全的建设落到实处并发挥其价值。

如何制定真正可奏效的数据安全治理方案

Q2:面对这些数据安全风险,您在制定及落实真正得以奏效的安全治理方案上有什么建议?


A2:正如我之前所说,企业的数据安全体系建设是一个非常大的话题,我还是结合我所从事的工作,谈谈在大数据中心建设过程中所面临的一些具体的问题和挑战以及解决思路和方案。


随着公司的发展、产品形态上的调整,产品覆盖面越来越广,在数据层面呈现出数据海量、存储分散、用途多样的特点。



大数据中心作为公司数据中场部门,除了自身数据平台和服务能力的建设,还要面对来自各个业务部门的数据分析需求,在处理这些需求的过程中遇到了各种数据安全相关的问题。


数据集中存放,如何做到数据平台管理和数据访问的权限分离?每个业务部门有多个角色,每个角色对应的数据权限都可能不一样,如何有效控制?数据一旦发生泄漏风险,如果做到溯源?跨产品的数据如何安全的共享?



类似这样的问题还有很多,这些问题对大数据中心的发展提出了一系列的挑战,可以归纳为四个方面:


  • 平台层面的保障:传统的权限控制通常是以系统功能为中心来进行设计,通过控制用户对功能的访问来达到权限控制的目的。这种控制方式在大数据中心已经捉襟见肘,比如对于同一个数据分析功能,不同产品的分析人员只能操作本产品的数据;

  • 数据层面的保障:大数据中心面向公司所有的产品负责提供数据处理的能力,那么业务数据每天都在平台上流转,如何合理控制数据平台工程师对业务数据的访问;

  • 风险预防和审计:产品的业务形态决定了其系统设计,在其不断演进过程中,数据模型也在不断演进,必然会持续产生一些脏数据,要保证数据的质量,在数据治理环节会加入更多的人工参与,也增加数据泄漏的风险;

  • 流程和制度:哪些数据可以公开、公开的范围是多广?数据可以给哪些人使用?某个业务部门想使用另外一个业务部门的数据,应该走什么样的流程?处理这些事情在很长一段时间都是见招拆招,看起来很灵活其实毫无规则可言。


随着大数据中心业务的不断发展,这些问题带来的影响已经愈发明显,那么该如何有效解决,让大数据中心摆脱困扰,更加高效的去支撑整个公司的产品呢?


其实问题“千千万”,都是数据“惹得祸”。我们要使用数据、分析数据,发挥数据的价值,所以不可避免的要接触数据,数据安全问题也因此产生了。



以终为始,我们在构建数据安全体系的指导原则就是,明确“让数据更加安全的被使用”的目标,打造以“数据”为中心,结合“平台能力”、“隐私管理”、“法规流程”三个要素,构建具有公司特色的数据安全体系,系统化解决数据安全问题,发挥数据的更大价值。


这里需要说明的是数据安全风险会一直存在,安全体系建设是尽可能地降低发生风险的几率,让数据分析人员能使用更多的数据、让数据开发人员尽可能聚焦在数据应用本身。

360 大数据平台安全能力建设

Q3:能否以 360 自身经验为例,具体剖析其大数据平台在安全能力方面的设计思路、架构搭建,以及应用实践?


A3:变动就一定会带来阵痛,在进行大数据平台安全能力建设之初,我们也遇到了不少困难。


首先,在规范治理方面。数据安全能力建设包含了安全规范的治理,这种规范的治理势必会固化数据安全相关流程。


流程上的变动对产品部门会有感知,而安全能力建设的价值又很难呈现给产品,如何平衡这中间的矛盾?


既然大数据中心是整个公司中场部门,负责支撑全公司的数据业务,安全规范的治理采取了自上而下的策略,联合公司法务和隐私相关部门共同制定,最终完成 360 集团数据安全管理规范,让数据的使用合理、合规、合法,这也让我们的治理工作多了一份理解、少了一些阻力。



其次,在系统治理方面。大数据中心的系统建设已经到了一定阶段,按照全新的系统去设计显然不适合,数据安全能力如何和当前系统平滑融合对我们也是一个考验。


这里要说明下很多公司在开发系统之初,往往会优先开发系统中的业务功能,把安全能力的优先级降低或者是做一些简单的安全加固能力,等到想系统化建设安全能力的时候发现已经没有那么简单,系统留出的可改造空间非常受限。


回顾系统治理的过程,我们主要做了两个维度的重构:


  • 一是以数据资产为中心对系统进行了服务化改造;

  • 二是围绕数据的全生命周期建设数据系统安全。


服务化能力让系统高内聚、低耦合,系统功能易于扩展,在增加安全能力的同时也减少了对原有系统的侵入;数据应用的全生命周期让安全治理有一个明确的范围标准,这在最大程度保证了安全能力的全覆盖。


基于这样的设计思想,整个大数据平台的安全能力在原有架构上进行了从“点”到“面”的一个改造。



在数据共享方面,我们知道通常系统允许用户以文件或者图片的形式保存数据,并在保存文件中添加水印信息,用于在信息被非法传播之后的溯源,如果用户对单条数据进行复制传播的话,系统往往不能有效进行控制,


比如在数据查询结果页中通过复制粘贴将信息转发。类似场景还有很多,针对这些数据共享场景,我们引入了纯文本数字水印技术,保证在最小粒度层面的数据溯源能力。



最后以权限系统为例谈谈单系统的治理。如上所说,老的权限系统主要是完成系统鉴权和功能控制,无法支撑大数据中心现有的业务场景,比如对数据层面进行不同维度的访问控制。


那么如何在现有权限模型的基础上进行扩展,以适配当前的业务场景呢?我们对权限做了扩展,将其定义为“资源+操作”一种组合,对于菜单、页面、按钮、表、字段、任务、拓扑等进行了泛化,统一定义为资源,既保证了数据鉴权流程的稳定,又灵活应对了由于数据类型繁多带来的不确定性。



结合数据中心的职能定位和业务场景,将应用、菜单、服务、数据四个维度纳入权限系统管理,给权限系统赋予了新的定位-一站式权限管控中心。


上云一时爽,冲动上云一身霜

Q4:除了企业内部的大数据平台建设以外,在数据上云的大势所趋之下,如何确保云上的数据安全?


A4:十多年前,亚马逊推出云计算服务的时候,云服务还鲜有人问津。十年之后的现在,随着云计算的高速发展,越来越多的企业开始了云化转型。


即使这样,我觉得企业在决定是否云化之前先要回答几个问题:为什么要上云?通过上云要取得的短期目标是什么?中长期目标又是什么?


通过回答这些问题来思考云化对自身来说是否真的需要。实际应用中,云化对一些企业所带来的价值远小于其投入,甚至都无法持续支撑后期的运维,那么这个时候可能就需要规划另外的资源优化模式。


对于已经准备上云的企业来说,首先要确定采用什么样的云化方案。是选择公有云、私有云还是混合云,不同的方案其数据安全策略也是不一样的。


其次不要单纯依赖云服务商提供的数据管理能力。云平台有助于实现数据的集中管理,提升企业的数据共享能力,同时也增加数据泄漏和丢失的风险。数据一定要有备份方案将安全隐患降到最低,比如多云或者异地存储等。


最后要建立全面完善的云服务协议。上云只是企业云化的开始,未来企业系统将会持续运行在云上,在这个过程中云平台自身难免不会不出现问题。如何保证云平台的服务响应速度和解决问题的效率,这不单单依靠云服务商本身的服务标准,而是需要企业结合自身的要求和云服务商共同完成服务协议的制定,让企业尤其是中小企业在产生问题之后可以有更多的话语权,将企业的损失尽可能降到最低。

作者介绍

徐皓


现任奇虎 360 大数据中心技术总监,数据中心技术团队负责人,负责数据中心平台的规划和建设工作,主导并参与了数据中心全新一代平台的研发。曾就职于华为技术有限公司,从事平台相关研发工作,涉及大数据、中间件、云等相关领域。


2019-06-12 08:007109
用户头像
dbaplus社群 数据连接未来

发布了 175 篇内容, 共 78.0 次阅读, 收获喜欢 614 次。

关注

评论

发布
暂无评论
发现更多内容

《JavaScript基础入门》环境搭建

IT蜗壳-Tango

IT蜗壳教学 1月月更

找出数组中出现次数超过一半的数字

zdd

算法题

区块链数字藏品平台开发,区块链+数字藏品激活传统文创

电微13828808271

What's new in dubbo-go-pixiu 0.4.0

apache/dubbo-go

web技术分享| css filter和getUserMedia的联合使用

anyRTC开发者

CSS 前端 Web 音视频 WebRTC

悄悄告诉你,有种管理方法能让设计团队学习、产出两不误!

LigaAI

效率 技术

政法委重点人员联防联控平台开发,跨部门大数据系统搭建

电微13828808271

百分点数据科学实验室:零售行业新店品类配比测算方案

百分点科技技术团队

牛掰,在IDEA中,你可以安装小傅哥写的插件了!

小傅哥

小傅哥 idea插件 vo2dto转换插件开发 idea plugin 代码织入

功能十分全面的项目管理工具(文档协作、项目计划、文件管理等)

优秀

项目管理 项目管理工具

恒源云(GPUSHARE)_云GPU服务器如何使用LightGBM?

恒源云

人工智能 算力 框架学习

【LeetCode】Bigram 分词 Java题解

Albert

算法 LeetCode 1月月更

Git操作备忘录(持续更新)

IT蜗壳-Tango

git IT蜗壳教学 1月月更

数字化转型失败,有哪些原因?

禅道项目管理

数字化转型

Cube 技术解读 | Cube 小程序技术详解

蚂蚁集团移动开发平台 mPaaS

小程序 前端 mPaaS cube

作业6

施正威

【逆向分析】快速查找指定代码的几种方法

H

网络安全 逆向分析

架构实战营第 4 期 -- 模块五作业

烈火干柴烛灭田边残月

架构实战营

终极解密输入网址按回车到底发生了什么

码哥字节

HTTP TCP/IP

年度盘点|每一个ToB产品都值得被看见

ToB行业头条

架构实战 - 模块八

唐敏

「架构实战营」

荣获中国专利金奖!百度连续四年AI专利申请和授予量全国第一

百度开发者中心

人工智能 AI

MongoDB常用命令(2)

Tom弹架构

Java mongodb 分布式数据库

LevelDB在测试中应用应用

FunTester

数据库 测试开发 leveldb FunTester 有状态服务

作业5

施正威

spring源码搭建

派大星

Spring5源码解析

SpringMVC框架基础知识(03)

海拥(haiyong.site)

28天写作 1月月更

TDengine在上海电气储能智慧运维系统中的应用

TDengine

数据库 大数据 tdengine

敏感信息打码就安全了吗?

恒生LIGHT云社区

信息安全

智慧巨鹿使用Rainbond落地实践,一个平台管理所有应用系统

北京好雨科技有限公司

LigaAI 2021年终总结

LigaAI

团队管理 技术 成长笔记】 年度总结

360大数据中心总监:如何制定可奏效的数据安全体系_安全_dbaplus社群_InfoQ精选文章