写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

2013-12-20 06:531849
用户头像

发布了 256 篇内容, 共 91.4 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

专业级沙箱与恶意样本的自动化分析

京东科技开发者

云计算 监控 虚拟化

复盘逆袭之路!三个月时间深造,怒斩拼多多、字节、蚂蚁金服破50W年薪Offer(含自学路线图)

Java架构追梦

Java 学习 架构 面试 数据结构与算法

图解 | 不得错过的Binder浅析(一)

哈利迪

android

巨建华:区块链+金融的难点

CECBC

区块链 金融

YOLODet--YOLO系列网络结构图(YOLOv5,YOLOv4,PPYOLO,YOLOv3)

wuzhihao7788

学习 AI 目标追踪

OpenShift 4 监控技术栈解析

东风微鸣

Kubernetes Prometheus openshift 可观察性 Thanos

Java9 新特性 - 下篇

hepingfly

Java 新特性

SpringBoot-技术专题-war包项目外置配置文件

码界西柚

【原创】Spring Boot终极篇《下》

田维常

spring Boot Starter

芯片破壁者(十九):显卡的战国与帝国

脑极体

架构师训练营第七周作业

邓昀垚

区块链是未来数字经济标志性的发明技术

CECBC

区块链 数字经济

【面经】面试官:做过性能优化的工作吗?你会从哪些方面入手做性能优化呢?

冰河

面试 性能优化 JVM 高并发 高性能

淘宝内测新内容社区淘宝逛逛:邀请B站UP主入驻打造流量池

石头IT视角

智能驾驶看湘江:中国智能网联汽车产业的“长沙样本”

脑极体

搞定秒杀,只需要这几步!!

架构师修行之路

缓存 分布式 微服务 秒杀

目标检测之YOLOv1

Dreamer

【原创】Spring Boot终极篇《上》

田维常

spring Boot Starter

DDIA 读书笔记(4)多节点数据复制方案

莫黎

读书笔记

让容器应用管理更快更安全,Dragonfly 发布 Nydus 容器镜像加速服务

阿里云基础软件团队

云原生

想不通(关于人生的突发奇想)

干啥啥不行的赢

一站式低延迟直播连麦解决方案

anyRTC开发者

音视频 WebRTC 直播 RTC sdk

YOLODet 最强PyTorch版的YOLOv5、YOLOv4、PP-YOLO、YOLOv3复现

wuzhihao7788

学习 AI 目标追踪

数据库JDBC:PreparedStatement

正向成长

JDBC SQL预处理 PrepareStatement

聊点缓存——Part 1

姜雨生

redis 缓存

甲方日常 43

句子

工作 随笔杂谈 日常

程序员面试题为什么出得天花乱坠,实际工作中这些根本用不到?

Java架构师迁哥

Amdocs收购OPENET:关于5G应用落地的思考

VoltDB

大数据 数据分析 5G 物联网

马云被约谈,阿里大数据的羹怎么分给每一个人?

CECBC

区块链 大数据

嵌入式的我们为什么要学ROS

良知犹存

ROS

音视频社交的应用和优势

anyRTC开发者

音视频 WebRTC 语音 直播 RTC

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章