产品战略专家梁宁确认出席AICon北京站,分享AI时代下的商业逻辑与产品需求 了解详情
写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

2013-12-20 06:531672
用户头像

发布了 256 篇内容, 共 85.7 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

Vagrant 创建多台主机

FeiLong

vagrant 虚拟机

我关闭了微信朋友圈广告!

诸葛小猿

广告 微信朋友圈 关闭

关于性能优化的总结

罗亮

盘点本周区块链国内大事件

CECBC

Go: 通过例子学习 Map 的设计 — Part I

陈思敏捷

map Go 语言

思想无语言边界:以cglib介绍AOP在java的一个实现方式

八苦-瞿昙

随笔 随笔杂谈 aop

架构师训练营 - 第 6 周学习总结

红了哟

第七章作业

小胖子

架构师课程第七周 作业

杉松壁

Windows Sandbox应用

Dare Devor

容器 Sandbox 虚拟化

Java中生成随机数的不同方法

wjchenge

web 性能压测工具类

jason

多问为什么

声远

技术 沟通 软件开发流程

用 GitBook 创建一本书

耳东@Erdong

git markdown gitbook

罪羊树——暴力也是种优雅

烫烫烫个喵啊

算法 二叉树 替罪羊 平衡二叉树

运行 client-go 测试用例.md

FeiLong

Kubernetes

redis系列之——事物及乐观锁

诸葛小猿

redis 乐观锁 事物 原子性 隔离性

架构师训练营第七周作业--web压测工具

CATTY

架构师训练营第七周学习总结

张明森

架构师训练营第七周作业

张明森

从推特被黑看安全木桶效应

石君

安全设计 安全事件

计算机网络基础(六)---网络层-网络地址转换NAT技术

书旅

laravel 计算机网络 网络协议 计算机基础 NAT

架构师训练营 - 第 6 周命题作业

红了哟

道德的神

多选参数

故事

Golang实现结构体数组按多字段排序

卓丁

多字段排序 结构体多字段排序 Go 语言

发布一本用 GitBook 编辑的书

耳东@Erdong

git gitbook

JDK1.8新特性(二):为什么要关注JDK1.8

xcbeyond

新特性 JDK1.8 JDK1.8新特性

ARTS打卡-07

Geek_yansheng25

谈谈你是如何理解JS异步编程的,EventLoop、消息队列都是做什么 ,什么是宏任务,什么是微任务?

GKNick

Prometheus 删除指定 Metric

耳东@Erdong

Prometheus metrics

JDK1.8新特性(三):Lambda表达式,让你爱不释手

xcbeyond

Lambda 新特性 JDK1.8 JDK1.8新特性

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章