速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

Martin Fowler 谈数据紧缩

  • 2013-12-20
  • 本文字数:929 字

    阅读完需:约 3 分钟

越来越多的企业正投资于大数据系统。由于这些系统设计用来存储和处理海量的信息,所以其建设和维护往往都极其复杂和昂贵。它们也非常容易受到攻击,但对于高额利润的预期,企业似乎无法抗拒。

Martin Fowler 写了一篇文章,关于与大数据截然相反的 Datensparsamkeit 。这是一个德语词,大致可以翻译成“数据紧缩(data austerity)”或者直白地译为“不存储不需要的数据”。其中一个原因是隐私。其实在爱德华·斯诺登泄密事件之前,人们就已经对 2001 年的美国爱国者法案和随后的未授权监控表示了担忧。Martin 写到:

“收集所有数据(capture-it-all)”的方式其问题在于会引发严重的隐私问题。即使我们相信自己不会滥用收集的数据,但每个数据存储都可能成为罪犯或者政府监控机构的目标。在德国,这个问题尤其令人担忧。历届政府均存在这一问题,为了控制国民,政府对他们进行了广泛地监控。德国因此具有了健全的数据隐私法。

Datensparsamkeit 是一个源于这些隐私法的概念,与“收集所有数据”的理念截然相反。对于这个词,英语中没有一个直截了当的译法(这就是为什么我在文中保留了这个德语词),但大致上可以将其翻译为“数据紧缩”、“数据最小化”、“吝惜数据(data parsimony)”或者“节省数据(data frugality)”。这意味着,企业应该总是问自己这样一个问题,为什么收集或者存储数据,并设法只处理达到目的所需的最小数据量。

当然,政府监控不是唯一的担忧。即使是最小的企业也会成为黑客设法获取密码和信用卡信息的目标。Martin 继续写到:

即使读者不同意我关于个人控制自己数据的观点,安全遭破坏的风险还是意味着 datensparsamkeit 是一个明智的做法。如果保存了并不需要的数据,而某个人窃取并造成了损失,难道保存数据的人就不需要为此承担责任吗?即使没有法律责任,公开传播也将产生严重的后果——因此,任何不践行 datensparsamkeit 的人都在冒险。

对于某些行业,这个问题的答案毫无疑问是肯定的。例如,任何储存了信用卡背面三位数代码的企业都要对来自 Visa 和 Mastercard 的巨额罚款负责,即使实际上并没有破坏安全的行为发生。如果信息遭到窃取并被使用,法庭判处的罚款、相关部门出具的罚款以及赔款会让一个小企业破产。

查看英文原文:**** Martin Fowler on Data Austerity

2013-12-20 06:531690
用户头像

发布了 256 篇内容, 共 86.3 次阅读, 收获喜欢 12 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试自动化“领导者”SmartBear举办首场中国线上研讨会:洞悉全球自动化测试走向,探讨降本增效之策

龙智—DevSecOps解决方案

自动化测试 API测试 UI测试 软件测试自动化

我与梅西粉丝们的世界杯观球日常

ZEGO即构

音视频开发

Baklib|知识库应用场景:制作员工培训手册

Baklib

团队管理 知识管理

无情!阿里技术专家手写《微服务架构笔记》,瞬间屠榜NO.1

程序知音

Java 微服务 java架构 后端技术

异常的基本概念和Java中的体系

共饮一杯无

Java 异常 11月月更

MySQL数据库 group by 语句怎么优化?

Java全栈架构师

Java MySQL 数据库 程序员 后端

信息论与编码:恒参信道特性

timerring

11月月更 信息论与编码

企业网络“卫生”实用指南(上)

SEAL安全

网络安全 企业安全

一种基于 Apache Hive 的元数据智能发现方案

移动云大数据

hive

探讨Morest在RESTful API测试的行业实践

华为云开发者联盟

开发 API测试 华为云

vivo大数据日志采集Agent设计实践

vivo互联网技术

大数据 数据采集 日志采集 agent

降本增效的背后,谈谈阿里云存储数据湖3.0

云布道师

数据湖 云存储 云栖大会

FastJSON2他来了,性能显著提升,还能再战十年

共饮一杯无

Java Fastjson 11月月更

Java中的StringBuilder类

共饮一杯无

Java StringBuilder 11月月更

Python 项目工程化最佳实践指南

Andy

Python 项目管理 代码规范 代码风格

FCOS论文复现:通用物体检测算法

华为云开发者联盟

人工智能 华为云 论文复现

千年荒漠变绿洲,看沙漠“卫士”携手昇腾AI植起绿色希望

华为云开发者联盟

人工智能 华为云 昇腾AI

MatrixOne从入门到实践07——MO-Tester

MatrixOrigin

数据库 分布式 测试工具 MatrixOrigin MatrixOne

面试官:介绍一下 Redis 三种集群模式

程序员小毕

redis 程序员 后端 java面试 redis集群

互联网大厂必问面试合集,助你跳槽拿高薪--Java篇

钟奕礼

Java java面试 java编程 程序员java

技术指南 | 如何集成Perforce版本控制系统Helix Core (P4V) 与敏捷规划工具Hansoft

龙智—DevSecOps解决方案

敏捷 版本管理

深度 | 新兴软件研发范式崛起,云计算全面走向 Serverless 化

Serverless Devs

阿里云 Serverless

Java中的拆箱与装箱

共饮一杯无

Java 11月月更 装箱与拆箱

代码质量与安全 | 使用Incredibuild加速Klocwork静态代码分析

龙智—DevSecOps解决方案

代码静态分析 SAST工具 SAST 编译器 加速器 编程语言

String、StringBuffer、StringBuilder 有什么区别

共饮一杯无

Java string 11月月更

2022中国区Cyber Monday限时优惠来袭,Linux基金会开源软件学园带来优惠

kk-OSC

k8s Linux基金会 CKA CKS

ITSM | 对话——从业务场景、中国市场策略角度解读Atlassian ITSM解决方案

龙智—DevSecOps解决方案

ITSM ITIL

逻辑回归与评分卡-二元回归与多元回归:重要参数solver & multi_class & class_weight

烧灯续昼2002

Python 机器学习 算法 sklearn 11月月更

重构了一个服务的健康检查组件

Java永远的神

Java 程序员 面试 后端 架构师

公共大数据集群中如何配置 YARN 的公平调度器和容量调度器

明哥的IT随笔

hadoop YARN

DNS中有哪些值得学习的优秀设计

小小怪下士

Java 程序员 DNS

Martin Fowler谈数据紧缩_大数据_Jonathan Allen_InfoQ精选文章