QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

Null:价值 10 亿美元的错误

  • 2020-06-25
  • 本文字数:3957 字

    阅读完需:约 13 分钟

Null:价值10亿美元的错误


本文翻译自“NULL: The Billion Dollar Mistake”,已获得原作者 Maximiliano Contieri 授权。


我们都在大量地使用 null。我们必须承认它舒适、高效、快速,然而我们在使用它的过程中遇到了数不清的问题。既然认识到了问题的存在,那么还有什么认知偏见在阻止我们着手解决它呢?

Null 代表什么?

Null 只是一个标志。根据使用和调用它的上下文不同,它代表着不同的情况。


这就导致了软件开发中最严重的错误:在一个对象使用它的人之间的约定中耦合了一个隐藏的决策。


耦合:唯一的软件设计问题


有了这个重要的缺陷似乎还不够,它还要打破我们唯一的设计规则:它使用同一实体表示域的多个元素,因此不得不在各种不同的上下文环境下做出不同的解读。


唯一的软件设计原则


一个好的软件原则要求我们具有高度的内聚性。所有对象应尽可能具体,并只具有单一责任(SOLID 中的 S)。


任何系统中最没有内聚性的对象就是通配符:Null



NULL 可以映射到现实世界中的几个不同概念

灾难性故障

对于任何对象,Null 都不是多态的,因此调用它的任何函数都将中断后续的调用链。


例 1:让我们用一个模型来模拟当前 covid-19 大流行期间人与人之间的互动。


final class City {    public function interactionBetween($somePerson, $anotherPerson) {        if ($this->meetingProbability() < random()) {                return null; //no interaction            } else {                return new PersonToPersonInteraction($somePerson, $anotherPerson);        }    }}final class PersonToPersonInteraction {    public function propagate($aVirus) {            if ($this->somePerson->isInfectedWith($aVirus) && $aVirus->infectionProbability() > random()) {                $this->anotherPerson->getInfectedWith($aVirus);        }    }}$covid19 = new Virus();    $janeDoe = new Person();$johnSmith = new Person();    $wuhan = new City();$interaction = $wuhan->interactionBetween($johnSmith, $janeDoe);if ($interaction != null) {        $interaction->propagate($covid19);}/* In this example we modeled the interaction between an infected person and a healthy one.Jane is healthy but might be infected if Virus R0 applies to her.*/
复制代码


我们可以看到两个 Null 标志和相应的 if 子句。看起来 Null 传播似乎被控制住了,但这只是一个假象。

一点历史

Null 的诞生源于 1965 年的一个偶然事件。


托尼·霍尔(Tony Hoare)是快速排序算法的创造者,也是图灵奖(计算机领域的诺贝尔奖)的获得者。他把它添加到了 Algol 语言中,因为它看起来很实用而且容易实现。但几十年后,他后悔了。


下面这篇很棒的文章里详细地讲述了这个故事:


空指针引用:价值十亿美元的错误


我称之为我的十亿美元错误……当时,我正在设计第一个全面的类型系统,用于面向对象语言中的引用功能。我的目标是确保所有对引用的使用都是绝对安全的,由编译器自动执行检查。

但是我无法拒绝定义一个 Null 引用的诱惑,因为它实在太容易实现了。这导致了无数错误、漏洞和系统崩溃。在过去的四十年里,这些问题可能已经造成了十亿美元的损失。 

——托尼·霍尔,ALGOL W 的发明者。


读者也可以观看完整的视频

借口

作为开发人员,我们使用 Null 是因为它很容易用(很容易编写),并且我们相信它提高了我们软件的效率。


这是错误的观念,因为我们忽略了一件事实:一份代码可能会被读十次甚至更多,而你只需要写它一次即可。


读带有 Null 的代码特别困难。因此,我们只是把问题推给将来去解决了。


效率是一个理由(这是产生耦合最常用的借口)。除非是在非常特殊和关键的情况下,它的性能损失都可以忽略不计。在那些将效率的重要性置于可读性、适应性和可维护性之上的系统中,它的存在是合理的(在质量指标方面总是存在各种权衡)。


不管时代怎样发展,这种认知偏差总会持续存在。尽管现代虚拟机是会为我们优化代码的。


为了依靠证据而不是直觉,我们只需要开始基准测试即可,而不是坚持错误地宣称效率比可读性更重要。


快速失败

Null 被人们用来(或者说是被滥用于)掩盖意外情况,让代码中的错误散播得太过遥远,进而产生令人恐惧的连锁反应。


好的设计原则之一是快速失败(fail fast)。


下面再看一个例子:假设有这样一张病人的数据表,我们要填写病人的出生日期。


如果可视化组件和对象创建过程中存在错误,数据表中就可能出现空的(null)出生日期。


当运行某个夜间批处理程序,要收集所有患者的生日以计算平均年龄的时候,这个出生日期为空的病人数据就会生成错误。


为开发人员提供有价值信息的堆栈会离缺陷所在的位置有很远的距离。接下来只能祝你调试愉快了!



除此之外,还可能会有用不同的编程语言编写的不同系统,通过 API 来传输数据、文件等。


开发人员最糟糕的噩梦是必须在深夜调试这个 bug,并试图找出问题的根本原因。

不处理可选内容的类型化语言

大多数类型化语言使用了相同的方法来防止错误,即确保作为参数发送(或返回)的对象能够符合某个协议。


不幸的是,这些语言中有一些已经开始倒退,既允许声明的对象是某种类型的,也可以选择是 Null。


这打破了调用链,迫使开发人员使用 If 来处理对象不存在的场景,违反了开/闭原则


更重要的是,Null 会破坏类型控制。如果我们使用类型化语言并信任编译器防御网络,Null 会像病毒一样穿透它,并传播到下面指出的其他类型。


计算机科学发展史上最糟糕的错误。——Lucidchart

解决方案

不要用它。

替代方案

像往常一样,为了解决我们所有的问题,我们应该忠于我们认定的唯一公理化的设计规则。


在问题域中搜索解决方案,将它们带到我们的模型中。

模型多态缺失

在上述情况下,在必须为对象声明一个类型时,还有一些更优雅的解决方案可以避免使用 if 来处理可选的内容。


在分类语言中,在具体的兄弟类中使用NullObject设计模式,并根据Liskov替换原则(SOLID 的 L)将超类声明为协作者的类型就足够了。


但是,如果我们决定实施这一解决方案,我们将违反另一个设计原则,即我们应该有充分的理由进行子类化,避免重用代码或调整类层次结构。


分类语言中的最佳解决方案是声明一个接口,真实类空对象类都必须遵守该接口的约定。


在第一个示例中这样做:


Interface SocialInteraction{    public function propagate($aVirus);}final class SocialDistancing implements SocialInteraction {    public function propagate($aVirus) { //Do nothing !!!!    }}final class PersonToPersonInteraction implements SocialInteraction {    public function propagate($aVirus) {            if ($this->somePerson->isInfectedWith($aVirus) && $aVirus->infectionProbability() > random()) {                $this->anotherPerson->getInfectedWith($aVirus);        }    }}final class City {    public function interactionBetween($aPerson, $anotherPerson) {        return new SocialDistancing(); // The cities are smart enough to implement social distancing to model Person to Person interactions    }}$covid19 = new Virus();    $janeDoe = new Person();$johnSmith = new Person();    $wuhan = new City();$interaction = $wuhan->interactionBetween($johnSmith, $janeDoe);$interaction->propagate($covid19);/* Jane will not be affected since the interaction prevents from propagating the virus
复制代码


不会引入病毒,也不会有 if 或 Null!


在本例中,我们将 Null 替换为问题域中存在的一种描述。

再看看病人出生日期的例子

我们回到患者表单的例子。即使表格中相应的字段有缺失,我们仍要计算出平均数来。


Interface Visitable {    public function accept($aVisitor);}final class Date implements Visitable {    public function accept($aVisitor) {            $aVisitor->visitDate($this);    }}final class DateNotPresent implements Visitable {    public function accept($aVisitor) {            $aVisitor->visitDateNotPresent($this);    }}final class AverageCalculator {    private $count = 0;        private $ageSum = 0;    public function visitDate($aDate) {            $this->count++;            $this->ageSum += today() - $aDate;    }    public function visitDateNotPresent($aDate) {    }    public function average() {        if ($this->count == 0)                return 0;            else                return $this->ageSum / $this->count;    }}function averagePatientsAge($patients) {        $calculator = new AverageCalculator();        foreach ($patients as $patient)            $patient->birthDate()->accept($calculator);        return $calculator->average();}
复制代码


我们使用Visitor模式来处理这种可以有空对象行为的对象。


没有 Null


此外,我们使用多态性去掉了不必要的 if,并通过开/闭原则将解决方案留给了其他非 average 的 calculation 来处理。


我们没有使用太多算法,但构建了一个但更具声明性、可维护性和可扩展性的解决方案。

使用显式支持不存在类型的语言

有些语言支持可选的 Maybe/Optional 概念,这是在语言级别实现上述解决方案的一个特殊情况。

结论

在我们的行业中,根据很多影响深远的实践得出的经验,使用 Null 是不可取的做法。尽管如此,几乎所有的商业语言都支持它,开发人员也都在使用它。


我们至少应该开始质疑它的使用,并在开发软件时更加成熟和负责。


本系列文章的一个目标是开拓关于软件设计的辩论和讨论的空间。我们期待着看到对这篇文章的评论。


英文原文:NULL: The Billion Dollar Mistake


2020-06-25 10:003305
用户头像

发布了 152 篇内容, 共 73.6 次阅读, 收获喜欢 64 次。

关注

评论

发布
暂无评论
发现更多内容

MacMagic for Mac(系统垃圾清理软件)v1.2.2激活版

Rose

CLO Standalone OnlineAuth for Mac(3D可视化服装设计软件)v2024.2.160激活版

Rose

基于HarmonyOS 5.0(NEXT)与SpringCloud架构的跨平台应用开发与服务集成研究【实战】

申公豹

HarmonyOS

HarmonyOS 5.0 Next实战应用开发—‘我的家乡’【HarmonyOS Next华为公司完全自研的操作系统】

申公豹

HarmonyOS

Python Class 类详解:定义、继承与特殊方法的使用

敲代码不忘补水

Python 继承 科技 计算机科学与技术

AIP智能体平台:助力软件行业数字化转型与智能升级

大东(AIP内容运营专员)

人工智能

从0到1:基于SSM的校园社团活动报名小程序开发笔记(中)

CC同学

淘宝京东电商商品SKU信息抓取API测试实战指南

代码忍者

淘宝API接口 京东API接口

Scherlokk for Mac(文件搜索软件)v6.3.3激活版

Rose

面试了个阿里P7大佬,他让我见识到什么才是“精通高并发与调优”

程序员高级码农

Java 编程 程序员 java面试 Java面试题

《计算机组成及汇编语言原理》阅读笔记:p128-p132

codists

计算机组成及汇编语言原理

Python 函数使用指南:定义、参数设置与变量作用域详解

敲代码不忘补水

Python 变量 函数 科技 计算机科学与技术

INFINI Console 指标采集优化

极限实验室

console metrics

Omnissa Horizon Clients 2412 发布 - 虚拟桌面基础架构 (VDI) 和应用软件

sysin

horizon

AIP智能体平台:引领教育培训的新时代

大东(AIP内容运营专员)

人工智能

大模型能让智能推荐更智能吗?

JustYan

人工智能 大模型 智能推荐 生成式AI 生成式 AI 应用

Omnissa App Volumes 4, version 2412 - 实时应用程序交付系统

sysin

horizon Omnissa

Omnissa ThinApp 2412 - 应用虚拟化软件

sysin

horizon Omnissa

Clone Fighter for Mac(重复文件查找删除软件)v2.1激活版

Rose

AIP智能体平台:推动多智能体系统创新与效率提升

大东(AIP内容运营专员)

人工智能

AIP智能体平台:开启智能自动化新时代

大东(AIP内容运营专员)

人工智能

XMind Pro思维导图许可证 mac&win

Rose

部署 及 使用 etl crontab 和 etl engine

weigeonlyyou

Go 大数据 Influxdb ETL Click house

抢占先机!2025,三大认知降低To B赛道门槛

禅道项目管理

企业管理 经营管理

Mellel 6:专业级文字处理,轻松驾驭长文创作

Rose

橱窗LED透明屏:开启商业展示新纪元

Dylan

技术 应用 热点 LED display LED显示屏

从0到100:基于Java的大学选修课选课小程序开发笔记(上)

CC同学

LLM Scalable Oversight新探:辩论法与博弈法的较量

代码忍者

自学记录鸿蒙API 13:实现多目标识别Object Detection

李游Leo

鸿蒙 HarmonyOS HarmonyOS NEXT

Topaz Photo AI:一键重塑照片魅力,解锁专业级画质

Rose

智能网联汽车产业发展的中国方案:车路云一体化系统

芯盾时代

车联网 物联网 智能网联

Null:价值10亿美元的错误_文化 & 方法_Maximiliano Contieri_InfoQ精选文章