用心理学技术更好地进行评估

偏差（bias）、启动（priming）和显著（salience）是影响我们评估能力的心理因素。了解评估时会发生什么心理变化，并使用心理学的技术，有助于我们处理好这些因素，以便能够改进评估，社会复杂性科学家和心理学博士 Joseph Pelrine 说。

在敏捷和软件架构2016 专题研讨会上，Pelrine 做了开幕演讲，在其中他讨论了评估的心理方面。InfoQ 以问答、总结和文章对本次大会进行了全程报道。

做评估时，我们首先要准备好所使用语言，Pelrine 说道。请求评估时所用的措辞会导致截然不同的数字。他引用了由Loftus 和 Palmer 完成的 “汽车损毁重建”的实验，在这个实验里，向团队询问汽车速度相关的问题，使用不同的词汇会导致不同的评估，比如“粉碎”或“碰撞”。

大多数人计算速度时使用滑动窗口平均法，但这是错误的，Pelrine 说道。你不得不质疑所有时间点是否都同等重要，例如团队组成已经发生变化了，或该团队是否已经改进了他们的工作方式。能给出更好速度评估的解决方案是减少用于计算平均值的迭代数，或使用指数加权公式。

InfoQ 有幸采访了 Pelrine，请他谈了谈当人们做评估时大脑里会出现的认知过程，为什么有一些实践明明没有迹象证明它的有效性人们却还一直在使用它们，影响人们工作能力的心理因素，用于进行评估的心理学技术，为什么人们不喜欢做评估，以及评估工作的方法。

InfoQ：人们做评估时大脑里会出现哪些认知过程？

Joseph Pelrine：要全面回答它就需要深入探讨神经学了，也就是大脑的“硬件”，这不是我的专长。

认知过程是“软件”，它运行在我们的大脑这个“硬件”之上。它们大概可以粗略划分以下两类：潜意识运行系统，以及有意识的应用层，尽管它们之间是逐渐过渡和无缝衔接的。

评估是一个创造性的决策过程，适合在基于首次拟合模式匹配过程的潜意识层，它已经得到了数千年的进化 (Klein 于 1999 年提出)。外部输入经过有意识的应用层，传至模式匹配引擎，它把它们和我们的经验数据库相比较，制定决策，然后把合理的表达传递回来。这个过程受三个因素的严重影响：认知偏差、启动（在这种情况下表现为刺激温和派的响应），以及显著（即我们考虑某件事如何成为相关的和重要的）。

InfoQ：有一些实践明明没有迹象证明它的有效性，甚至于还有迹象表明它们根本没效果，但有时人们却仍然在使用它们。是什么让人们坚持使用这些实践的？

Pelrine：这有很多可能的原因。习惯的力量。对未知的恐惧。习惯新的工作方式需要时间。仅试图让一个开发人员改变他的代码格式风格都很难，更别说他的 IDE 了！“磨磨你的斧头！”在森林里，旅行者对缓慢地砍着树的农夫说。“我可没那个时间！”这个农夫答道，“我还得砍树呢。”

人类发明了仪式，将其作为把秩序和结构带进生活的一种方式。仪式给予舒适感、亲切感，有助于减少认知负担，从而释放认知资源去处理更紧急的挑战。

InfoQ：哪些心理因素会影响人们的评估能力？

Pelrine：太多了，有很多的因素。首先是记忆的整个领域，它涉及了我们认识过程中神经和心理这两个方面。然后是之前提到的三个因素：偏差、启动，以及显著。

尽管对于我来说，最重要的一个因素是 Kahneman 和 Tversky（1973 年）的计划谬论，这是一个很具开创性的理论，获得了诺贝尔经济学奖。

“计划谬论是一种倾向于忽视数据分布而采用‘内部方式’进行预测的结果，它专注于具体问题的构成，而不是在类似情况下结果的分布情况。这种内部方式对计划的预估很容易导致估计不足。” （Kahneman 和 Tversky，1977 年）

InfoQ：如何来应对这些因素？

Pelrine：第一步是仅仅形成和提升这些认知过程的意识，以便不让这种事总发生在纯粹的潜意识层。意识到并接受大脑试图采取的行动是你最感兴趣的事情！下一步应该是去使用新的技术和心理学方法去帮助提供评估过程的质量。

InfoQ：你推荐做评估时采用哪些心理学技术？

Pelrine：其实，我们中的大多数人每天都已经在使用一个基于心理学的技术了。它被称为解构（unpacking）（Kruger 和 Evans，2004 年提出），我们是把它当做任务分解来理解的。解构通过对要达成目标的所有步骤予以分析来帮助提升评估的质量，这有助于确保所有事都考虑到了，没有遗漏。

其他一些简单技术还有：

评估时避免注意力不集中（Day 等人于 2009 年提出）

考虑一天的时间——评估会放在早晨效率会更高（Blatter 和 Cajochen 于 2007 年提出）

保持评估会议的简短——不要超过 90 分钟。（Broughton 于 1975 年提出）

Danziger 等人就自我损耗和决策疲劳的研究中推荐了以下技术：

采取经常性的短暂休息（Tyler 和 Burns 于 2008 年提出）

保持一个积极的心态，并在间隙区间休息（Tice 等人在 2007 年提出）

补充些葡萄糖去抵消自我的损耗（Gailliot 等人于 2007 年提出）

InfoQ：许多人不喜欢去做评估，你能说说这是为什么吗？

Pelrine：评估通常会被当成必须得做的例行公事，其实许多人质疑它的价值。评估被看作是承诺哪些开发人员由管理者来掌控。许多开发人员通常缺少工具和技术。最后，你不得不接受事后诸葛亮的现象，在面对复杂的系统时事前并不知道该怎么办。

InfoQ：你推荐用什么方式进行评估工作？

Pelrine：一个非常好的方法是参考同类的预测（Flyvbjerg，2008 年提出），这是依据 Kahneman 和 Tversky 对软件评估的研究发展成的一种方法。

针对任务层的评估，我发明了生物钟学法，称为“Quattro Stagioni”法，它基于的是 Kleitman 对基本休息活动周期（Basic Rest Activity Cycle）的研究。简单解释一下，评估的单位不是像故事点这种人为的单位，而是 90 分钟的自然周期。本质上，你可以把每天大概分为 4 个 90 分钟，一天从休息时间开始，在休息之后到午饭时间，在午饭之后到休息时间，然后以休息结束这一天，评估即中间的部分。

InfoQ：你有更深入的认知和社会心理学方面的理论或研究资料吗？

Pelrine：除上面提到的研究之外，我强烈推荐Daniel Kahneman 的《思考，快与慢》（2011 年著）和 Dan Ariely 的《怪诞行为学》，因为它们比大多数心理论文更容易被外行阅读理解。

查看英文原文： Better Estimations Using Techniques from Psychology

创作场景

用心理学技术更好地进行评估