科学研究的突破成果总是引人注目、鼓舞人心。但当不同立场的科学家群体对成果的看法存在差异时,往往激发科学辩论。
近期,科技圈的一场学术争论引起热议。
谷歌母公司 Alphabet 旗下的研究公司 DeepMind 去年在 Science 杂志上发表了一篇精彩的研究论文,该论文声称,他们已经解决了“用 AI 在量子尺度上模拟物质”的巨大挑战。
如果论文的结论属实,这项前沿研究可以称得上影响深远。本质上讲,我们讨论的是使用人工智能来发现更多操纵物质组成元素的新方法,这是这项研究的潜力所在。
八个月后,由俄罗斯和韩国科学家组成的一个学术研究团队(成员包括 7 位俄罗斯科学家,1 位韩国科学家)对 DeepMind 的研究成果提出了异议。他们可能已经发现了 DeepMind 研究中的一个问题,该问题动摇了整个论文结论的可靠性。
DeepMind 新研究
DeepMind 这项研究的核心理念是设法模拟量子的相互作用。我们的世界是由物质组成的,而物质又是由原子构成的分子组成的。级别越小,模拟起来就越难。
深入到存在于原子内部的量子层级,模拟潜在相互作用就成为了极具挑战性的问题。
DeepMind 在一篇博客文章中提到,
要在计算机上做到这一点,需要对电子进行模拟。电子是控制原子结合形成分子的亚原子粒子,也负责固体中的电流流动。
尽管业界数十年来在该方向上不断努力,并取得了一些重大进展,但准确地模拟电子的量子力学行为仍是待解决的挑战。这里的基本问题是,计算机很难预测给定电子最终到达特定位置的概率。添加的电子越多,问题越复杂。
正如 DeepMind 在同一篇博文中指出的那样,1960 年代的两位物理学家取得了一项突破:
Pierre Hohenberg 和 Walter Kohn 意识到,我们没必要单独跟踪每个电子。相比之下,只要知道任何电子在每个位置的概率(即电子密度)就足以准确计算所有相互作用。Kohn 在证明这一点后获得了诺贝尔化学奖,密度泛函理论(Density Functional Theory,DFT)由此诞生。不幸的是,DFT 只能把流程简化到这一步了。该理论的“泛函”部分需要人类来完成所有繁重的工作。
去年 12 月,事情出现了转机。当时 DeepMind 发表了一篇题为“通过解决分数电子问题推动密度泛函的前沿研究”的论文。
在该论文中,DeepMind 团队声称通过开发一个神经网络,从根本上改进了当前用于模拟量子行为的方法:
通过将泛函表示为神经网络,并将这些明确的属性整合到训练数据中,我们学到了泛函结果,而且没有严重的系统性错误——从而更好地描述了一系列化学反应。
学者提出尖锐质疑
DeepMind 的论文通过了最初的正式审查流程,一切顺利。转折点出现在 2022 年 8 月,一个由来自俄罗斯和韩国的八名学者组成的团队在 Science 上发表了一篇评论文章质疑其结论。
根据斯科尔科沃科学技术学院的这篇评论文章:
从已发布的结果中,并不能证明 DeepMind AI 具备推断此类系统行为的能力,论文结论需要重新审视。换句话说:学者们正在争论 DeepMind 的人工智能是如何得出结论的。
根据评论作者的说法,DeepMind 用于构建其神经网络的训练过程教神经网络记住了在基准测试期间将面对的特定问题的答案——这种测试是科学家确定一种方法是否优于另一种方法的过程。
研究人员在评论中写道:
虽然 Kirkpatrick 等人的结论,也就是关于 FC/FS 系统在训练集中的作用可能是正确的,但这并不是对他们观察到的结果唯一可能的解释。
在我们看来,DM21 在 BBB 测试数据集上的性能相对于 DM21m 的改进可能是由一个更平淡无奇的原因引起的:训练数据集和测试数据集之间出现了意外重叠。如果这是真的,那就意味着 DeepMind 实际上并没有教会神经网络来预测量子力学。
DeepMind 迅速回应
DeepMind 反应迅速。
该公司在上述评论发表的同一天做出了回应,回击迅速而坚定:
我们不同意他们的分析,并认为他们提出的观点要么不正确,要么与论文的主要结论以及对 DM21 总体质量的评估无关。团队在反驳文章中进一步阐述了理由:
DM21 不记忆数据;DM21 的 Exchange-Correlation 会随着 BBB 中考虑的一系列距离参数而变化,并且不等于无限分离极限,如图 1 中对于 H2+和 H2 的 A 和 B 所示,从这里就能看出来 DM21 并不会记忆数据了。
例如,在 6Å处,DM21 Exc 与 H2+和 H2 的无限极限相差约 13kcal/mol(尽管方向相反)。虽说本文没办法解释清楚上面这段话的含义,但我们可以有把握地假设,DeepMind 很可能已经为这条反对意见做好了准备。
至于这是否能解决问题还有待观察。在这一点上,我们还没有看到俄罗斯和韩国专家组成的学术团队的进一步反驳,不知道他们的担忧是否得到了缓解。
科学“僵局”
这次讨论的影响可能远不止于这一篇研究论文。
随着人工智能和量子科学领域越来越紧密地交织在一起,这方面的研究也逐渐被财力雄厚的企业研究机构所主导。
如果出现了科学“僵局”,对立双方无法通过科学方法就特定技术方法的有效性达成一致——而其中又掺杂了企业利益时,会发生什么?
问题的核心可能在于人们无法解释人工智能模型如何“处理数字”来得出结论。
这些系统在输出答案之前可以经过数百万次排列。我们不可能解释这个过程的每一步,这正是为什么我们需要算法捷径和人工智能来用蛮力解决人类或计算机无法直接突破的大规模问题。
最终,随着人工智能系统的不断扩展,我们可能不会再有什么工具来了解它们的运行机制。当这种情况发生时,我们可能就会看到企业拥有的技术与通过外部同行评审的技术之间存在差异。
这并不是说 DeepMind 的论文就是一个例子。正如做出评论的学术团队在他们的评论文章中所写到的:
在训练集中使用分数电子系统并不是 DeepMind 工作中唯一的创新之处。他们通过训练集将物理约束引入神经网络的想法,以及通过对正确化学势的训练来赋予物理意义的方法,未来可能会广泛用于神经网络 DFT 泛函的构建。但我们正在见证一种大胆的、全新的、人工智能驱动的技术范式。现在我们可能要开始为一个没有同行评审的未来做准备了。
原文链接:
https://thenextweb.com/news/deepmind-feuds-russian-scientists-over-quantum-ai-research
评论