开工福利|免费学 2200+ 精品线上课,企业成员人人可得! 了解详情
写点什么

隔空论战:DeepMind 声称用 AI 首次在量子尺度上模拟物质,俄罗斯科学家不同意了

  • 2022-09-09
    北京
  • 本文字数:2360 字

    阅读完需:约 8 分钟

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了

科学研究的突破成果总是引人注目、鼓舞人心。但当不同立场的科学家群体对成果的看法存在差异时,往往激发科学辩论。


近期,科技圈的一场学术争论引起热议。


谷歌母公司 Alphabet 旗下的研究公司 DeepMind 去年在 Science 杂志上发表了一篇精彩的研究论文,该论文声称,他们已经解决了“用 AI 在量子尺度上模拟物质”的巨大挑战。


如果论文的结论属实,这项前沿研究可以称得上影响深远。本质上讲,我们讨论的是使用人工智能来发现更多操纵物质组成元素的新方法,这是这项研究的潜力所在。


八个月后,由俄罗斯和韩国科学家组成的一个学术研究团队(成员包括 7 位俄罗斯科学家,1 位韩国科学家)对 DeepMind 的研究成果提出了异议。他们可能已经发现了 DeepMind 研究中的一个问题,该问题动摇了整个论文结论的可靠性。

DeepMind 新研究

DeepMind 这项研究的核心理念是设法模拟量子的相互作用。我们的世界是由物质组成的,而物质又是由原子构成的分子组成的。级别越小,模拟起来就越难。


深入到存在于原子内部的量子层级,模拟潜在相互作用就成为了极具挑战性的问题。


DeepMind 在一篇博客文章中提到,


要在计算机上做到这一点,需要对电子进行模拟。电子是控制原子结合形成分子的亚原子粒子,也负责固体中的电流流动。


尽管业界数十年来在该方向上不断努力,并取得了一些重大进展,但准确地模拟电子的量子力学行为仍是待解决的挑战。这里的基本问题是,计算机很难预测给定电子最终到达特定位置的概率。添加的电子越多,问题越复杂。


正如 DeepMind 在同一篇博文中指出的那样,1960 年代的两位物理学家取得了一项突破:


Pierre Hohenberg 和 Walter Kohn 意识到,我们没必要单独跟踪每个电子。相比之下,只要知道任何电子在每个位置的概率(即电子密度)就足以准确计算所有相互作用。Kohn 在证明这一点后获得了诺贝尔化学奖,密度泛函理论(Density Functional Theory,DFT)由此诞生。不幸的是,DFT 只能把流程简化到这一步了。该理论的“泛函”部分需要人类来完成所有繁重的工作。


去年 12 月,事情出现了转机。当时 DeepMind 发表了一篇题为“通过解决分数电子问题推动密度泛函的前沿研究”的论文。


在该论文中,DeepMind 团队声称通过开发一个神经网络,从根本上改进了当前用于模拟量子行为的方法:


通过将泛函表示为神经网络,并将这些明确的属性整合到训练数据中,我们学到了泛函结果,而且没有严重的系统性错误——从而更好地描述了一系列化学反应。

学者提出尖锐质疑

DeepMind 的论文通过了最初的正式审查流程,一切顺利。转折点出现在 2022 年 8 月,一个由来自俄罗斯和韩国的八名学者组成的团队在 Science 上发表了一篇评论文章质疑其结论。


根据斯科尔科沃科学技术学院的这篇评论文章:


从已发布的结果中,并不能证明 DeepMind AI 具备推断此类系统行为的能力,论文结论需要重新审视。换句话说:学者们正在争论 DeepMind 的人工智能是如何得出结论的。


根据评论作者的说法,DeepMind 用于构建其神经网络的训练过程教神经网络记住了在基准测试期间将面对的特定问题的答案——这种测试是科学家确定一种方法是否优于另一种方法的过程。


研究人员在评论中写道:


虽然 Kirkpatrick 等人的结论,也就是关于 FC/FS 系统在训练集中的作用可能是正确的,但这并不是对他们观察到的结果唯一可能的解释。


在我们看来,DM21 在 BBB 测试数据集上的性能相对于 DM21m 的改进可能是由一个更平淡无奇的原因引起的:训练数据集和测试数据集之间出现了意外重叠。如果这是真的,那就意味着 DeepMind 实际上并没有教会神经网络来预测量子力学。

DeepMind 迅速回应

DeepMind 反应迅速。


该公司在上述评论发表的同一天做出了回应,回击迅速而坚定:


我们不同意他们的分析,并认为他们提出的观点要么不正确,要么与论文的主要结论以及对 DM21 总体质量的评估无关。团队在反驳文章中进一步阐述了理由:


DM21 不记忆数据;DM21 的 Exchange-Correlation 会随着 BBB 中考虑的一系列距离参数而变化,并且不等于无限分离极限,如图 1 中对于 H2+和 H2 的 A 和 B 所示,从这里就能看出来 DM21 并不会记忆数据了。


例如,在 6Å处,DM21 Exc 与 H2+和 H2 的无限极限相差约 13kcal/mol(尽管方向相反)。虽说本文没办法解释清楚上面这段话的含义,但我们可以有把握地假设,DeepMind 很可能已经为这条反对意见做好了准备。


至于这是否能解决问题还有待观察。在这一点上,我们还没有看到俄罗斯和韩国专家组成的学术团队的进一步反驳,不知道他们的担忧是否得到了缓解。

科学“僵局”

这次讨论的影响可能远不止于这一篇研究论文。


随着人工智能和量子科学领域越来越紧密地交织在一起,这方面的研究也逐渐被财力雄厚的企业研究机构所主导。


如果出现了科学“僵局”,对立双方无法通过科学方法就特定技术方法的有效性达成一致——而其中又掺杂了企业利益时,会发生什么?


问题的核心可能在于人们无法解释人工智能模型如何“处理数字”来得出结论。


这些系统在输出答案之前可以经过数百万次排列。我们不可能解释这个过程的每一步,这正是为什么我们需要算法捷径和人工智能来用蛮力解决人类或计算机无法直接突破的大规模问题。


最终,随着人工智能系统的不断扩展,我们可能不会再有什么工具来了解它们的运行机制。当这种情况发生时,我们可能就会看到企业拥有的技术与通过外部同行评审的技术之间存在差异。


这并不是说 DeepMind 的论文就是一个例子。正如做出评论的学术团队在他们的评论文章中所写到的:


在训练集中使用分数电子系统并不是 DeepMind 工作中唯一的创新之处。他们通过训练集将物理约束引入神经网络的想法,以及通过对正确化学势的训练来赋予物理意义的方法,未来可能会广泛用于神经网络 DFT 泛函的构建。但我们正在见证一种大胆的、全新的、人工智能驱动的技术范式。现在我们可能要开始为一个没有同行评审的未来做准备了。


原文链接:


https://thenextweb.com/news/deepmind-feuds-russian-scientists-over-quantum-ai-research


2022-09-09 14:094531
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 547.6 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

Qt(C++)开发一款图片防盗用水印制作小工具

DS小龙哥

6 月 优质更文活动

基于Python和TensorFlow实现BERT模型应用

华为云开发者联盟

人工智能 深度学习 华为云 华为云开发者联盟 企业号2024年6月PK榜

低代码平台如何重塑项目管理:效率与创新的新边界

天津汇柏科技有限公司

项目管理 低代码

GeminiDB全面联动MySQL:热点数据,一键加速

华为云开发者联盟

MySQL 数据库 华为云 华为云开发者联盟 企业号2024年6月PK榜

合成数据:解锁通用人工智能的“关键之钥”?

Baihai IDP

AI 合成数据 LLMs 企业号 6 月 PK 榜

万字解析 Go 官方结构化日志包 slog

江湖十年

Go 日志 log Go web #后端

聊聊性能指标CPU利用率如何计算的

派大星

性能指标

ICE构建坚不可摧的交易环境

科技热闻

11年之约 聚焦上海 | 亚信科技邀您相约2024 MWC上海展

亚信AntDB数据库

AntDB MWC 企业号 6 月 PK 榜 亚信安慧antdb

信创生态+1!天谋科技与百信完成兼容性互认证

Apache IoTDB

官答丨操作系统升级 Openssl 导致 GreatSQL 无法启动

GreatSQL

数据库 greatsql

ICE构建坚不可摧的交易环境

科技汇

信创好搭档,企业好选择| 亚信安慧AntDB诚邀您参与企业数智化升级云端研讨会

亚信AntDB数据库

数据库 AntDB 信创产业 企业号 6 月 PK 榜 亚信安慧antdb

OpenAI封锁中国API?天工助您一键搬家!

新消费日报

什么是开源软件 (OSS)?

NGINX开源社区

OSS 源代码 开源软件 SBOM 开源软件的优势

Android网络面试题之Http1.1和Http2.0

AntDream

面试 网络 Android;

美国安腾Anton,全球最强生物计算专用超级计算机的前世今生

Geek_2d6073

VMware ESXi 8.0U2c macOS Unlocker & OEM BIOS Dell (戴尔) 定制版

sysin

macos esxi OEM BIOS dell

Unity 确认参展 2024 ChinaJoy BTOB,展示应用出海增长全链路解决方案

Geek_2d6073

业务和技术,哪个更重要?

老张

技术 业务

性能测试公开课来啦!从性能测试方案到性能调优,从负载均衡到中间件测试,全方位讲解性能测试核心内容

测试人

软件测试

零信任三大产品板块快速发展

芯盾时代

iam 零信任 微隔离 零信任模型 sdp

一文读懂:大数据可视化

AR玩家

大数据 可视化数据 Rokid Vision pro 炬目AR

1kx:如何突破预测市场的瓶颈

TechubNews

Percona Toolkit 神器全攻略(配置类)

GreatSQL

数据库 greatsql

PHP 之道笔记整理:最佳实践与安全指南

左诗右码

php

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了_AI&大模型_Tristan Greene_InfoQ精选文章