速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

隔空论战:DeepMind 声称用 AI 首次在量子尺度上模拟物质,俄罗斯科学家不同意了

  • 2022-09-09
    北京
  • 本文字数:2360 字

    阅读完需:约 8 分钟

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了

科学研究的突破成果总是引人注目、鼓舞人心。但当不同立场的科学家群体对成果的看法存在差异时,往往激发科学辩论。


近期,科技圈的一场学术争论引起热议。


谷歌母公司 Alphabet 旗下的研究公司 DeepMind 去年在 Science 杂志上发表了一篇精彩的研究论文,该论文声称,他们已经解决了“用 AI 在量子尺度上模拟物质”的巨大挑战。


如果论文的结论属实,这项前沿研究可以称得上影响深远。本质上讲,我们讨论的是使用人工智能来发现更多操纵物质组成元素的新方法,这是这项研究的潜力所在。


八个月后,由俄罗斯和韩国科学家组成的一个学术研究团队(成员包括 7 位俄罗斯科学家,1 位韩国科学家)对 DeepMind 的研究成果提出了异议。他们可能已经发现了 DeepMind 研究中的一个问题,该问题动摇了整个论文结论的可靠性。

DeepMind 新研究

DeepMind 这项研究的核心理念是设法模拟量子的相互作用。我们的世界是由物质组成的,而物质又是由原子构成的分子组成的。级别越小,模拟起来就越难。


深入到存在于原子内部的量子层级,模拟潜在相互作用就成为了极具挑战性的问题。


DeepMind 在一篇博客文章中提到,


要在计算机上做到这一点,需要对电子进行模拟。电子是控制原子结合形成分子的亚原子粒子,也负责固体中的电流流动。


尽管业界数十年来在该方向上不断努力,并取得了一些重大进展,但准确地模拟电子的量子力学行为仍是待解决的挑战。这里的基本问题是,计算机很难预测给定电子最终到达特定位置的概率。添加的电子越多,问题越复杂。


正如 DeepMind 在同一篇博文中指出的那样,1960 年代的两位物理学家取得了一项突破:


Pierre Hohenberg 和 Walter Kohn 意识到,我们没必要单独跟踪每个电子。相比之下,只要知道任何电子在每个位置的概率(即电子密度)就足以准确计算所有相互作用。Kohn 在证明这一点后获得了诺贝尔化学奖,密度泛函理论(Density Functional Theory,DFT)由此诞生。不幸的是,DFT 只能把流程简化到这一步了。该理论的“泛函”部分需要人类来完成所有繁重的工作。


去年 12 月,事情出现了转机。当时 DeepMind 发表了一篇题为“通过解决分数电子问题推动密度泛函的前沿研究”的论文。


在该论文中,DeepMind 团队声称通过开发一个神经网络,从根本上改进了当前用于模拟量子行为的方法:


通过将泛函表示为神经网络,并将这些明确的属性整合到训练数据中,我们学到了泛函结果,而且没有严重的系统性错误——从而更好地描述了一系列化学反应。

学者提出尖锐质疑

DeepMind 的论文通过了最初的正式审查流程,一切顺利。转折点出现在 2022 年 8 月,一个由来自俄罗斯和韩国的八名学者组成的团队在 Science 上发表了一篇评论文章质疑其结论。


根据斯科尔科沃科学技术学院的这篇评论文章:


从已发布的结果中,并不能证明 DeepMind AI 具备推断此类系统行为的能力,论文结论需要重新审视。换句话说:学者们正在争论 DeepMind 的人工智能是如何得出结论的。


根据评论作者的说法,DeepMind 用于构建其神经网络的训练过程教神经网络记住了在基准测试期间将面对的特定问题的答案——这种测试是科学家确定一种方法是否优于另一种方法的过程。


研究人员在评论中写道:


虽然 Kirkpatrick 等人的结论,也就是关于 FC/FS 系统在训练集中的作用可能是正确的,但这并不是对他们观察到的结果唯一可能的解释。


在我们看来,DM21 在 BBB 测试数据集上的性能相对于 DM21m 的改进可能是由一个更平淡无奇的原因引起的:训练数据集和测试数据集之间出现了意外重叠。如果这是真的,那就意味着 DeepMind 实际上并没有教会神经网络来预测量子力学。

DeepMind 迅速回应

DeepMind 反应迅速。


该公司在上述评论发表的同一天做出了回应,回击迅速而坚定:


我们不同意他们的分析,并认为他们提出的观点要么不正确,要么与论文的主要结论以及对 DM21 总体质量的评估无关。团队在反驳文章中进一步阐述了理由:


DM21 不记忆数据;DM21 的 Exchange-Correlation 会随着 BBB 中考虑的一系列距离参数而变化,并且不等于无限分离极限,如图 1 中对于 H2+和 H2 的 A 和 B 所示,从这里就能看出来 DM21 并不会记忆数据了。


例如,在 6Å处,DM21 Exc 与 H2+和 H2 的无限极限相差约 13kcal/mol(尽管方向相反)。虽说本文没办法解释清楚上面这段话的含义,但我们可以有把握地假设,DeepMind 很可能已经为这条反对意见做好了准备。


至于这是否能解决问题还有待观察。在这一点上,我们还没有看到俄罗斯和韩国专家组成的学术团队的进一步反驳,不知道他们的担忧是否得到了缓解。

科学“僵局”

这次讨论的影响可能远不止于这一篇研究论文。


随着人工智能和量子科学领域越来越紧密地交织在一起,这方面的研究也逐渐被财力雄厚的企业研究机构所主导。


如果出现了科学“僵局”,对立双方无法通过科学方法就特定技术方法的有效性达成一致——而其中又掺杂了企业利益时,会发生什么?


问题的核心可能在于人们无法解释人工智能模型如何“处理数字”来得出结论。


这些系统在输出答案之前可以经过数百万次排列。我们不可能解释这个过程的每一步,这正是为什么我们需要算法捷径和人工智能来用蛮力解决人类或计算机无法直接突破的大规模问题。


最终,随着人工智能系统的不断扩展,我们可能不会再有什么工具来了解它们的运行机制。当这种情况发生时,我们可能就会看到企业拥有的技术与通过外部同行评审的技术之间存在差异。


这并不是说 DeepMind 的论文就是一个例子。正如做出评论的学术团队在他们的评论文章中所写到的:


在训练集中使用分数电子系统并不是 DeepMind 工作中唯一的创新之处。他们通过训练集将物理约束引入神经网络的想法,以及通过对正确化学势的训练来赋予物理意义的方法,未来可能会广泛用于神经网络 DFT 泛函的构建。但我们正在见证一种大胆的、全新的、人工智能驱动的技术范式。现在我们可能要开始为一个没有同行评审的未来做准备了。


原文链接:


https://thenextweb.com/news/deepmind-feuds-russian-scientists-over-quantum-ai-research


2022-09-09 14:094494
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 539.0 次阅读, 收获喜欢 1977 次。

关注

评论

发布
暂无评论
发现更多内容

软件测试学习笔记丨人工智能 | mixtral大模型

测试人

人工智能 软件测试

使用豆包MarsCode 来处理 Excel 的数据吧!

豆包MarsCode

人工智能 程序员 AI

全局视角看技术-Java多线程演进史

京东科技开发者

Adobe Creative Cloud 创意应用软件 可解决adobe安装过程中的大部分问题

Rose

大模型时代的数据治理之道|StartDT Talk

奇点云

人工智能 大数据 AI 数据治理 大模型

CNCC | 超强阵容!CCF-网易雷火联合基金研讨会嘉宾率先揭晓

网易伏羲

人工智能 网易伏羲 cncc

【质量视角】可观测性背景下的质量保障思路

京东科技开发者

基于开源IM即时通讯框架MobileIMSDK:RainbowChat v11.7版已发布

JackJiang

MobileIMSDK 即时通讯;IM;网络编程 RainbowChat

Caffeine学习笔记

京东科技开发者

火山引擎数智平台VeDI:A/B实验互斥域流量分配体系上线

字节跳动数据平台

ab测试

GreatSQL 在SQL中使用 HINT 语法修改会话变量

GreatSQL

数据库

QCA9880 vs QCA9882: Finding the Perfect Wi-Fi Solution for Your Business

wallyslilly

QCA9880 QCA9882

为什么说“全面绩效”是企业管理的必选项?

ToB行业头条

Final Cut Pro:视频剪辑新纪元,创意无限!

Rose

基于Ascend C的Matmul算子性能优化最佳实践

华为云开发者联盟

人工智能 性能优化 算子 Ascend

Excelize 开源基础库 2.9.0 版本正式发布

xuri

golang 开源 办公自动化 Excelize 办公软件

AlDente Pro:苹果电脑电池寿命延长工具

Rose

Navicat Premium:数据库全能管家,管理无忧!

Rose

在Abaqus中施加恒定载荷应选择静态还是动态分析步?

思茂信息

载荷 abaqus 有限元分析

adobe ai 2021功能介绍 及破解安装教程(Mac/win)

Rose

RAG vs 长上下文 LLMs:谁主沉浮?

Baihai IDP

程序员 AI LLMs rag Baihai IDP

用户的声音| 出色的表格解析能力!TextIn文档解析助力金融信息化企业数据底座建设

合合技术团队

金融 #科技

IPQ9574,IPQ5322,IPQ9570-WiFi 7 chip diversity: Performance, application and market differences analysis

wifi6-yiyi

5G router WiFi7

如何借助AI在两小时内快速部署自己的小程序

Geek_2305a8

哪里有Axure RP 10激活码? Axure RP 10 for mac永久授权码分享

Rose

免费BT资源下载利器 BitComet(比特彗星)

Rose

强大的局域网远程播放 nPlayer for Mac v1.4.0中文激活版

Rose

2024海南等保测评机构名单汇总

行云管家

等保 等保测评 海南

如何用支付宝实现靠脸吃饭

盐焗代码虾

支付宝 刷脸支付 一脸通行

淘宝商品评论API:获取商品升级迭代后的用户反馈

技术冰糖葫芦

API 接口 API 文档 API 测试 API 性能测试

阿里架构师:天天高并发,这个时代达不到百万以上的并发量都不叫高并发!!!

程序员高级码农

多线程 架构师 Java高并发 Java’ 高并发‘’

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了_AI&大模型_Tristan Greene_InfoQ精选文章