报名参加CloudWeGo黑客松,奖金直推双丰收! 了解详情
写点什么

隔空论战:DeepMind 声称用 AI 首次在量子尺度上模拟物质,俄罗斯科学家不同意了

  • 2022-09-09
    北京
  • 本文字数:2360 字

    阅读完需:约 8 分钟

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了

科学研究的突破成果总是引人注目、鼓舞人心。但当不同立场的科学家群体对成果的看法存在差异时,往往激发科学辩论。


近期,科技圈的一场学术争论引起热议。


谷歌母公司 Alphabet 旗下的研究公司 DeepMind 去年在 Science 杂志上发表了一篇精彩的研究论文,该论文声称,他们已经解决了“用 AI 在量子尺度上模拟物质”的巨大挑战。


如果论文的结论属实,这项前沿研究可以称得上影响深远。本质上讲,我们讨论的是使用人工智能来发现更多操纵物质组成元素的新方法,这是这项研究的潜力所在。


八个月后,由俄罗斯和韩国科学家组成的一个学术研究团队(成员包括 7 位俄罗斯科学家,1 位韩国科学家)对 DeepMind 的研究成果提出了异议。他们可能已经发现了 DeepMind 研究中的一个问题,该问题动摇了整个论文结论的可靠性。

DeepMind 新研究

DeepMind 这项研究的核心理念是设法模拟量子的相互作用。我们的世界是由物质组成的,而物质又是由原子构成的分子组成的。级别越小,模拟起来就越难。


深入到存在于原子内部的量子层级,模拟潜在相互作用就成为了极具挑战性的问题。


DeepMind 在一篇博客文章中提到,


要在计算机上做到这一点,需要对电子进行模拟。电子是控制原子结合形成分子的亚原子粒子,也负责固体中的电流流动。


尽管业界数十年来在该方向上不断努力,并取得了一些重大进展,但准确地模拟电子的量子力学行为仍是待解决的挑战。这里的基本问题是,计算机很难预测给定电子最终到达特定位置的概率。添加的电子越多,问题越复杂。


正如 DeepMind 在同一篇博文中指出的那样,1960 年代的两位物理学家取得了一项突破:


Pierre Hohenberg 和 Walter Kohn 意识到,我们没必要单独跟踪每个电子。相比之下,只要知道任何电子在每个位置的概率(即电子密度)就足以准确计算所有相互作用。Kohn 在证明这一点后获得了诺贝尔化学奖,密度泛函理论(Density Functional Theory,DFT)由此诞生。不幸的是,DFT 只能把流程简化到这一步了。该理论的“泛函”部分需要人类来完成所有繁重的工作。


去年 12 月,事情出现了转机。当时 DeepMind 发表了一篇题为“通过解决分数电子问题推动密度泛函的前沿研究”的论文。


在该论文中,DeepMind 团队声称通过开发一个神经网络,从根本上改进了当前用于模拟量子行为的方法:


通过将泛函表示为神经网络,并将这些明确的属性整合到训练数据中,我们学到了泛函结果,而且没有严重的系统性错误——从而更好地描述了一系列化学反应。

学者提出尖锐质疑

DeepMind 的论文通过了最初的正式审查流程,一切顺利。转折点出现在 2022 年 8 月,一个由来自俄罗斯和韩国的八名学者组成的团队在 Science 上发表了一篇评论文章质疑其结论。


根据斯科尔科沃科学技术学院的这篇评论文章:


从已发布的结果中,并不能证明 DeepMind AI 具备推断此类系统行为的能力,论文结论需要重新审视。换句话说:学者们正在争论 DeepMind 的人工智能是如何得出结论的。


根据评论作者的说法,DeepMind 用于构建其神经网络的训练过程教神经网络记住了在基准测试期间将面对的特定问题的答案——这种测试是科学家确定一种方法是否优于另一种方法的过程。


研究人员在评论中写道:


虽然 Kirkpatrick 等人的结论,也就是关于 FC/FS 系统在训练集中的作用可能是正确的,但这并不是对他们观察到的结果唯一可能的解释。


在我们看来,DM21 在 BBB 测试数据集上的性能相对于 DM21m 的改进可能是由一个更平淡无奇的原因引起的:训练数据集和测试数据集之间出现了意外重叠。如果这是真的,那就意味着 DeepMind 实际上并没有教会神经网络来预测量子力学。

DeepMind 迅速回应

DeepMind 反应迅速。


该公司在上述评论发表的同一天做出了回应,回击迅速而坚定:


我们不同意他们的分析,并认为他们提出的观点要么不正确,要么与论文的主要结论以及对 DM21 总体质量的评估无关。团队在反驳文章中进一步阐述了理由:


DM21 不记忆数据;DM21 的 Exchange-Correlation 会随着 BBB 中考虑的一系列距离参数而变化,并且不等于无限分离极限,如图 1 中对于 H2+和 H2 的 A 和 B 所示,从这里就能看出来 DM21 并不会记忆数据了。


例如,在 6Å处,DM21 Exc 与 H2+和 H2 的无限极限相差约 13kcal/mol(尽管方向相反)。虽说本文没办法解释清楚上面这段话的含义,但我们可以有把握地假设,DeepMind 很可能已经为这条反对意见做好了准备。


至于这是否能解决问题还有待观察。在这一点上,我们还没有看到俄罗斯和韩国专家组成的学术团队的进一步反驳,不知道他们的担忧是否得到了缓解。

科学“僵局”

这次讨论的影响可能远不止于这一篇研究论文。


随着人工智能和量子科学领域越来越紧密地交织在一起,这方面的研究也逐渐被财力雄厚的企业研究机构所主导。


如果出现了科学“僵局”,对立双方无法通过科学方法就特定技术方法的有效性达成一致——而其中又掺杂了企业利益时,会发生什么?


问题的核心可能在于人们无法解释人工智能模型如何“处理数字”来得出结论。


这些系统在输出答案之前可以经过数百万次排列。我们不可能解释这个过程的每一步,这正是为什么我们需要算法捷径和人工智能来用蛮力解决人类或计算机无法直接突破的大规模问题。


最终,随着人工智能系统的不断扩展,我们可能不会再有什么工具来了解它们的运行机制。当这种情况发生时,我们可能就会看到企业拥有的技术与通过外部同行评审的技术之间存在差异。


这并不是说 DeepMind 的论文就是一个例子。正如做出评论的学术团队在他们的评论文章中所写到的:


在训练集中使用分数电子系统并不是 DeepMind 工作中唯一的创新之处。他们通过训练集将物理约束引入神经网络的想法,以及通过对正确化学势的训练来赋予物理意义的方法,未来可能会广泛用于神经网络 DFT 泛函的构建。但我们正在见证一种大胆的、全新的、人工智能驱动的技术范式。现在我们可能要开始为一个没有同行评审的未来做准备了。


原文链接:


https://thenextweb.com/news/deepmind-feuds-russian-scientists-over-quantum-ai-research


2022-09-09 14:094565
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 555.3 次阅读, 收获喜欢 1978 次。

关注

评论

发布
暂无评论
发现更多内容

“金税四期”背景下企业税务风险管控有哪些具体措施?

用友BIP

金税四期

闲置资源优化,轻松检查集群中的空闲成本

阿里巴巴云原生

阿里云 云原生 容器服务

硬核来袭!中国AI大模型峰会“封神之作”,开发者们不容错过!

herosunly

大语言模型

直播丨如何用最新的 Serverless 技术让文化古籍“活过来”?

阿里巴巴云原生

阿里云 Serverless 云原生

加速智慧税务建设,拥抱税务数智化转型

用友BIP

税务管理

禁止别人调试自己的前端页面代码

江户川码农

JavaScript 前端 安全 加密 设计规范

掌握Spring条件装配的秘密武器

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

什么是跨境数据传输。如何避免跨境数据传输出现的问题

镭速

跨境数据传输

这 4 个系统可靠性评估指标,可能比 MTTR 更靠谱!

LigaAI

研发管理 质量指标 研发效能度量 可靠性度量 企业号 8 月 PK 榜

ChaosBlade 项目指南:我是如何为社区贡献 Redis 故障场景

阿里巴巴云原生

redis 阿里云 云原生 ChaosBlade

医疗知识图谱问答 ——Neo4j 基本操作

北桥苏

nosql neo4j 数据库、

一文让你彻底掌握ThreadLocal

华为云开发者联盟

开发 华为云 华为云开发者联盟 企业号 8 月 PK 榜

MySQL 的 Join 查询及 Hash Join 优化 | StoneDB 技术分享会 #3

StoneDB

MySQL 数据库 HTAP StoneDB 企业号 8 月 PK 榜

CGLIB动态代理对象GC问题排查 | 京东云技术团队

京东科技开发者

GC cglib CGLIB 动态代理 企业号 8 月 PK 榜

数仓性能优化:倾斜优化-表达式计算倾斜的hint优化

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 8 月 PK 榜

Spring Boot Starter 剖析与实践

京东科技开发者

Spring Boot spring Boot Starter 依赖 企业号 8 月 PK 榜

百度智能云AI加速器千帆大模型平台专项招募计划正式启动

科技热闻

企业诊断屋:服饰美妆电商如何用A/B测试赋能业务

字节跳动数据平台

大数据 A/B 测试 对比实验 企业号 8 月 PK 榜

NineData支持全版本的企业级Oracle客户端,现已发布

NineData

人工智能 数据库 oracle Oracle ACE NineData

状态机的介绍和使用 | 京东物流技术团队

京东科技开发者

dsl 状态机 数学模型 企业号 8 月 PK 榜

2023年受人欢迎的低代码开发平台大盘点

优秀

低代码开发平台

可拓展的低代码全栈框架

互联网工科生

低代码 前端框架 低代码开发

大文件传输的有效可用方式

镭速

大文件传输 传输大文件

助力618-Y的混沌实践之路 | 京东云技术团队

京东科技开发者

测试 混沌工程 系统稳定性 企业号 8 月 PK 榜

“年中技术盘点:新兴技术的影响与未来展望”征文获奖作品合集

InfoQ写作社区官方

内容合集 征文活动 热门活动

硬核来袭!中国AI大模型峰会,开发者不容错过这场夏季盛会

dvlinker

人工智能 百度飞桨 AI大模型 文心大模型

PoseiSwap:首个基于模块化设施构建的订单簿 DEX

鳄鱼视界

中企全球化发展:用友联合山海图以数字化引领印尼工程建筑行业转型

用友BIP

中企出海

关于 Ancert 硬件兼容性验证及龙蜥社区众测共创的介绍 | 第 91-92 期

OpenAnolis小助手

开源 操作系统 龙蜥大讲堂 硬件兼容 Ancert

隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了_AI&大模型_Tristan Greene_InfoQ精选文章