QCon北京|3天沉浸式学习,跳出信息茧房。 了解详情
写点什么

科学家被 ChatGPT 骗了

  • 2023-01-30
    北京
  • 本文字数:1381 字

    阅读完需:约 5 分钟

科学家被ChatGPT骗了

根据最新研究,学者们可能会被 ChatGPT 所欺骗,他们误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。


本文最初发布于 The Register。

学者难以识别人工智能生成的假论文摘要


近日,美国西北大学领导的一个研究小组使用 OpenAI 开发的文本生成工具,基于一篇真实科学论文的标题,采用五种不同的医学期刊风格生成了 50 篇摘要。


4 名学者参加了一项测试,他们被分为两组,每组两人。测试通过电子抛硬币的方式来决定将人工智能生成的摘要交给每组中的哪一名审核员。如果一名研究人员拿到的是真摘要,那么另一名研究人员拿到的就是假摘要,反之亦然。每个人都审阅了 25 篇科学摘要。


审核员能够识别出 68% 由人工智能生成的假摘要,和 86% 来自真实论文的原始摘要。换句话说,他们被成功欺骗,将 32% 的人工智能生成的摘要识别为真摘要,将 14% 的真摘要识别为假摘要。


该研究的第一作者、西北大学专攻肺病学的医生和科学家 Catherine Gao 说,这表明 ChatGPT 相当有说服力。她在一份声明中写道,“我们的审核员知道他们收到的部分摘要是假的,所以他们非常警惕”。


“事实上,我们的审核员还是在 32% 的时间里漏掉了人工智能生成的摘要,这表明这些摘要真的很好。我估计,如果有人偶然看到了其中一份生成的摘要,那么他们不一定能识别出那是由人工智能写的。”

大型语言模型生成的文本为什么能骗倒众人?


像 ChatGPT 这样的大型语言模型使用从互联网上抓取的大量文本进行训练。经过学习后,它们会通过预测在给定的句子中哪些词更有可能出现来生成文本,而且生成的文本语法准确。这并不奇怪,即使是学者也会上当受骗,相信人工智能生成的摘要是真的。


大型语言模型擅长生成具有清晰结构和模式的文本,科学摘要通常采用类似的格式,而且可能相当模糊。


Gao 说:“我们的审核员评论说,区分真假摘要非常困难。ChatGPT 生成的摘要非常有说服力……当编造数值时,它甚至知道患者群体应该有多大。”例如,一篇关于高血压的假摘要描述了一项有数万名参与者的研究,而一篇关于猴痘的研究涉及的患者则较少。


Gao 认为,像 ChatGPT 这样的工具将使靠出版研究成果获利的造纸厂更容易炮制虚假科学论文。她补充说,“如果其他人试图以这些不正确的研究为基础进行科学研究,那可能真的很危险”。


不过,使用这些工具也有好处。这项研究的合作者、芝加哥大学医学副教授 Alexander Pearson 说,它们可以帮助母语非英语的科学家更好地写作和分享他们的工作。


人工智能比人类更擅长检测机器文本。例如,免费的 GPT-2 输出检测器能够以超过 50% 的置信区间从 50 篇由语言模型生成的论文中猜出 33 篇。研究人员认为,提交的论文应该通过这些探测器的检测,科学家应该公开使用这些工具。


Gao 告诉 The Register,“我们在撰写自己的摘要或手稿时没有使用 ChatGPT,因为这是否可接受在学术界还没有清晰的边界。例如,国际机器学习大会已经制定了一项政策,禁止使用它,不过他们承认,讨论仍在继续,并澄清说,在‘编辑或打磨’时使用是可以的。”


不过,已经有一些团体开始使用它来辅助写作,有些人还把它列为合著者。我认为,使用 ChatGPT 来辅助写作是可以的,重要的是,这样做的时候要明确标示 ChatGPT 辅助编写的那部分手稿。我们将来使用或不使用 LLM 来辅助撰写论文,取决于科学界最终达成的共识。”


原文链接:


https://www.theregister.com/2023/01/11/scientists_chatgpt_papers/

2023-01-30 12:005817

评论 1 条评论

发布
用户头像
AI自动帮小学生写作业
2023-01-31 08:11 · 浙江
回复
没有更多了
发现更多内容

纯CSS杂志封面折叠效果

南城FE

CSS 前端 动画 交互

MySQL Shell 8.0.32 for GreatSQL编译安装

GreatSQL

greatsql

新版Media Encoder 2023 mac下载 (me2023媒体编码器) v23.6激活版

mac

苹果mac Windows软件下载 Media Encoder 2023 视频编码软件 ME2023

OpenHarmony Meetup 2023广州站圆满举办,城市巡回全面启航

科技热闻

Programming abstractions in C阅读笔记:p138

codists

c

Vue3使用小技巧

青柚1943

软件测试案例 | “某气候中心数据加工处理系统”软件项目验收测试

TiAmo

软件测试 测试

小灯塔系列-中小企业数字化转型系列研究——SCRM测评报告

向量智库

深度解析 PostgreSQL Protocol v3.0(一)

KaiwuDB

postgresql protocol KaiwuDB

如何有效的给出反馈

ShineScrum

反馈 管理者 敏捷教练 如何反馈 coach

【深入MaxCompute】人力家:用MaxCompute 事务表2.0主键模型去重数据持续降本增效

阿里云大数据AI技术

MaxCompute

Mac电脑强大的图像编辑 Pixelmator Pro 中文直装

胖墩儿不胖y

图像编辑 Mac软件 图像处理工具

zone.js由入门到放弃之二——zone.js API大练兵

OpenTiny社区

前端 zone.js

直播预告 | 博睿学院第四季-博睿数据资深运维团队现身说法!

博睿数据

直播 博睿数据 博睿学院

理解 Databend Cluster key 原理及使用

Databend

OpenHarmony Meetup 2023 广州站圆满举办,城市巡回全面启航

OpenHarmony开发者

OpenHarmony

R语言之 ggplot 2 和其他图形

timerring

R语言

英特尔数据中心突破创新,以全新架构点燃发展新引擎

E科讯

全球前十的LED大屏幕租赁公司

Dylan

娱乐 科技 LED显示屏 led显示屏厂家 虚拟演唱会

火山引擎 DataLeap 助你拥有 Notebook 交互式的开发体验

字节跳动数据平台

大数据 数据中台 数据治理 数据安全 企业号 8 月 PK 榜

OpenSSL 3.0.0 设计(四)|代码维护、FIPS 测试

铜锁开源密码库

算法 测试 代码 密码学 openssl

阿里云PolarDB分布式版,降价40%!

阿里云瑶池数据库

数据库 阿里云 polarDB

macos虚拟定位软件推荐 AnyGo激活中文版

mac大玩家j

Mac软件 虚拟定位软件 好用的gps

DORA指标:公司业务成果的“占卜师”

SEAL安全

DevOps 运维‘ DORA 企业号 8 月 PK 榜

Presto 设计与实现(十一):抽象语法树 AST

冰心的小屋

AST 抽象语法树 presto 设计与实现

MySQL redo log恢复原理 | StoneDB技术分享会 #5

StoneDB

MySQL 数据库 HTAP StoneDB

直播程序源码OAuth协议:开放授权的重要性

山东布谷科技

软件开发 Oauth 源码搭建 直播程序源码 开放授权

科学家被ChatGPT骗了_AI&大模型_Katyanna Quach_InfoQ精选文章