写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:035609

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

中企全球化:王文京与新加坡建筑企业集永成共谋数智化新发展

用友BIP

微信小程序 WXSS 是如何编译的?

FN0

小程序 小程序容器

云桌面是什么?好用的云桌面推荐?

青椒云云电脑

云桌面 云桌面解决方案

3D模型制作木质纹理贴图

3D建模设计

3D模型 材质贴图 纹理贴图 材质纹理

云桌面系统如何使用?云桌面的优势有哪些?

青椒云云电脑

云桌面 云桌面解决方案 云桌面系统

String 拼接字符串效率低?是真的吗?

红袖添香

Java 字节码 字符串拼接

供应商企业在线询价招投标管理系统

金陵老街

Java多线程系列4:线程协同

BigBang!

Java多线程

IPQ5018 IPQ6010 IPQ8072 Support Wallystech Latest Opensource Code Repository

wallyslilly

IPQ6010 IPQ8072 ipq5018

云计算与低代码:加速应用开发与创新的双核引擎

快乐非自愿限量之名

云计算 云原生 低代码

每日一题:LeetCode-322. 零钱兑换

Geek_4z9ami

面试 算法 LeetCode 动态规划 贪心算法

前端又出新轮子Nue.js,但还是低代码更香!

伤感汤姆布利柏

前端 低代码 前端框架 极简主义 nue

还记得当初自己为什么选择计算机?

代码生成器研究

手把手教你使用 RisingWave 流数据库

吴英骏

分布式 rust 流处理 物化视图 数据库设计流程

低代码开发平台有什么优势?

代码生成器研究

制作红木家具3d模型

3D建模设计

3D模型 材质贴图 纹理贴图 材质纹理

如何为 3D 模型制作纹理的最佳方法

3D建模设计

材质 纹理 贴图 3D模型纹理贴图

软件测试/人工智能|Python运算符:初学者指南

霍格沃兹测试开发学社

为什么说编程是新时代必学的技能?

代码生成器研究

精选21款免费项目管理系统,哪款更适合你?

爱吃小舅的鱼

项目管理 项目经理 项目管理软件

债务管理一体化领先实践,全面提升融资管理效率,有效防控风险

用友BIP

用友承建!居然之家人力资源数智化项目成功上线!

用友BIP

软件测试/人工智能|Python Pip 常用命令大全

霍格沃兹测试开发学社

低代码开发平台有什么优势?

代码生成器研究

如何降低代码的复杂度?

代码生成器研究

王文京与厦航董事长、党委书记赵东交流座谈,共商助力智慧民航建设

用友BIP

走软件开发的捷径——低代码之路

树上有只程序猿

软件开发 低代码 JNPF

「X」Embedding in NLP|Token 和 N-Gram、Bag-of-Words 模型释义

Zilliz

nlp NLP 大模型 Milvus AIGC

软件测试/人工智能|Python算术运算符:入门指南

霍格沃兹测试开发学社

少写代码,用更便捷的方式开发程序

代码生成器研究

如何降低代码的复杂度?

代码生成器研究

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章