写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:035761

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

神经网络的激活函数为什么要使用非线性函数

王坤祥

神经网络 激活函数

Netty 源码解析(四): Netty 的 ChannelPipeline

猿灯塔

DDD 实践手册(2. 实现分层架构)

Joshua

设计模式 领域驱动设计 DDD 系统架构 分层架构

Java并发编程系列——锁

孙苏勇

Java Java并发 并发编程 多线程

MySQL中order by语句的实现原理以及优化手段

天堂

Java MySQL 性能优化

MySQL的死锁系列- 锁的类型以及加锁原理

程序员历小冰

MySQL

HashMap 的 7 种遍历方式与性能分析

Bruce Duan

Java 性能 hashmap 遍历

KubeFATE: 用云原生技术赋能联邦学习(一)

亨利笔记

人工智能 学习 FATE KUBEFATE

关于5G RCS的产品猜想

机器鸟

学习来应对创业的未知

Neco.W

创业 重新理解创业

从数据闭环谈微服务拆分

松花皮蛋me

微服务

怎样算是一个好的开发者?

水滴

开发者

韦小宝真的幸福吗 | Random Forest

张利东

Python 学习

游戏夜读 | 2020周记(3.27-4.3)

game1night

浅析 Cocoapods-Packager 实现

Edmond

ruby ios CocoaPods binary packager

南丁格尔科普

小匚

多云的一点思考

HU

使用 jsDelivr 免费加速 GitHub Pages 博客的静态资源

mzlogin

CDN Jekyll GitHub Pages 个人博客

阿里巴巴Java开发手册泰山版解读

Bruce Duan

Day 47|Week 07-5 曾国藩家书|问学篇-学问何处何时都可做

熊小北同学

为什么正在使用的Java版本跟环境变量的版本不一致

阡陌r

Java 踩坑

即将步入职场,忐忑而又期待的新人菜鸟

菜农阿飞

成长 新人

说出来就不灵啦

伯薇

糊涂 活在当下 享受状态 生活状态 观察者

如何优雅滴在手机上跑Python代码

王坤祥

Python 移动应用 手机编程

消息队列Kafka - acks参数

Java收录阁

kafka

死磕Java并发编程(7):读写锁 ReentrantReadWriteLock 源码解析

Seven七哥

Java并发 读写锁 ReentrantReadWriteLock

高仿瑞幸小程序 00 准备工作

曾伟@喵先森

小程序 微信小程序 大前端 瑞幸

把成功过成自己的生活

子铭

成功学 生活状态

经济大萧条对我的启示

Neco.W

创业 自我管理 职场 自我提升

InfoQ写作平台首秀,来个自我介绍

nuhcoad

个人感想

程序员陪娃漫画系列——魔方

孙苏勇

程序员 生活 陪伴 漫画

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章