写点什么

用 AI 对抗 AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

  • 2023-01-31
    北京
  • 本文字数:838 字

    阅读完需:约 3 分钟

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本

过去两个月,ChatGPT火爆全网,写代码、编故事、构建虚拟机……ChatGPT 几乎无所不能。在“硬币的另一面”,有学生开始用 ChatGPT写作业、写论文。根据最新研究,学者们也可能会被 ChatGPT 欺骗,误以为 ChatGPT 生成的虚假科学摘要来自顶级研究期刊上发表的真实医学论文。

 

近日,斯坦福大学研究团队提出了一种名为 DetectGPT 的新方法,旨在成为首批打击高等教育中 LLM 生成文本的工具之一。相关研究论文已发表在预印本网站 arXiv 上。据悉,这是一种使用模型的对数概率函数的局部曲率检测预训练大型语言模型样本的方法,该方法或对检测验证产业带来积极影响。

 

该方法基于的原理是:由大型语言模型生成的文本通常在模型的对数概率函数的负曲率区域的特定区域徘徊。通过这个发现,该团队开发了一种新的指标,用于判断文本是否是机器生成的,并且不需要训练人工智能或收集大型数据集来比较文本。

 

研究人员表示,随着大型语言模型(LLMs)的流畅性和知识积累程度不断增强,人们对于检测一段文本是否由机器编写的需求日益旺盛。比如,一些学生使用大型语言模型来完成书面作业,以至于教师无法准确地评估学生的学习情况。

 

研究人员首先证明了从大型语言模型中采样的文本倾向于占据模型的对数概率函数的负曲率区域。利用这一观察结果,定义了一个新的基于曲率的标准,用于判断是否从给定的 LLM 生成通道。这种方法即为 DetectGPT——不需要训练单独的分类器,不需要收集真实或生成的段落的数据集,也不需要显式地为生成的文本加水印,它只使用由感兴趣的模型计算的对数概率,和来自另一个通用预训练语言模型(例如 T5)的文章随机扰动。

 

研究发现 DetectGPT 比现有的零帧模型样本检测方法更具鉴别性,显著提高了 20B 参数 GPT-NeoX 生成的假新闻文章的检测能力,从最强零帧基线的 0.81 AUROC 提高到 DetectGPT 的 0.95 AUROC。

 

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT 相比其他检测方法需要更大的计算量等。

2023-01-31 18:035932

评论 1 条评论

发布
用户头像
你来我往
2023-02-01 08:09 · 浙江
回复
没有更多了
发现更多内容

TDengine 签约安徽智质,助力海螺水泥智慧工厂升级

TDengine

数据库 tdengine 时序数据库

即时通讯技术文集(第45期):微信、QQ技术精华合集(Part2) [共14篇]

JackJiang

即时通讯;IM;网络编程

宿迁等保测评机构有吗?在哪里?

行云管家

等保 等保测评 网龄安全 宿迁

数字组织管理能力提升阶段的芯盾时代统一用户身份治理建设

芯盾时代

身份安全 iam 访问控制 统一身份管理平台

数造科技荣获2024第七届数字化转型与创新评选“大数据创新产品”奖

数造万象

敏捷开发 数据治理 数字化 数据开发 一体化平台

如何提升你的技术视野?

老张

职场成长 技术实践 职场认知 技术视野

NineData云原生智能数据管理平台新功能发布|2024年11月版

NineData

MES在传统制造业中的核心作用与应用策略

万界星空科技

数字化 mes 万界星空科技 制造业工厂 制造业转型

测试开发工程师的福音:测试开发高薪私教进阶班,名企导师一对一,职场技能飞速提升!

测吧(北京)科技有限公司

测试

新回坡通过区块链技术实现商品溯源系统

北京木奇移动技术有限公司

区块链技术应用 区块链技术开发

QT软件外包开发框架

北京木奇移动技术有限公司

qt Qt Creator

圆极化平板天线仿真02【CST软件仿真实例】

思茂信息

cst cst使用教程 cst操作

AI与低代码技术融合:如何加速企业智能化应用开发?

天津汇柏科技有限公司

低代码 AI人工智能

行业Know-How助力零售企业数字化转型|StartDT Talk

奇点云

零售行业

跬智信息(Kyligence)获评36氪“年度最具商业价值企业”

Kyligence

Mac软件删除不了怎么办?苹果电脑应用程序删除不了的原因

阿拉灯神丁

CleanMyMac X Mac软件 Mac卸载软件 mac电脑维护工具 程序坞图标删除软件

关于 MySQL 执行计划

雄鹿 @

MySQL

EasyAnimateV5 视频生成大模型原理详解与模型使用

阿里云大数据AI技术

阿里云 AI视频 视频生成 EasyAnimate

Spring Boot与Spring Security集成:前后分离认证流程的优化实践

代码忍者

合合信息智能图像处理技术,让你的设备更智能

合合技术团队

人工智能 图像识别 图像处理 打印

QT软件外包开发的注意事项

北京木奇移动技术有限公司

qt Qt Creator

利用mybatis的typeHandler解决手动拆分拼接数据的麻烦

六哥是全栈

mybatis TypeHandler

AI+数智合同 | 人工智能重塑企业合同服务与管理

用友智能财务

数字化 合同 财务 数智化

读出你的热爱:华为阅读高校花粉读书会已走进50所高校

最新动态

应对DDOS攻击,游戏盾防护的作用

德迅云安全杨德俊

服务器 DDoS 攻击 高防游戏服务器

用AI对抗AI!斯坦福研究人员推出 DetectGPT,专门检测 ChatGPT 等模型生成的文本_AI&大模型_凌敏_InfoQ精选文章