ChatGPT又遇“克星”！OpenAI发布全新AI内容识别工具，成功率26%_文化 & 方法_凌敏_InfoQ精选文章

AICon 上海站｜日程100%上线，解锁Al未来！了解详情 



 写点什么

登录/注册

ChatGPT又遇“克星”！OpenAI发布全新AI内容识别工具，成功率26%

过去几个月，由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在全球范围内掀起狂热之风。为了帮助用户判断哪些内容是由 ChatGPT 生产的，包括 OpenAI、斯坦福大学等多家机构开始研究相应的AI内容识别工具。

近日，OpenAI 推出一个经过训练的分类器，用以区分文本是否是由 AI 编写的。据其介绍，该分类器虽然不可能可靠地检测所有 AI 编写的文本，但能够通过提供信息来减少 AI 生成式文本是由人工编写的误判：例如，执行自动虚假内容营销，利用 AI 工具进行学术欺诈，以及将 AI 聊天机器人定位为人类。

据悉，该分类器是一种语言模型，该模型对基于同一主题的人工编写文本和 AI 编写文本的数据集进行不断调整。OpenAI 从人工编写的各种来源收集数据集，例如预训练数据以及提交到 InstructionGPT 的各种人工的演示，将每个文本分为提示和响应。根据提示，可以从分类器以及其他组织训练的各种不同语言模型中生成响应。OpenAI 调整了 Web App 的置信度阈值，可以保持较低的误报率。换句话说，只有分类器非常有把握的时候，才会将文本标记为可能是 AI 编写的。

目前，该分类器的准确性还很低。据悉，OpenAI 对英语文本“Challenge Set”进行了评估，分类器正确地将 26% AI 编写的文本（真阳性）识别为“可能是 AI 编写的”，而错误地将 9% 人工编写的文本标记为 AI 编写的（假阳性）。

OpenAI 表示，目前该分类器仍存在局限性，所以不应该将它作为主要决策工具，而应该作为确定文本来源的其他方法的补充。具体来说：

分类器在短文本（1,000 个字符以下）上非常不可靠。甚至更长的文本有时也会被错误标记。
有时，人工编写的文本会被错误但自信地标记为 AI 编写。
建议仅对英语文本使用分类器。它在其他语言中的表现明显较差，代码不是很有效。
无法可靠地识别已经十分确定的文本。例如，无法预测前 1,000 个素数的列表是 AI 还是人写的，因为谁来写都是一样的。
编辑 AI 编写的文本可以避开分类器。虽然所有类似的分类器可以通过成功的检测来更新算法并重新训练，但目前还不清楚这种检测是否可以具有长期优势。
众所周知，基于神经网络的分类器除了训练数据外的其它的校准效果很差。如果输入的文本与训练集中的非常不一样，分类器多半会得到错误的预测。

OpenAI 认为，分类器的可靠性，通常会随着输入文本长度的增加而提高。与 OpenAI 此前发布的分类器相比，新的分类器对来自最新 AI 系统编写的文本会更加有效。

参考链接：

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

评论

发布

暂无评论

码中寻趣：低码专家与开发者的「神秘会议」 ——华为云Astro扫地僧出山

华为云PaaS服务小智

云计算低代码华为云华为开发者大会2023 Astro

超级应用App的概念及构建思路

小程序小程序容器超级应用

软件测试/测试开发丨Selenium环境安装配置

Python 程序员软件测试 selenium chromedriver

ChatGPT 来了，MySQL DBA 会失业吗？| StoneDB 数据库观察 #10

数据库 StoneDB ChatGPT

数智化的核心在于构建底座，看这家数科公司如何与传统厂商双赢双生

数智底座数科公司

华为云张鹏：华为云盘古大模型及MetaStudio亮相新媒体大会，使能融媒创新

新消费日报

人工智能的底层逻辑

博文视点Broadview

火热的低代码和无代码赛道

互联网工科生

软件开发低代码无代码应用开发

软件定义汽车场景中的数据流处理

EMQ映云科技

车联网 mqtt 数据流

【HDC.Cloud 2023】华为云区块链分论坛内容值得再读！

华为云开发者联盟

区块链后端华为云华为云开发者联盟企业号 7 月 PK 榜

为什么选择美国虚拟主机是你的明智之选?

一只扑棱蛾子

美国虚拟主机

Apache IoTDB 及云上部署实践

时序数据库 IoTDB Apache IoTDB

7.12下午两点开启直播！《数智企业@中国》走进泰开集团

沉潜蓄势，厚积薄发：StoneDB-5.7-V1.0.4版本正式发布！特性增强，稳定性大幅提升

数据库版本发布 StoneDB

语音平台源码搭建开发之表情功能的实现

山东布谷科技

软件开发语音直播源码搭建语音厅平台搭建

春去夏来，火热发版：StoneDB-8.0-v1.0.1-beta 版本正式发布！

数据库 StoneDB

方言语音识别数据驱动人工智能的多元文化发展

三问三答：细数GaussDB迁移的核心技术

华为云开发者联盟

数据库后端华为云华为云开发者联盟企业号 7 月 PK 榜

Cloud Kernel SIG月度动态：ANCK 5.10-016将落地kABI机制，5.10-015版本规划发布

OpenAnolis小助手

操作系统内核 anck 龙蜥sig 版本规划

看完这篇异地多活的改造，我决定和架构师battle一下

架构构架师

IoTDB Timecho 产品负责人赵馨逸《IoTDB 如何赋能工业物联网数据管理》

IoTDB Apache IoTDB

如何在 Ubuntu 22.04 下编译 StoneDB for MySQL 8.0 | StoneDB 使用教程 #1

数据库 StoneDB

2023年最具威胁的25种安全漏洞(CWE TOP 25)

华为云开发者联盟

安全华为云安全漏洞华为云开发者联盟企业号 7 月 PK 榜

直播预告 | 博睿学院：海量数据实时可信认证

智能运维博睿数据数据要素博睿学院

响应式编程：Vert.x官网学习

越长大越悲伤

响应式编程 JVM Vert.x

技术领先、“忠”于业务，用友助力企业实现价值化国产替代

北京汽车牵手火山引擎数智平台，探寻车企数字化升级新通路

字节跳动数据平台

数字化数字化升级车企企业号 7 月 PK 榜

用友BIP全球司库“五大管家”，助力大型企业一流司库建设