写点什么

对抗铺天盖地的假新闻,MIT 开发 AI 检测系统自动识别虚假消息

  • 2019-10-22
  • 本文字数:1949 字

    阅读完需:约 6 分钟

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息


互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook 一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了德国政府的巨额罚款。我们不禁想到,能否利用人工智能强大的能力,来对抗假新闻呢?麻省理工学院计算机科学与人工智能实验室就为此做出了尝试。


假新闻是一种威胁,假新闻的大致定义为,通过传统媒体或社交媒体故意散布虚假信息的一种宣传。皮尤研究中心(Pew Research Center)在 2016 年 12 月的一项调查显示,有 23% 的美国成年人有意无意地与朋友和其他人分享过假新闻。研究显示,假新闻已经开始削弱公众对主要电视和报纸媒体的信任。Monmouth University 的一项调查显示,77% 的受访者称,他们认为媒体报道的全都是假新闻。在一个特别令人震惊的例子中,关于华盛顿特区一家披萨店的一则不真实的报道(但像病毒一样广为传播),导致在一项 1244 人参与的民意调查中,有 9% 的美国选民表示,他们认为前国务卿 Hillary Clinton 与一个儿童色情团伙有牵连。


为了引起人们对这一问题的关注,最近,麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员调查了所谓的假新闻探测器被真实文章愚弄的方式。与这项工作同时进行的是,同一个团队还使用了世界上最大的事实核查数据集之一来开发能够检测虚假陈述的自动化系统。


它是建立在麻省理工学院计算机科学与人工智能实验室去年进行的一项研究的基础上,该研究开发了一种人工智能系统,可以判断消息来源是准确的,还是带有政治偏见的。


研究人员的两篇预印论文中的第一篇《我们安全了吗?假新闻检测中分布特征的局限性》(Are We Safe Yet? The Limitations of Distributional Features for Fake News Detection),描述了基于 OpenAI 的 GPT-2 的框架,这是一种人工智能模型,他们在将人工书写的文本提供给假新闻探测器之前,先用人工智能模型“破坏”这个文本的含义。在一次实验中,他们利用类似于可靠来源的自动完成工具来生成有关合法新闻的信息。生成器(Generator)提供了一个有关 NASA 如何收集日冕物质抛射数据的报道,并就这些数据如何帮助科学家研究地球磁场发表了翔实且正确的解释。尽管如此,它还是被识别为“假新闻”,这表明,如果假新闻探测器是机器生成的,它就无法区分真假文本。


该研究的贡献者、麻省理工学院教授 Regina Barzilay 表示:“我们的这一发现对当前分类器的可信度提出了质疑,这些分类器被用来帮助检测其他新闻来源中的错误信息方面。”


在第二篇论文《经过去偏的事实核查模型的探讨》(Towards Debiasing Fact Verification Models)中,该团队获取了事实提取和验证(Fact Extraction and VERification,FEVER),这是一个虚假陈诉的存储库,与 Wikipedia 的文章中的证据进行交叉核查,以开发出一种同类最佳的事实检查算法。


问题在于,接受过 FEVER 训练的系统往往侧重于陈述的语言,而不考虑外部证据。(例如,像“Adam Lambert does not publicly hide his homosexuality”(亚当·兰伯特并没有公开隐藏自己的同性恋身份)这样的陈述,即使是真正的事实,并且可以从语料库中推断出来,它也有可能被事实核查人工智能判定为假新闻。当目标语句包含的信息在今天是正确的,但在将来却有可能被认为是错误的信息,这种影响会加剧。


为解决这一问题,合著者创建了一个数据集来消除 FEVER 的偏见,但此举并没有完全解决这一难题。模型在无偏评估集上表现不佳,研究人员将这一结果归因于这些模型过度依赖于它们最初接触到的偏见。最终的解决方案是设计一种全新的算法:当在经过去偏的数据集上进行训练时,该算法在所有指标上的表现都优于之前的事实核查 AI。


该团队希望将事实核查和现有防御相结合,使模型对抵御攻击的能力更加健壮。未来,他们希望能够通过开发新的算法和构建涵盖更多类型错误信息的数据集来进一步改进现有模型。


他们并不是唯一试图与人工智能对抗假新闻转播的人。总部位于印度德里的初创公司 MetaFact 利用自然语言处理算法来标记新闻报道和社交媒体帖子中的错误信息和偏见。AdVerif.ai 是一个软件即服务的平台,去年发布了测试版,它用于分析错误信息、裸体、恶意软件和其他有问题的内容,并交叉引用一个定期更新的数据库,其中包含数以千计的虚假和合法的新闻条目。就 Facebook 而言,它已经尝试部署人工智能工具来“识别账户和假新闻”。


无论最终的解决方案是人工智能、人类管理还是两者兼而有之,都不可能很快就会实现。Gartner 预测,如果目前的趋势持续下去的话,到 2022 年,发达国家的大多数人将会看到更多的虚假信息,而不是真实信息。

作者介绍

Kyle Wiggers 居住在美国纽约市,是 VentureBeat 的人工智能专栏作者。


原文链接:


https://venturebeat.com/2019/10/15/mit-csail-fights-fake-news-with-ai/


2019-10-22 08:002496

评论

发布
暂无评论
发现更多内容

架构实战营 - 模块 6- 作业

请弄脏我的身体

架构实战营

新手讲解this

前端树洞

JavaScript 面试 大前端 js

JavaScript学习(二)

空城机

JavaScript 大前端 6月日更

MySQL基础之十一:创建表

打工人!

MySQL 6月日更

《原则》(十三)

Changing Lin

6月日更

从零开始搭建一个个人博客网站--Task0

IT蜗壳-Tango

django IT蜗壳教学 6月日更 Datawhale

模块六作业 - 拆分电商系统为微服务

张大彪

JAVA设计模式系列--单例模式

加百利

Java 后端 设计模式 单例模式 6月日更

架构师实战营 模块六总结

代廉洁

Single-Spa构建第一个微前端项目

devpoint

Vue 大前端 6月日更

五种服务部署升级策略,你也许会用的到

架构精进之路

6月日更 服务升级

「SQL数据分析系列」2. 创建和使用数据库

Databri_AI

数据库 语法

nacos配置中心模块详解

捉虫大师

nacos 配置中心

架构实战营-模块一作业

rubys_

架构实战营

CSS 选择器总结

编程三昧

CSS html5 大前端 DIV+CSS CSS选择器

Kubernetes手记(10)- POD 存储卷

雪雷

k8s 6月日更

(VMware)ubuntu 环境下搭建docker环境

逸少

Docker Docker-compose vmware Ubuntu20.04

HarmonyOS的万里长征和万里长城

脑极体

Git 各指令的本质,真是通俗易懂啊

xcbeyond

6月日更

【经验分享】RTC 技术系列之视频编解码

Hanson

音视频

产品开发的过程

Qien Z.

运营管理 6月日更

策略模式怎么玩?

卢卡多多

设计模式 策略模式 6月日更

【LeetCode】第一个错误的版本Java题解

Albert

算法 LeetCode 6月日更

模块6作业

薛定谔的指南针

架构实战营

🍃【SpringBoot技术专题】「StateMachine」FSM状态机设计及实现

洛神灬殇

springboot 6月日更 状态机 StateMachine

☕【JVM技术探索】重塑虚拟机性能调优计划

洛神灬殇

JVM jvm调优 GC调优 6月日更

SpringCloud Gateway 路由转发性能优化

黄仲辉

性能优化 动态路由 SpringCloud Gateway JMH性能基准测试

Java语言概述以及环境搭建

若尘

java编程 6月日更

架构师实战营 模块六作业(拆分电商系统为微服务)

代廉洁

架构实战营

中国数字化转型为全球带来机遇

CECBC

【音视频】基于声网的多人视频通话功能建设

轻口味

android 音视频 IM 声网

对抗铺天盖地的假新闻,MIT开发AI检测系统自动识别虚假消息_AI&大模型_Kyle Wiggers_InfoQ精选文章