QCon 演讲火热征集中,快来分享技术实践与洞见! 了解详情
写点什么

用 AI 对抗 AI!教代码调戏深度学习算法生成的假视频

  • 2018-11-13
  • 本文字数:1893 字

    阅读完需:约 6 分钟

用AI对抗AI!教代码调戏深度学习算法生成的假视频

AI 前线导读: 写代码用 AI 调戏 AI,检测 AI 生成的虚假图片、视频?这现在已经成为可能了,因为能表征图片、视频的真假的特征很容易被检测出来。要怎么做呢?让我们一起来看看吧!


更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)


随着 AI 的崛起,人们已经可以用深度学习算法生成越来越多以假乱真的图片和视频。这也激发了美国的学者们的研究热情:如何设计算法检测出网络上用 AI 生成假图片、假视频,即所谓的“deepfakes” 呢?


生成对抗网络(Generative Adversarial Networks,GANs)是进行虚假图片、视频“创作”的法宝。这类神经网络可以帮助研究者们生成人造数据集(相关文章), 用以在数据集不足的情况下训练人工智能算法。这类网络还可以协助艺术家进行肖像创作(相关文章)。


然而,和所有的技术一样,这项技术也有其不好的一面。比如,网络上的一些恶徒可以利用这项技术,将明星、前女友、政客或其他受害者的脸合成到色情明星的身体上。计算机合成结果会非常逼真,就像受害者真的在做限制级动作一样。而且,让人头疼的不只是淫秽影片那么简单。人们可以利用 AI 生成假的采访视频或个人声明,再配合上 AI 生成的声音(相关文章), 让人与人之间从此没有信任。


现在,人们可以稍微松口气了。博士生李跃尊(音译)和纽约州立大学奥尔巴尼分校的助理教授刘思伟(音译)提出了一种新技术,可以识别深度学习算法(如开源项目DeepFake FaceSwap算法)生成的假视频。


目前,深度学习生成的假视频对于人类来说还不是那么难辨认。伪造的视频一般比较奇怪,人的面部表情不是很自然,而且动作会有延迟、不顺畅。而且,伪造的视频一般会比原视频分辨率低。因此,人们应该能很快意识到自己看到了假视频。然而,由于生成假视频的技术仍在不断发展,未来最好能有一种技术可以识别出假视频里的特征,从而提醒观看假视频却没有意识到的人。

检测深度学习生成的假视频

用计算机检测假视频,之前的做法是用一些特征作为基准,比如观察视频中人的眨眼情况,从而判断视频真假。这一般需要先训练一个 GAN 网络,然后利用这个 GAN 网络来训练其他网络以检测视频真假。


李和刘的方法却并不依赖于 GAN 网络,因此运行时间更短、需要的算力更低。首先,他们使用了计算机视觉中的传统算法来检测 24,442 张训练图像,并提取其脸部关键点。然后,他们会弯折或扭曲图像中的人脸特征,来模拟 DeepFake 生成的假图片、视频中可能会出现的怪异效果。最后,他们用真实的和扭曲的图像训练了一些卷积神经网络(CNN)作为分类器,该分类器可以给出一个视频为真还是为假的概率。训练完成后,他们向这些卷积神经网络中输入视频的截图,就可以检测这些截图中的人脸到底是真的还是伪造的。


“我们观察到,现有的 DeepFake 算法只能生成出分辨率有限的图像,这些低分辨率图像要经过扭曲才能扩展到和来源视频一样的分辨率。我们的方法就是基于这个观察。”李和刘在本月发表的一篇论文中这样解释道。


“这种变换是 DeepFake 算法所造出的假视频中特有的,而且我们证明,这种变换很容易被卷积神经网络捕捉到。”


二人将前述方法用到了四个卷积神经网络中。训练集包含 49 个真实视频和 49 个 DeepFake 算法生成的假视频。每个视频作为一个独立的样本,时长约为 11 秒。所有视频共有 32,752 帧。


由英国的牛津大学的研究者开发的老牌卷积神经网络——VGG16,在假视频识别任务中表现最差(精度为 83.3%)。而更为流行的一个 CNN——微软的研究者们开发的 ResNet50,给出了高达 97.4%的精度。


ResNet50 的一些变种也表现得很好。ResNet101 和 ResNet152 给出了 95.4%和 93.8%的精度,分别位列第二和第三。在将 deepfake 假视频看作一个整体的情况下,ResNet101 表现最好(精度为 99.1%),ResNet50 次之(98.7%),紧接着是 ResNet152(97.8%),而 VGG16 最差(84.5%)。


虽然这种检测方法很有前途,但研究者们目前还没有给出非常有意义的实验结果——他们的实验只是在他们精心挑选的图像和视频数据集上做的。换句话说,研究者们还需要在更多真实世界中的 DeepFake 视频上做实验,才能进一步验证他们的算法。另外,随着 GAN 网络技术的进步,假视频的质量也进一步提高,恐怕以后这种假视频的检测方法会越来越不适用。


“随着 DeepFake 技术的不断进化,我们也会继续改进这种检测方法”——学者们允诺道。“首先,我们会将多视频压缩的问题考虑进去,继续验证和改进我们算法的鲁棒性。其次,我们现在仅使用了他人设计好的网络架构(如 resnet 和 VGG)。为追求更加高效的检测结果,我们会针对 DeepFake 视频检测任务设计专门的网络。”


原文链接:


https://www.theregister.co.uk/2018/11/06/fight_ai_deepfakes


2018-11-13 19:441624

评论

发布
暂无评论
发现更多内容

Cellebrite Inseyets PA 10.4 - 取证数据分析软件

sysin

Inseyets PA

百度联合研究会打造“文心快码”无障碍版本,助力视障开发者就业无“碍”

信息无障碍研究会

产品 程序员、 开发. AI编程 无障碍适配

盘点这些年搭建器在用户体验优化的实践|得物技术

得物技术

前端 性能优化、

提高IT工单管理的方法

ServiceDesk_Plus

工单管理 工单管理软件 IT工单管理

《鲲鹏原生开发技术白皮书》发布,携更多伙伴迈入原生开发新时代

Geek_2d6073

20 条实用的创业实战指南:初创项目如何提升竞争力?

TechubNews

Bettertouchtool for Mac(触摸板增强工具)

Mac相关知识分享

Parallels Desktop 18 for Mac(Pd虚拟机软件)

Mac相关知识分享

观测云产品更新 | 自动编写 Pipeline、AI 告警聚合、生成指标优化等

观测云

产品迭代

Sora 文生视频技术大揭秘:能力惊艳但局限几何?

测试人

软件测试

SpringBoot 实现动态插拔的 AOP,太实用了!

采菊东篱下

Java spring

Sound Control for Mac( 音频控制软件)

Mac相关知识分享

【体验官招募】SoFlu - JavaAI 开发助手:开启智能开发新时代

SoFlu-JavaAI开发助手

程序员 有奖活动 Java. AI编程

如何提升大模型的“深度思维能力”

阿里技术

大模型 大语言模型 思维能力 智能引擎

Spring Event 别瞎用!被它坑的绩效都没了!

架构师之道

Java spring

如何控制bean的加载顺序?

EquatorCoco

C#

全国范围AOI数据2024年12月更新,共计超过305万个,最完整的地理要素数据库(AOI数据更新系列)

Geek_f9782a

AOI 全国AOI数据

备战春招,大厂高频精选Java面试八股文整理(附答案)

架构师之道

编程 java面试

从12月份开始背Java后端面试八股文也不算晚

采菊东篱下

编程 java面试

代码人生-精选文章周刊

安全乐谷

互联网 职场 心理学 找工作 招聘

鸿蒙Flutter实战:14-现有Flutter 项目支持鸿蒙 II

星释

flutter 鸿蒙系统 harmoyos

Tower for Mac( Git 客户端软件)

Mac相关知识分享

Final Cut Pro for Mac(fcpx视频剪辑)专业视频编辑软件

Mac相关知识分享

升级鸿蒙NEXT,流畅、安全、便捷,一步到位

最新动态

「地平线」副总裁余轶南与「理想汽车」智驾产品总监赵哲伦联手创业,入局具身智能赛道!

机器人头条

自动驾驶 人形机器人 具身智能 地平线

从深海探测到海洋强国:数字孪生助力海洋装备跨越式发展

DevOps和数字孪生

QCN9024 WiFi 6E Card with ath11k Support Exploring the Versatility

wifi6-yiyi

ath11k

Sora 文生视频技术大揭秘:能力惊艳但局限几何?

测吧(北京)科技有限公司

测试

Omi NTFS磁盘专家 for Mac(NTFS 磁盘读写工具)

Mac相关知识分享

非凸科技荣登脉脉2024“年度职得去雇主”榜单

非凸科技

Milvus×EasyAi:如何用java从零搭建人脸识别应用

Zilliz

Java 人脸识别 Milvus

用AI对抗AI!教代码调戏深度学习算法生成的假视频_AI&大模型_Katyanna Quach_InfoQ精选文章