用AI对抗AI！教代码调戏深度学习算法生成的假视频_AI&大模型_Katyanna Quach

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么

AI 前线导读： 写代码用 AI 调戏 AI，检测 AI 生成的虚假图片、视频？这现在已经成为可能了，因为能表征图片、视频的真假的特征很容易被检测出来。要怎么做呢？让我们一起来看看吧！

更多干货内容请关注微信公众号“AI 前线”（ID：ai-front）

随着 AI 的崛起，人们已经可以用深度学习算法生成越来越多以假乱真的图片和视频。这也激发了美国的学者们的研究热情：如何设计算法检测出网络上用 AI 生成假图片、假视频，即所谓的“deepfakes” 呢？

生成对抗网络（Generative Adversarial Networks，GANs）是进行虚假图片、视频“创作”的法宝。这类神经网络可以帮助研究者们生成人造数据集（相关文章），用以在数据集不足的情况下训练人工智能算法。这类网络还可以协助艺术家进行肖像创作（相关文章）。

然而，和所有的技术一样，这项技术也有其不好的一面。比如，网络上的一些恶徒可以利用这项技术，将明星、前女友、政客或其他受害者的脸合成到色情明星的身体上。计算机合成结果会非常逼真，就像受害者真的在做限制级动作一样。而且，让人头疼的不只是淫秽影片那么简单。人们可以利用 AI 生成假的采访视频或个人声明，再配合上 AI 生成的声音（相关文章），让人与人之间从此没有信任。

现在，人们可以稍微松口气了。博士生李跃尊（音译）和纽约州立大学奥尔巴尼分校的助理教授刘思伟（音译）提出了一种新技术，可以识别深度学习算法（如开源项目DeepFake FaceSwap算法）生成的假视频。

目前，深度学习生成的假视频对于人类来说还不是那么难辨认。伪造的视频一般比较奇怪，人的面部表情不是很自然，而且动作会有延迟、不顺畅。而且，伪造的视频一般会比原视频分辨率低。因此，人们应该能很快意识到自己看到了假视频。然而，由于生成假视频的技术仍在不断发展，未来最好能有一种技术可以识别出假视频里的特征，从而提醒观看假视频却没有意识到的人。

检测深度学习生成的假视频

用计算机检测假视频，之前的做法是用一些特征作为基准，比如观察视频中人的眨眼情况，从而判断视频真假。这一般需要先训练一个 GAN 网络，然后利用这个 GAN 网络来训练其他网络以检测视频真假。

李和刘的方法却并不依赖于 GAN 网络，因此运行时间更短、需要的算力更低。首先，他们使用了计算机视觉中的传统算法来检测 24,442 张训练图像，并提取其脸部关键点。然后，他们会弯折或扭曲图像中的人脸特征，来模拟 DeepFake 生成的假图片、视频中可能会出现的怪异效果。最后，他们用真实的和扭曲的图像训练了一些卷积神经网络（CNN）作为分类器，该分类器可以给出一个视频为真还是为假的概率。训练完成后，他们向这些卷积神经网络中输入视频的截图，就可以检测这些截图中的人脸到底是真的还是伪造的。

“我们观察到，现有的 DeepFake 算法只能生成出分辨率有限的图像，这些低分辨率图像要经过扭曲才能扩展到和来源视频一样的分辨率。我们的方法就是基于这个观察。”李和刘在本月发表的一篇论文中这样解释道。

“这种变换是 DeepFake 算法所造出的假视频中特有的，而且我们证明，这种变换很容易被卷积神经网络捕捉到。”

二人将前述方法用到了四个卷积神经网络中。训练集包含 49 个真实视频和 49 个 DeepFake 算法生成的假视频。每个视频作为一个独立的样本，时长约为 11 秒。所有视频共有 32,752 帧。

由英国的牛津大学的研究者开发的老牌卷积神经网络——VGG16，在假视频识别任务中表现最差（精度为 83.3%）。而更为流行的一个 CNN——微软的研究者们开发的 ResNet50，给出了高达 97.4%的精度。

ResNet50 的一些变种也表现得很好。ResNet101 和 ResNet152 给出了 95.4%和 93.8%的精度，分别位列第二和第三。在将 deepfake 假视频看作一个整体的情况下，ResNet101 表现最好（精度为 99.1%），ResNet50 次之（98.7%），紧接着是 ResNet152（97.8%），而 VGG16 最差（84.5%）。

虽然这种检测方法很有前途，但研究者们目前还没有给出非常有意义的实验结果——他们的实验只是在他们精心挑选的图像和视频数据集上做的。换句话说，研究者们还需要在更多真实世界中的 DeepFake 视频上做实验，才能进一步验证他们的算法。另外，随着 GAN 网络技术的进步，假视频的质量也进一步提高，恐怕以后这种假视频的检测方法会越来越不适用。

“随着 DeepFake 技术的不断进化，我们也会继续改进这种检测方法”——学者们允诺道。“首先，我们会将多视频压缩的问题考虑进去，继续验证和改进我们算法的鲁棒性。其次，我们现在仅使用了他人设计好的网络架构（如 resnet 和 VGG）。为追求更加高效的检测结果，我们会针对 DeepFake 视频检测任务设计专门的网络。”

原文链接：

https://www.theregister.co.uk/2018/11/06/fight_ai_deepfakes

发布

暂无评论

创作场景

用 AI 对抗 AI！教代码调戏深度学习算法生成的假视频

检测深度学习生成的假视频

评论

Caché/M 数据库上面的那个 é 怎么打

app开发

用友发布数据资产入表解决方案加速激发数据要素价值

万界星空科技MES系统中的生产调度流程

万界星空科技电子电器装配行业MES解决方案

让艺术触手可及！3DCAT实时云渲染赋能真浪数字艺术馆首展

场场爆满的昇腾 AI 开发者创享日：照见产业数智化的涓涓动力

mac电脑强大的文件重命名工具A Better Finder Attributes 7注册激活版

极狐GitLab 镜像仓库使用技巧

2024年高效远程协同运维工具推荐

从 0 到 1 手动搭建 k8s 集群 - 添加 master 节点

技术写作及技术作者的概述和重要性 - 了解技术写

下一站 Gen AI 城市巡展指南来了！“码”上出发，Let's 构！

法语 Alt 代码表

德语 Alt 代码表

西班牙语 Alt 代码表

聊点写作踩坑那点破事儿

HuggingFists-低代码玩转LLM RAG(2) Query

群晖（Synology）新建存储池使用 Home 服务

大型语言模型在实体关系提取中的应用探索(二)

实时数据推送应用

高校刮起元宇宙风！3DCAT实时云渲染助力川轻化元校园建设

重磅发布！！！蚂蚁图团队开源高性能原生图存储系统CStore

【写作训练营打卡｜07】你知道文章的配图哪来的吗？

内置功率 MOSFET 的高频同步整流降压开关变换器

大模型扫盲问题集

C/C++内存操作 | AI工程化部署

大模型助力科技革命：2023年的里程碑与大模型的未来展望

37 | 贪心算法：如何用贪心算法实现Huffman压缩编码

创作场景

用 AI 对抗 AI！教代码调戏深度学习算法生成的假视频

检测深度学习生成的假视频

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载

推荐阅读