写点什么

AI 合成以假乱真:只需 7 张照片,就能让真人“社死”

  • 2022-12-21
    北京
  • 本文字数:2244 字

    阅读完需:约 7 分钟

AI合成以假乱真:只需7张照片,就能让真人“社死”

经过迅速发展,如今的 AI 技术已经可以利用社交媒体素材轻松伪造出有害照片。


近日,Arstechnica 的研究人员做了一项研究:大家在社交媒体上发布的真实照片,会被 AI 的二次创作“玩坏”吗?


为了找到答案,研究人员联系了一位志愿者,使用其提供的几张真实照片,用 AI 生成假照片。结果显示,这些假照片的威力巨大,很有可能破坏其声誉。最终,研究人员创建了一个名为约翰的虚拟人物,以其作为案例,一起看看 AI 是怎么把约翰“玩坏”的。

提供了 7 张照片后,约翰被 AI“玩坏”了


这位名叫约翰的虚构人物,在假想的场景中是一名小学教师。和大多数人一样,他在过去 12 年里通过 Facebook 发布了不少自己工作、居家和外出时的照片。



以约翰的 7 张照片作为训练数据,就能训练出足以伪造约翰形象的强大 AI 模型,并能把约翰的照片毫无破绽地放在任意背景之下。


这个 AI 模型生成的假照片栩栩如生,甚至到了以假乱真的底部,比如,约翰打扮成小丑跑去喝酒,约翰在周末参加准军事组织的训练,约翰几年前曾入狱服刑。





这些约翰照片来自名为 Stable Diffusion(1.5 版)的 AI 图像生成器,外加名为 Dreambooth 的技术。虽然约翰不是真人,但用真人的 5 张以上图像完全可以重现类似的结果。这类照片不难获取,社交媒体的发布内容可以、视频中的静止帧也行。


整个训练过程大概需要一个小时,训练完成后,图像内容的生成还需要几个小时——这不是因为生成过程太慢,而是研究人员从大量不完美的图片里挑出质量最高的图片。但无论如何,这样还是比亲自动手用 PS 画假约翰简单得多。


在 AI 的支持下,约翰可以是犯罪分子,也可以是变态狂人,如果使用针对色情内容优化的附加 AI 模型,约翰甚至可以成为色情明星。


AI 还能把约翰放置在奇妙的背景下,例如让他成为中世纪的骑士或者宇航员,让他显得年轻或衰老、肥胖或瘦弱、戴眼镜或不戴,也能给他换上不同的服饰。




有的合成图像并不完美。如果仔细观察,有经验的人会发现这些并非真图。但相应的 AI 技术一直在迅速发展,我们可能很快就无法分辨合成照片与真实照片间的区别。而且即使存在缺陷,这些伪造图像仍有可能毁掉约翰的名誉乃至生活。


这就是技术的两面性所在。人们当然可以用 AI 创建天马行空的神奇画面,Lensa 等近期大热的商业服务和应用就是一例。然而,一旦有人未经他人同意就使用对方的面部图像,那么同样的技术也可能造成可怕的后果。

背后的工作原理


计算机科学家们已经找到了利用真实照片教 AI 伪造新画面的高质量方法,在过去的一年里,这项技术正日渐成熟。不过,这项技术一直存在争议,因为除照片之外,它还允许人们在未经许可下模仿在世艺术家的创作风格。


目前最具影响力的 AI 图像生成器之一是 Stable Diffusion。这种深度学习图像合成模型能够利用文本描述生成全新图像,可以运行在 Windows 或 Linux PC 的强大本地 GPU 上,也可以在 Mac 或者租用的云端硬件上起效。


在 Stability AI 雄厚财力的支持下,CompVis 学术组织利用互联网上获取的几亿张公开图像训练出了 Stable Diffusion AI 模型。Stability AI 于 2022 年 8 月 22 日将 Stable Diffusion 以开源软件的形式发布,现在任何人均可免费使用,其功能也被集成至越来越多商业产品当中。


通过强化训练,Stable Diffusion 神经网络学会了单词与图像中各像素位置间的一般统计关联。大家可以给 Stable Diffusion 提供一条文本提示,例如“摩根·弗里曼坐在教室里”,然后就能得到相应的全新图像。


制作这类大明星的图像很简单,因为 Stable Diffusion 的训练数据集里没准有几百张摩根·弗里曼的照片,它知道这位演员长什么样子。但如果想制作约翰这类普通人的图像,就得给 Stable Diffusion 一点额外的帮助。这就是 Dreambooth 的意义所在。

Dreambooth 微调模型


谷歌研究人员于 2022 年 8 月 30 日宣布,Dreambooth 使用一种特殊的“微调”技术帮助 Stable Diffusion 完成了新的学习。



最初,Dreambooth 其实跟 Stable Diffusion 没有任何关系,而且谷歌为了防止被滥用而屏蔽了 Dreambooth 的代码。但在公布不久之后,就有人主动把 Dreambooth 跟 Stable Diffusion 结合了起来,并将其代码作为开源项目免费发布。


从那时起,Dreambooth 开始成为 Stable Diffusion 学习全新艺术风格的重要“家教”。用户们在线上存储库里分享自己的 Dreambooth 微调模型,并供其他人下载以快速获得类似的视觉效果。


但从一开始,谷歌研究人员就知道这种技术完全可以用到人身上,而麻烦也将随之而来。因此他们在公布 Dreambooth 时,使用的是柯基犬的图像。但这点小心思当然躲不过评判者的法眼,《麻省理工科技评论》批评称,AI 科学家显然是在用这种消极的方式回避其成果所带来的潜在负面影响。

用 AI“打败”AI


未来,也许会有新的技术手段来防范这种照片滥用。例如,法律可能要求未来的 AI 图像生成器在输出中嵌入肉眼不可见的水印,以供日后检验。


比如,Stable Diffusion 就默认嵌入水印,但开源版本的用户可以删除或禁用水印组件来解决问题。不过,即使法律强制要求,市面上也还有其他不加水印的 Deepfakes 技术存在。


最近,麻省理工学院的研究人员公布了 PhotoGuard 对抗方法,能用一种不可见的方法巧妙修改照片,借此防止 AI 操纵现有图像。但其目前只适用于 AI 编辑(即「修改」),而非图像训练或生成。


另外,时间也许能解决一切。随着人们对伪造图像认知的增强,社会文化最终也许能够消化掉这些新问题。我们会慢慢接受这样一种新的媒体呈现方式,并开始关注照片是否拥有可信来源。但在适应新形势之前,AI 合成的伪造品肯定会造成一段时期的混乱。

2022-12-21 13:4112266

评论

发布
暂无评论
发现更多内容

鸿蒙开发从开源进入到闭源(Harmony OS)开发主流

FinFish

HarmonyOS 鸿蒙开发 鸿蒙OS 小程序容器 混合开发

京东二面:为什么Netty要造FastThreadLocal?

王磊

倒计时 1 天!「飞天技术沙龙-CentOS 迁移替换专场」演讲亮点一览

OpenAnolis小助手

操作系统 龙蜥社区 CentOS 停服 CentOS 迁移最佳选择 Alibaba Cloud Linux

js通过时间戳以及随机数生成uuid

木偶

JavaScript

微服务项目搭建之技术选型

EquatorCoco

架构 微服务 云原生

文献解读-群体基因组第一期|《对BMI的影响:探究BMI的基因型-环境效应》

INSVAST

基因数据分析 生信服务 群体基因

索拉那Solana:技术与创新的融合,开启区块链新篇章

dappweb

区块链 Solana

推荐aeon,一个爆好用的 Python 库

高端章鱼哥

天津企业采购云管平台需要考虑哪些?选择哪家好?

行云管家

云计算 云管平台 天津

“有温度”的心理健康AI专业咨询师,陪伴你一路成长!

心大陆多智能体

低代码与人工智能:革新智能客服系统的高效之道

天津汇柏科技有限公司

低代码 智能客服 #人工智能

23ai中的True Cache到底能做啥?

不在线第一只蜗牛

AI 前端

手把手教你基于华为云,实现MindSpore模型训练

华为云开发者联盟

人工智能 深度学习 华为云 华为云开发者联盟 企业号2024年5月PK榜

网络安全行为可控定义以及表现内容简述

行云管家

网络安全 堡垒机 行为可控

心大陆AI大模型再加速,获批国内首个「人工智能心理算法」国家备案!

心大陆多智能体

以太坊现货ETF获批:引发ETH价格暴涨,市场热议达到高潮

区块链软件开发推广运营

dapp开发 区块链开发 链游开发 NFT开发 公链开发

百度沈抖:主力模型免费,是为了最大限度降低企业创新试错成本

Geek_2d6073

350种类型、10W+量级的API,企业应该怎么管?

芯盾时代

网络安全 物联网 API网关

AI合成以假乱真:只需7张照片,就能让真人“社死”_文化 & 方法_核子可乐_InfoQ精选文章