写点什么

99% 的人并不知道 AI 生成人脸已经达到什么水平

  • 2019-02-22
  • 本文字数:2043 字

    阅读完需:约 7 分钟

99%的人并不知道AI生成人脸已经达到什么水平

近日,利用生成对抗网络(GAN)自动生成动漫头像在网络上引发了热潮,各种或呆萌或高冷的头像并非来自任何一部动漫,而是由神经网络模型直接生成的。此后,一些更加疯狂的开发者搞出了更加不可思议的模型:直接生成人物照片。

先来玩儿个游戏

先来玩儿个简单的小游戏,猜猜看下面这两张图中哪一张是真实的照片:



选好了吗?答案揭晓了,真实的照片是——右边的这位美女!



是不是有些不可思议?左边这张怎么看都像是一张普通的照片啊,怎么会是 AI 生成的呢?但事实就是如此,左边的这张照片中的美女,没有国籍、没有姓名,根本不存在于这个世界。没错,这就是生成对抗网络 GAN 的强大威力。


如果你觉得这道题太简单,你也可以再来一道附加题。猜猜下面这张图中的两个漂亮妹子哪个是真实的?哪个是 AI 生成的?


“在互联网上,没人知道你是一个 AI”

上面的这个游戏是来自这个网站的作品:http://www.whichfaceisreal.com ,感兴趣的读者可以自己去感受一下。


这个网站的作者是来自华盛顿大学的两名教授:Carl T. Bergstrom 和 Jevin D. West,他们分别是生物学教授和信息科学教授。在网站的介绍页面,他们写了这样一段话:



“ 在互联网上,没有人知道你是一只狗。 ”


他们这样写道:


过去的四分之一个世纪里,我们在漫画里展示的教训中不断成长,互联网上的陌生人可能是任何身份、来自任何地方。音乐论坛上的管理员可能是住在他妈妈房子地下室的小屁孩,聊天室里的一个十四岁的女孩可能是一名卧底警察,邮箱中找你重金求子或者让你继承遗产的女富商更是让人一眼看过去就知道是骗子。


虽然我们已经学会不再相信对方的用户名和文字介绍,但是照片却不是这样。我们曾经一直相信,谁都无法凭空地合成一张图片,一张照片上的人物必定是来自现实中的某个人。当然,一个骗子可能用的是其他人的照片,但这样做是一个冒险的策略,在谷歌利用图片搜索进行反向查找,总能找到照片的来源。所以我们倾向于信任图片,带图片的商家资料显然更可信,在约会网站上的照片可能比本人差距要大很多,但是因为有照片,我们总能找到它一定来源于某个人。


可是,新的逆向机器学习算法打破了这一规则,它可以让人们快速生成从未存在过的人的“合成照”。



这些照片都是 AI 生成的,你相信吗?


计算机很好很强大,但你作为人类的视觉处理系统其实更好。如果你了解一些技巧,就可以一眼就看出这些假货,至少目前是这样。用于生成它们的硬件和软件将继续改进,并且可能只用几年时间就能骗过专业的检测系统。


我们的目标是让您了解:网络上的身份可以轻松伪装,并帮助您一目了然地发现这些骗局。

万“恶”之源:StyleGAN

这个网站的作者强调说:他们并不是这套模型的原作者,而是使用者,真正的作者是来自知名半导体公司英伟达的几位工程师:Tero Karras,Samuli Laine 和 Timo Aila,他们基于 Ian Goodfellow 及其同事在 Generative Adversarial Neworks(GANs)的早期工作而进行的研发,做出了这套名为:StyleGAN 的模型。


2019 年 2 月,图形硬件制造商英伟达发布了照片级真实面部生成软件 StyleGAN 的开源代码。该软件采用生成对抗网络(GAN)方法,利用两个神经网络互相训练,一个试图生成与真实照片无法区分的合成图像,另一个试图分辨出差异,这样训练几个星期后,图像创建网络可以生成像上面展示的那样以假乱真的​​图像。



更多依靠 StyleGAN 合成的照片


除了对抗性网络系统的代码之外,NVIDIA 还以神经网络权重的形式发布了数据,用于完整训练的模型,以便用户可以绕过漫长的训练过程并立即开始生成面部合成照。在训练过程中,GAN 需要一组真实的面孔来学习,NVIDIA 提供的网络拥有了两个大型面部照片集合 CELEBA-HQ 和 FFHQ,前者包括数以千计的名人面孔,后者包括根据创意公共许可证发布到 Flickr 的 70,000 张面部照片。



用于训练的来自来自FFHQ数据集的真实面部照片


除了我们上面展示的网站,由 StyleGAN 合成的照片还发布在另一个网站上:http://thispersondoesnotexist.com/


访问者每刷新一次就会生成一张新的照片。不过,毕竟是依靠算法生成的图片,总有玩儿脱的时候,下图展示的就是一些合成失败的案例:



扭曲的下巴与诡异的帽子



“分筋错骨手”

人脸都能合成了,还有安全可言吗?

虽然合成人脸照片很酷,但是这样的做法不免的引起了网友的恐慌。有不少人表示:人脸都能合成,安全问题该如何保证?


我们都知道对话机器人已经部分取代了客服的工作,不少银行、商家的客服都已经是 AI 了。我们的编辑前不久就接到一通来自银行的客服电话,声音虽然仍有明显的合成痕迹,但已经很贴近真实的人声了。


与你对话的是 AI,给你看的照片也是 AI,就连视频里的人物都可以利用 deepfakes 来进行“换脸”,人工智能虽然极大地方便了我们的生活,但由此带来的安全隐患缺不得不引起重视。人脸识别目前几乎是最为普及的 AI 技术了,目前尚不清楚是否能够依靠“换脸”这样的技术手段骗过此类系统,但是由于这种手段的存在,总让人难以放心。

最后彩蛋

附加题图中左边的漂亮妹子是 AI 生成的,而右边则是真实存在的。你猜对了吗?



更多内容,请关注 AI 前线



2019-02-22 08:0010531
用户头像
陈思 InfoQ编辑

发布了 576 篇内容, 共 279.8 次阅读, 收获喜欢 1301 次。

关注

评论 6 条评论

发布
用户头像
可以可以
2019-02-22 11:41
回复
s
2019-02-22 16:37
回复
das
2019-02-22 16:37
回复
asd
2019-02-22 16:40
回复
用户头像
我试玩了,两边都点过了,所有点击行为都是真实的照片;然后我尝试点击错误的照片,依然显示真实照片!
2019-02-22 09:38
回复
shi d
2019-02-22 16:46
回复
没有更多了
发现更多内容

详述 IntelliJ IDEA 中自动生成 serialVersionUID 的方法

南屿

IntelliJ IDEA IntelliJ IDEA 2023破解 Serializable

High-performance 4-core processor-IPQ9554-IPQ8072-more advanced Wi-Fi 6E technology

wifi6-yiyi

IPQ8072 ipq9554 4-core

未来AI领域的颠覆性力量

百度开发者中心

自然语言 #人工智能 文心一言

Markdown文本编辑器Typora Mac使用教程

南屿

Typora Markdown 编辑器

termius使用ssh教程 【XShell的神器Termius】

南屿

SSH Termius

一文告诉你为什么时序场景下 TDengine 数据订阅比 Kafka 好

TDengine

时序数据库 #TDengine

FIL NEW算力挖矿系统开发

l8l259l3365

Tugraph Analytics图计算快速上手之紧密中心度算法

TuGraphAnalytics

cc 图计算 紧密中心度

强大但并非万能,智能客服之挑战

百度开发者中心

智能客服 #人工智能 千帆大模型平台

HarmonyOS Codelab样例—弹窗基本使用

HarmonyOS开发者

HarmonyOS

OpenHarmony Meetup常州站招募令

OpenHarmony开发者

OpenHarmony

CodeArts Check代码检查服务用户声音反馈集锦(3)

华为云PaaS服务小智

云计算 代码质量 华为云 代码检查

修旧利废,提升净资产收益率

用友BIP

资产管理

软通咨询杨念农:咨询2.0是企业数字化转型的大脑

软通咨询

数字化转型 #人工智能 管理咨询 数字化转型咨询

fastposter 新版本 v2.17.0 强势发布!让海报开发更简单

物有本末

图片处理 海报生成器 海报生成 海报小程序

3步体验在DAYU200开发板上完成OpenHarmony对接华为云IoT

华为云开发者联盟

鸿蒙 物联网 华为云 华为云开发者联盟 企业号9月PK榜

文心一言 VS 讯飞星火 VS chatgpt (96)-- 算法导论9.3 1题

福大大架构师每日一题

福大大架构师每日一题

数字化转型与架构-架构设计篇|什么是架构风格和架构模式?

数字随行

数字化转型

专业级PDF编辑和管理 Acrobat Pro DC 2023 for Mac

胖墩儿不胖y

Mac软件 pdf编辑器 编辑pdf pdf工具

行云管家支持信创吗?是真的吗?

行云管家

信创 国产化 行云管家

基于异常上线场景的实时拦截与问题分发策略

百度Geek说

大数据 实时计算 企业号9月PK榜 反混淆

快手发布文生图大模型“可图”,探索AI新玩法

Geek老T

短视频 AIGC

Rocketmq并发和顺序消费的失败重试机制

石臻臻的杂货铺

RocketMQ

万能音视频转换器 Permute 3 for mac免激活中文版

mac大玩家j

Mac软件 音频格式转换器 音频转换

百度智能云引领建设智能云标准生态,第十二届云计算标准和应用大会成功召开

Baidu AICLOUD

智能云 大模型 AI 原生云

什么是高匿代理,与普匿和透明代理的区别是什么?它有什么作用?

巨量HTTP

代理IP http代理

区块链数字货币交易所开发方案,去中化交易平台搭建

V\TG【ch3nguang】

Microsoft word 2019 for Mac v16.78 beta中文激活版

mac

windows 办公软件 苹果mac Word 2019 文字处理软件

市面上支持信创的堡垒机哪家好?为什么?

行云管家

网络安全 信创 数据安全 堡垒机

区块链去中化钱包开发方案,交易所钱包和元宇宙软件开发

V\TG【ch3nguang】

专业开发区块链DAPP去中心化系统模式开发系统定制

V\TG【ch3nguang】

99%的人并不知道AI生成人脸已经达到什么水平_AI&大模型_陈思_InfoQ精选文章