利用深度学习将人脸变成表情包

现如今，自拍并分享已经成为许多人的日常习惯。除了社交功能外，自画像长期以来就是一种自我认同的方式。不过，自拍会受到现实的限制，漫画则不同，它让人们可以重新定义自我，而且比现实多了些温情少了些忧伤。

近日，谷歌在 Allo 中推出了一项功能，将神经网络和艺术品相结合，把自拍照变成个性化的表情包。用户只需自拍一下，它就可以自动生成漫画版本的照片。它还提供了定制选项，让用户可以进一步对其进行个性化处理。

传统的计算机视觉方法在将自拍照映射到艺术品时会分析图像的像素，读取像素值度量颜色、形状或纹理，然后通过算法确定属性值。但是，人们自拍的光照条件和姿势各种各样。虽然无论光照条件怎样，人都可以轻松地识别定性特征，如眼睛颜色，但这对计算机而言是一项非常复杂的任务。因为人解读的不只是蓝色或绿色的像素值，而是同时考虑了周边的视觉环境。因此，谷歌希望开发一种算法，使用和人类似的方式选取定性特征，而不是采用传统的方法，通过硬编码来解释光照条件、眼睛颜色等的变化。虽然他们自认为可以从头开始训练一个大型的卷积神经网络，但是他们希望通过一种更高效的方式获得结果，因为他们知道，将人脸变成漫画是一个需要反复迭代的过程。

所以，他们在谷歌现有的较为通用的计算机视觉神经网络上运行了一些试验。他们发现，在数以百万计的神经元中，有一些似乎适合创建个性化表情。此外，他们已经弄清楚如何提取他们不需要的东西。所以剩下的是提供一个经过人工标记的、小得多的示例样本，让分类器学习如何分离出神经网络已知的那些图像特征。为了创建出能让你的朋友认出来的漫画，谷歌和一个艺术家团队一起创建了可以代表各种特点的漫画。例如，艺术家们先设计了一套他们认为有代表性的发型，谷歌使用这些发型训练神经网络，从而将恰当的漫画匹配到合适的自拍照，然后由人判断输出的表情的质量。

在美学研究中，有一个著名的问题叫“恐怖谷理论”——如果全仿真机器人和真人几乎完全一样但又有极其细微的差别时会使人反感。在机器学习中，情况变得更为复杂。因此，谷歌认为，与其准确地复制一个人的外表，不如努力实现一个低分辨率模型，如表情符号。

世界上不存在“普同性美感”。人们在同他们的父母、朋友和同事交谈时表现是不一样的，因此，没有一个头像可以代表各种情况下的你。为了解决这个问题，Allo 与许多艺术家一起合作，听取他们的意见，变换表情包的风格。

目前，该特性只在Android 手机上可用，稍后会在iOS 上提供。

感谢陈思对本文的审校。

给InfoQ 中文站投稿或者参与内容翻译工作，请邮件至 editors@cn.infoq.com 。也欢迎大家通过新浪微博（ @InfoQ ， @丁晓昀），微信（微信号： InfoQChina ）关注我们。

创作场景

利用深度学习将人脸变成表情包