腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作_腾讯_陈利鑫

9 月 6 日，在腾讯优图计算机视觉峰会上，腾讯高级执行副总裁汤道生宣布，腾讯优图实验室升级为腾讯计算机视觉研发中心，并首次公开该实验室最全面的应用落地案例；与此同时，腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作，探讨通过学术奖金、产学研交流等多种形式，在人工智能前沿研究领域展开广泛合作。

腾讯优图实验室现在已升级为腾讯计算机视觉研发中心，聚焦的方向为计算机视觉研究。近年来，虽然计算机视觉在在技术和应用层面均取得了巨大的进步，但面临着的挑战和瓶颈也不可忽视。

“一些重要的思想，只有拥有“傻”的精神，执着的精神，才能被证明是对的。”斯坦福大学电气工程荣誉教授，密码学先驱，2015 年图灵奖获得者 Martin Hellman 在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域，包括计算机视觉，这种精神都同样适用。

与《科学》达成战略合作

峰会上，腾讯高级执行副总裁汤道生宣布国际化战略合作项目：与《科学》（Science）杂志达成战略合作，推动全球计算机视觉发展。

谈到与《科学》的合作的契机，贾佳亚说道，与学术的结合已经成为人工智能领域的趋势，腾讯渴望建立与国际上紧密的合作关系，腾讯将研发和场景结合，旨在为中国科研人员引入最先进的学术平台。另外，《科学》的科学家资源丰富，通过将腾讯的实践应用运用到科学家们的研发和教学中，建立起产业和研究联系的机制，以促进中国人工智能发展。

但关于与《科学》杂志的具体合作规划，腾讯未透露相关信息。

腾讯优图最全公开应用落地

腾讯优图实验室成立于 2012 年，是腾讯三大人工智能实验室之一，聚焦计算机视觉，专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比 AI Lab，优图实验室更偏应用，后者更多地做基础研究，腾讯公司对这两者的投入比例大概为 1:1。而三大人工智能实验室之一的微信 AI 团队，则主要聚焦于微信中的 AI 功能应用。

据腾讯优图实验室总经理、杰出科学家贾佳亚介绍，目前，腾讯优图每日服务调用次数达 3 亿次，主要调用技术为图像。

在技术上，优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。

目前优图 AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域，在手机 QQ、QQ 空间、QQ 音乐、微信、广点通、全民 K 歌、腾讯觅影等产品中落地，并与滴滴、公安部门、快递等行业已经有了合作案例。其中，智能医疗和自动驾驶是该实验室今年刚涉足的领域。

医疗 AI 案例

2017 年，腾讯优图实验室借助图像识别、深度学习等技术，在肺癌、糖尿病性视网膜病变早筛上取得显著进展，并通过腾讯首个医疗 AI 产品“腾讯觅影” 进入大规模的临床预试验，在早期肺癌识别，敏感度 (识别正确率) 达到 86%以上，在良性肺结核的特异性 (识别正确率)超过 86%；糖尿病视网膜病变筛查，筛查准确率提升至 96%，几乎接近医生的诊断结果。

安防 AI 案例

优图天眼系统：以安防需求为导向，基于多场景海量数据库，自研深度学习和集群计算的人脸检索引擎，面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统，毫秒级识别速度，迅速完成目标人脸和名单照片库的比对，及时返回可疑人脸数据，实现报警通知。

智慧零售案例

腾讯优 Mall 智能零售系统：腾讯优图实验室联合腾讯云打造。基于腾讯优 Mall 智能零售系统，通过人脸检索、识别技术，识别进店顾客身份，并为老客户进行推荐，最后通过“刷脸”完成支付动作，提升消费者体验，并帮助商场优化购物动线、店铺位置、货架陈列，提升导购推荐效率以及优化广告人群定向属性等，促使线下门店实现数据化和智能化，改变门店运营方式，让门店具有思考能力。

目前，优 Mall 智能零售系统已经通过百丽进行落地。

金融，政务 AI 案例

FaceIn 人脸核身解决方案：一种通过用户的一段自拍视频（或一张自拍照）与另外一张照片（可来源于身份证或事先留存自拍照）之间的 1:1 人脸验证来确认用户身份的技术手段，主要包括身份证 OCR 、活体检测、人脸比对。优图人脸核身服务是业内首家在金融行业（微众银行 APP）全量上线的核身服务，既能满足用户实名认证的需求，还能在识别用户为本人的同时判断是否为真人。目前，优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用，同时被应用在政务领域，如“远程缴税”“远程领取社保”。

互联网 AI 案例

为短视频拍摄、直播、图像处理工具等互联网产品推出了包含「主播核身 + 美颜特效」的视频直播解决方案，通过主播的自拍视频（或一张自拍照）与另外一张照片（可来源于身份证或事先留存自拍照）之间的 1:1 人脸验证来确认主播身份，防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在 B 站、东方财富、快看漫画等多个产品中落地使用；安全审核解决方案基于优图智能鉴黄技术、暴恐图片识别技术、OCR 技术和人脸识别技术，可以精准识别出图片中的露点 & 不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物，针对广告、社交、游戏、直播、短视频等行业存在的 UGC 内容，辅助甚至代替人工过滤垃圾，提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。

物流业 AI 案例

优图实验室与顺丰达成合作，针对运单的收寄件人电话号码、和收件人省市区地址信息进行 OCR 自动识别信息，再结合自有运单数据库，可以自动匹配到更完整更充分的运单各字段信息，大幅提升运单信息录入效率和物流资源的调度匹配能力，支持印刷体和手写体识别，可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类，也支持票据、运单等定制化场景的识别，可以有效的代替人工录入信息的场景。

（优图 OCR 技术与竞品数据比较）

（AI+ 社交娱乐优图 Facekit，目标是摆脱手机端对于三维的依赖，希望通过单目摄象头，完成整个脸部追踪和三维重建）

其中，在 AI+ 社交娱乐领域，腾讯优图此前的开发集中在 3D 人脸、人脸分析和人脸编辑方面，比如用新的方法改变人的外貌、改变人的皱纹等。但今年，优图新做的技术包括人体分割，达到了 96% 的准确率；在人体关键点追踪方面，超过 80 个点的追踪标准的误差率降低至 0.48；人体重建方面，优图可以重建 3D 人脸，这对于游戏行业的应用非常巨大。

另外，优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉，3D 建模是非常昂贵的过程，我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂，优图则可以通过一个 Video 就能实现一个 3D 建模的匹配和完成，这包括几个重要的方面：一是人体重建算法，第二是动作捕捉的算法，优图在人体重建可以达到 53 毫米的精度，动作捕捉是 74 毫米的精度。在游戏的设计和研发过程中，这会产生非常大的作用。

以上二维码为腾讯优图与《科学》杂志合作上线的 AI 产品体验小程序，有兴趣的朋友可以尝试下。

计算机视觉领域仍有待突破

正如斯坦福大学电气工程荣誉教授，密码学先驱，2015 年图灵奖获得者，现如今已 70 多岁高龄的 Martin Hellman 在演讲中以几个自己的个人经历，见证了计算机视觉技术跨世纪的发展。

19 世纪 70 年代，Hellman 在 IBM 工作时有一个关于 OCR 识别邮政编码的项目。当时，这对他来说是个巨大的挑战，因为当时 OCR 一分钟只能识别一个邮编，比人的速度还慢。但是，随着计算机视觉技术的发展，这已经不是问题，因为 OCR 识别邮编的速度已经提高到 5s 识别一个邮编，现如今更是花 0.5s 的时间就可以做到。

但计算机视觉虽然历经了六十年的发展，成为备受关注的人工智能关键技术之一。但是到今天为止，真正的大规模成熟应用还是屈指可数，比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象，很大的原因是技术的局限，很多技术还面临着挑战。以 Object detection（物体检测）任务为例，我们有从 Fast R-CNN 、Faster R-CNN、R-FCN 到 FPN 等各种不同的目标检测器，但 2016 年 ILSVRC 最好的 MAP 仅有 0.6627。包括几个最常用的落地产品，如视频监控，也并非完全成熟，还存在着视频数据采集单一，视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果，现实世界的识别更加复杂，存在的挑战和困难也更多。

这些例子表明，计算机视觉目前还只能用于一些对准确率要求不是特别高的场景，还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域，正如 Martin Hellman 所说，“一些重要的思想，只有拥有“傻”的精神，执着的精神，才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破，同样也需要这种精神。

感谢蔡芳芳对本文的审校。

发布

暂无评论

创作场景

腾讯优图升级为计算机视觉研发中心，与《科学》宣布战略合作

与《科学》达成战略合作