写点什么

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作

  • 2018-09-06
  • 本文字数:3653 字

    阅读完需:约 12 分钟

9 月 6 日,在腾讯优图计算机视觉峰会上,腾讯高级执行副总裁汤道生宣布,腾讯优图实验室升级为腾讯计算机视觉研发中心,并首次公开该实验室最全面的应用落地案例;与此同时,腾讯优图实验室也正式宣布和《科学》期刊达成了战略合作,探讨通过学术奖金、产学研交流等多种形式,在人工智能前沿研究领域展开广泛合作。

腾讯优图实验室现在已升级为腾讯计算机视觉研发中心,聚焦的方向为计算机视觉研究。近年来,虽然计算机视觉在在技术和应用层面均取得了巨大的进步,但面临着的挑战和瓶颈也不可忽视。

“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者 Martin Hellman 在演讲中讲述自己获得图灵奖的过程时如此说道。在所有研究领域,包括计算机视觉,这种精神都同样适用。

与《科学》达成战略合作

峰会上,腾讯高级执行副总裁汤道生宣布国际化战略合作项目:与《科学》(Science)杂志达成战略合作,推动全球计算机视觉发展。

谈到与《科学》的合作的契机,贾佳亚说道,与学术的结合已经成为人工智能领域的趋势,腾讯渴望建立与国际上紧密的合作关系,腾讯将研发和场景结合,旨在为中国科研人员引入最先进的学术平台。另外,《科学》的科学家资源丰富,通过将腾讯的实践应用运用到科学家们的研发和教学中,建立起产业和研究联系的机制,以促进中国人工智能发展。

但关于与《科学》杂志的具体合作规划,腾讯未透露相关信息。

腾讯优图最全公开应用落地

腾讯优图实验室成立于 2012 年,是腾讯三大人工智能实验室之一,聚焦计算机视觉,专注在图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。相比 AI Lab,优图实验室更偏应用,后者更多地做基础研究,腾讯公司对这两者的投入比例大概为 1:1。而三大人工智能实验室之一的微信 AI 团队,则主要聚焦于微信中的 AI 功能应用。

据腾讯优图实验室总经理、杰出科学家贾佳亚介绍,目前,腾讯优图每日服务调用次数达 3 亿次,主要调用技术为图像。

在技术上,优图重点专注于图像技术及人脸技术的研究及应用探索。图像技术包含图像识别、智能鉴黄、OCR 技术、图像分割以及超分辨率技术等。人脸识别包含人脸配准追踪技术、人脸核身技术、活体检测技术、海量人脸检索技术等。

目前优图 AI 技术已经广泛应用在零售、工业、社交娱乐、社会公益、道路感知、金融、鉴黄、安防、医疗、政务等领域,在手机 QQ、QQ 空间、QQ 音乐、微信、广点通、全民 K 歌、腾讯觅影等产品中落地,并与滴滴、公安部门、快递等行业已经有了合作案例。其中,智能医疗和自动驾驶是该实验室今年刚涉足的领域。

医疗 AI 案例

2017 年,腾讯优图实验室借助图像识别、深度学习等技术,在肺癌、糖尿病性视网膜病变早筛上取得显著进展,并通过腾讯首个医疗 AI 产品“腾讯觅影” 进入大规模的临床预试验,在早期肺癌识别,敏感度 (识别正确率) 达到 86%以上,在良性肺结核的特异性 (识别正确率)超过 86%;糖尿病视网膜病变筛查,筛查准确率提升至 96%,几乎接近医生的诊断结果。

安防 AI 案例

优图天眼系统:以安防需求为导向,基于多场景海量数据库,自研深度学习和集群计算的人脸检索引擎,面向寻亲、缉查布控、刑侦办案、安防活动、社会服务等多场景推出的智能化海量人脸检索解决方案。优图天眼支持亿级别库的人脸检索系统,毫秒级识别速度,迅速完成目标人脸和名单照片库的比对,及时返回可疑人脸数据,实现报警通知。

  

智慧零售案例

腾讯优 Mall 智能零售系统:腾讯优图实验室联合腾讯云打造。基于腾讯优 Mall 智能零售系统,通过人脸检索、识别技术,识别进店顾客身份,并为老客户进行推荐,最后通过“刷脸”完成支付动作,提升消费者体验,并帮助商场优化购物动线、店铺位置、货架陈列,提升导购推荐效率以及优化广告人群定向属性等,促使线下门店实现数据化和智能化,改变门店运营方式,让门店具有思考能力。

目前,优 Mall 智能零售系统已经通过百丽进行落地。

金融,政务 AI 案例

FaceIn 人脸核身解决方案:一种通过用户的一段自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认用户身份的技术手段,主要包括身份证 OCR 、活体检测、人脸比对。优图人脸核身服务是业内首家在金融行业(微众银行 APP)全量上线的核身服务,既能满足用户实名认证的需求,还能在识别用户为本人的同时判断是否为真人。目前,优图人脸核身服务已在微众银行、联通、滴滴多个产品中落地使用,同时被应用在政务领域,如“远程缴税”“远程领取社保”。

互联网 AI 案例

为短视频拍摄、直播、图像处理工具等互联网产品推出了包含「主播核身 + 美颜特效」的视频直播解决方案,通过主播的自拍视频(或一张自拍照)与另外一张照片(可来源于身份证或事先留存自拍照)之间的 1:1 人脸验证来确认主播身份,防止主播身份造假。美颜特效模块包含了美容美妆、滤镜、动态贴纸、人脸融合等一系列与美相关的能力。目前优图视频直播解决方案已在 B 站、东方财富、快看漫画等多个产品中落地使用;安全审核解决方案基于优图智能鉴黄技术、暴恐图片识别技术、OCR 技术和人脸识别技术,可以精准识别出图片中的露点 & 不雅行为等色情内容、暴力恐怖内容、恶意文本以及政治敏感人物,针对广告、社交、游戏、直播、短视频等行业存在的 UGC 内容,辅助甚至代替人工过滤垃圾,提高审核效率。目前优图视频直播解决方案已在斗鱼、龙珠、映客等平台上线使用。

物流业 AI 案例

优图实验室与顺丰达成合作,针对运单的收寄件人电话号码、和收件人省市区地址信息进行 OCR 自动识别信息,再结合自有运单数据库,可以自动匹配到更完整更充分的运单各字段信息,大幅提升运单信息录入效率和物流资源的调度匹配能力,支持印刷体和手写体识别,可以高精度识别身份证、名片、银行卡、行驶证驾驶证等卡证类,也支持票据、运单等定制化场景的识别,可以有效的代替人工录入信息的场景。

     

(优图 OCR 技术与竞品数据比较)

  

(AI+ 社交娱乐 优图 Facekit,目标是摆脱手机端对于三维的依赖,希望通过单目摄象头,完成整个脸部追踪和三维重建)

其中,在 AI+ 社交娱乐领域,腾讯优图此前的开发集中在 3D 人脸、人脸分析和人脸编辑方面,比如用新的方法改变人的外貌、改变人的皱纹等。但今年,优图新做的技术包括人体分割,达到了 96% 的准确率;在人体关键点追踪方面,超过 80 个点的追踪标准的误差率降低至 0.48;人体重建方面,优图可以重建 3D 人脸,这对于游戏行业的应用非常巨大。

另外,优图进行的新探索还包括人体三维和三维重建。很多游戏里面我们需要大量的动作捕捉,3D 建模是非常昂贵的过程,我们要让娱乐设备姿态捕捉要人体建模。传统的游戏姿势捕捉和人体建模成本高昂,优图则可以通过一个 Video 就能实现一个 3D 建模的匹配和完成,这包括几个重要的方面:一是人体重建算法,第二是动作捕捉的算法,优图在人体重建可以达到 53 毫米的精度,动作捕捉是 74 毫米的精度。在游戏的设计和研发过程中,这会产生非常大的作用。

  

以上二维码为腾讯优图与《科学》杂志合作上线的 AI 产品体验小程序,有兴趣的朋友可以尝试下。

计算机视觉领域仍有待突破

正如斯坦福大学电气工程荣誉教授,密码学先驱,2015 年图灵奖获得者,现如今已 70 多岁高龄的 Martin Hellman 在演讲中以几个自己的个人经历,见证了计算机视觉技术跨世纪的发展。

19 世纪 70 年代,Hellman 在 IBM 工作时有一个关于 OCR 识别邮政编码的项目。当时,这对他来说是个巨大的挑战,因为当时 OCR 一分钟只能识别一个邮编,比人的速度还慢。但是,随着计算机视觉技术的发展,这已经不是问题,因为 OCR 识别邮编的速度已经提高到 5s 识别一个邮编,现如今更是花 0.5s 的时间就可以做到。

但计算机视觉虽然历经了六十年的发展,成为备受关注的人工智能关键技术之一。但是到今天为止,真正的大规模成熟应用还是屈指可数,比如指纹识别、车牌识别或者数码相机里面的一些人脸检测技术。出现这种现象,很大的原因是技术的局限,很多技术还面临着挑战。以 Object detection(物体检测)任务为例,我们有从 Fast R-CNN 、Faster R-CNN、R-FCN 到 FPN 等各种不同的目标检测器,但 2016 年 ILSVRC 最好的 MAP 仅有 0.6627。包括几个最常用的落地产品,如视频监控,也并非完全成熟,还存在着视频数据采集单一,视频中个体尺度各异、视频分辨率低、个体部分遮挡、拍摄视角变化等问题都会影响到算法的实际应用效果,现实世界的识别更加复杂,存在的挑战和困难也更多。

这些例子表明,计算机视觉目前还只能用于一些对准确率要求不是特别高的场景,还远没有达到大规模应用的程度。但随着越来越多的企业和研究资源进入这一领域,正如 Martin Hellman 所说,“一些重要的思想,只有拥有“傻”的精神 ,执着的精神,才能被证明是对的。”计算机视觉领域出现下一个技术或应用上的突破,同样也需要这种精神。

感谢蔡芳芳对本文的审校。

2018-09-06 19:004992
用户头像

发布了 42 篇内容, 共 14.7 次阅读, 收获喜欢 53 次。

关注

评论

发布
暂无评论
发现更多内容

沉寂唯品会3年,毅然辞职冲刺阿里,我是怎么备战金三银四的

Java 程序员 后端

淘系,60W年薪大牛!新肝出一份,细说JVM内存模型

Java 程序员 后端

深入浅出!全面剖析Java反射-Reflection,java项目开发实战入门电子书百度云

Java 程序员 后端

来自北京大学NOIP金牌选手yxc的常用代码模板3——搜索与图论

Java 程序员 后端

死磕Spring之AOP篇 - Spring AOP常见面试题,java高级开发工程师简历

Java 程序员 后端

每日一学:这个-RabbitMQ-必会-Routing路由模式,你学会了吗

Java 程序员 后端

浅析Mysql索引数据结构演变,让你一看就懂,java业务场景面试题

Java 程序员 后端

消息队列面试题及答案,大V推荐

Java 程序员 后端

涨姿势,Java中New一个对象是个怎么样的过程?,linux操作系统实用教程教师用书

Java 程序员 后端

架构设计基础知识整理,java常用设计模式面试

Java 程序员 后端

欲速则不达,欲达则欲速!,mysql主从复制原理两主一从ID

Java 程序员 后端

每天一遍、阿里相见,Github爆火的spring高级源码解析免费下载

Java 程序员 后端

来自北京大学NOIP金牌选手yxc的常用代码模板4——数学知识

Java 程序员 后端

栈实现队列(队列实现栈),java编程规范pdf百度云

Java 程序员 后端

毕业三年,从小公司到大厂,先后四面阿里,沈剑架构师训练营

Java 程序员 后端

消息疯狂堆积!RocketMQ出Bug了?,rabbitmq分布式事务原理

Java 程序员 后端

查询太慢?看看ES是如何把索引的性能压榨到极致的!,java基础程序设计

Java 程序员 后端

毕业两年,工作三年Java程序员的一点点体会与建议,java面试问项目流程

Java 程序员 后端

测试用例的设计方法及案例,java技术框架

Java 程序员 后端

深入P8级别JAVA底层知识:你知道阿里P8需要掌握哪些技术吗?

Java 程序员 后端

来自阿里大牛20000字总结-+-40张图文详解,我就不信你还参透不了并发编程

Java 程序员 后端

极速体验docker容器健康,高并发分布式系统架构

Java 程序员 后端

Go channel,面试官会这样问

Rayjun

channel Go 语言

毕业两年面试阿里成功,月薪36k,分享一下我的经历,锁机制(本地锁+分布式锁)超全分析

Java 程序员 后端

泪目!跳槽太不容易,蚂蚁金服三轮面试,linux高可用集群架构毕业设计

Java 程序员 后端

浅析Mysql索引数据结构演变,让你一看就懂(1),意外收获字节跳动内部资料

Java 程序员 后端

深入浅出!带你重学Java—ArrayList,mongodb的存储原理

Java 程序员 后端

架构师成长之路-docker 搭建es集群,rocketmq教程教程

Java 程序员 后端

元宇宙到底是个啥?

石云升

元宇宙 10月月更

毕业就想进大厂?啃完这篇阿里大神整理的Kafka神仙文档,从此面试底气十足

Java 程序员 后端

教学改革拆除“骨鲠”,产教融合的“一鱼多吃”创新之路

脑极体

腾讯优图升级为计算机视觉研发中心,与《科学》宣布战略合作_腾讯_陈利鑫_InfoQ精选文章