写点什么

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一

  • 2020-11-02
  • 本文字数:4293 字

    阅读完需:约 14 分钟

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一

过往,人工智能的发展一直伴随着业界对是否会引发伦理问题的讨论,这也让很多技术停留在了实验室中,很难走出去,真正落到产业界。自 2012 年成立以来,腾讯优图实验室便在人工智能的各个领域展开了研究,尤以人脸识别为最,坚持基础研究、产业落地两条腿走路的优图实验室在科技向善上找到了最佳的落地姿势。

一家实验室的竞争力是什么?

在不同的阶段、不同的环境和不同的位置,实验室所扮演的角色以及承载的使命不尽相同。


在人工智能领域,很多技术突破尚需依赖学术进展,科技巨头们纷纷开始扶持内部实验室的发展,并不断招揽学术界的大佬加盟工业界。但是,实验室在一家企业中的定位一直不是很清晰,纯粹的学术研究意味着不仅烧钱,短期内还很难看到收益。


历史上最成功的实验室当属贝尔实验室,辉煌时期的贝尔实验室平均每天都会获得一项专利,这里诞生了 UNIX 系统、C 语言、手机通讯系统基础理论等,11 位科学家获得了诺贝尔奖,16 位获得美国最高科学、技术奖,4 位获得图灵奖…


20 世纪末,美国司法部依据《反托拉斯法》拆分了 AT&T,贝尔实验室也被剥离成为了朗讯科技公司的组成部分,由于朗讯的经营情况不甚乐观,根本养不起一万多人的贝尔实验室,这导致实验室不得不裁员,实力大幅下降,被迫以出售专利来平衡支出,此后辗转到了诺基亚所有,也依旧没有恢复往昔荣耀。


创造出如此多辉煌的贝尔实验室最终都难逃落败,其他实验室又该如何抉择呢?如果存在的价值明确,那发展路径大致清晰。那么,实验室在一家科技巨头内部存在的价值是什么呢?当时,刚刚加入腾讯优图实验室的黄飞跃或许也在思考这个问题。


2012 年,现任腾讯优图实验室副总经理的黄飞跃发现公司内部众多业务部门都对图片压缩和传输有着较高需求,因此将图片二次压缩作为当时的重点研究方向,并借解决该问题为优图团队打开了声量。随后的几年,优图实验室成功协助微众银行完成了线上 AI 核身,并将技术在 QQ、QQ 空间、QQ 音乐、财付通、天天 P 图等明星产品中成功落地,这一落地将优图实验室顺利从一个单纯提供 AI 能力的实验室转型为一家能够助力行业的机构,并在公司内部找到了实验室的特殊价值。


在接受 InfoQ 的独家采访中,黄飞跃表示希望将腾讯优图实验室打造成为国际最顶尖的人工智能实验室。一直以来,优图实验室坚持基础研究和产业落地两条腿同时走路,秉持着“研究成果落地才能产生价值的原则”,技术研究以落地为导向,关注产业落地和科技向善。


“虽然行业越来越强调 AI 的落地了,但是技术一定有一个“研究-落地”的过程。技术永远是在持续更新和进步的,实验室可以给到相对纯粹的研究环境,技术的更新迭代也可以反哺产业,给产业持续带来活力。”


腾讯在 AI 领域建立了实验室矩阵,包括腾讯 AI Lab、优图实验室、Robotics X(机器人)等 AI 实验室;其中优图实验室聚焦计算机视觉这一领域。在产业落地层面,优图实验室通过腾讯云对外输出 AI 能力,技术深度应用到内容、游戏、社交、医疗、零售、到出行多个产业及领域。


“如果说 AI 路上的重要决定,我觉得做人脸识别技术是一个重要决策。”

超前布局人脸识别,这是一个正确的选择

早在 2012 年,人脸识别尚未成为热门技术,而优图实验室就已经把它当作中长期技术项目在布局。团队同学都相信,自己所做的研究终究会产生价值,因此愿意潜心去做一些中长期的研究。从 2017 年开始,人脸的相关应用开始发光发亮,从 2017 年 7 月被业界点赞的微信办证服务,到微信刷脸支付,再到后来一系列基于人脸识别的科技向善应用等,都是得益于优图实验室早期的技术积累。


“在人工智能领域,人脸识别算是落地比较成功的,包括中国的前几大人工智能创业公司都以此起家,这也在侧面说明了该项技术具有一定的成熟度,并且已经探索出了一些合适的商业化的模式。”


“可能我们运气比较好吧”,优图专家研究员及昊天研究中心技术负责人郭晓威表示,2012 年前后,深度学习才开始表现出在大规模集成上的有效性,优图就认为其将来一定会有较好的发展。2014 年,团队刚好接到微众银行人脸核身的需求,就是做远程登录核审;2015 年前后,又赶上了人工智能的风口;随后,又遇到了产业互联网的风口。


AI 落地难,产业落地这条腿怎么动?


2018 年,腾讯正式宣布向产业互联网进军,随着公司级整体业务方向的转变,优图实验室也在思考自己未来的发展方向。


同年 9 月 30 日,腾讯宣布组织架构调整,当时优图实验室被调整进入全新的 CSIG 云与智慧产业事业群,优图实验室因此也和云与智慧产业形成更密切的联动配合。


当腾讯优图的定位调整为面向产业互联网的时候,现有很多技术可以直接走到客户面向。以内容平台为例,现在可以通过调用腾讯云,直接对广电、媒体等行业输出技术,他们不需要自己研发就能进行内容的分析和理解。这个技术实际上相当于无缝地从腾讯内部被研发,直接对外发布使用。


然而,从技术到产业转化,这个过程谈何容易。“优图是面向业务落地做技术研究,并不是为了创新而创新”。在优图,做一项技术之前首先要判断是不是解决用户痛点,是否真正有足够的业务价值,并在行业里挑选一到两个标杆攻关,在攻关过程中丰富各项能力和解决方案。标杆打完以后,看解决方案能否快速推广复制到其他客户。在规模化落地阶段,往往会遇到成本问题,迁移周期及可复用范围都需要重点关注。围绕落地的降本提效上,优图去年在 AAAI 上发表的非对称互学习(Asymmetric Co-Teaching)的领域自适应 ReID 技术,可以极大降低对新场景数据标注的需求,场景复制效率整体提升了 3 倍以上。


随着科技的创新发展,AI 技术的落地应用在优化生活方式的同时,也不断刷新着我们对于世界的认知。在众多场景规模化应用落地的过程中,腾讯优图始终秉持着“科技向善”的愿景,让 AI 能够更好的为社会服务。


以腾讯优图本次发布的未成年内容审核解决方案为例,就是腾讯优图首个专门针对未成年人这一网络弱势群体的可落地技术方案。这种基于保护未成年人的技术研发和能力实现,就是腾讯科技向善的最好体现。


未成年内容审核解决方案发布


根据《2019 年全国未成年人互联网使用情况研究报告》显示,2019 年我国未成年网民规模为 1.75 亿,未成年人互联网普及率达到 93.1%。有统计数据显示,目前我国年龄低于 10 岁的网民已超过 1800 万,56%的儿童初次上网的年龄低于 5 岁。


15.6%的未成年人表示曾遭遇网络侵害,最常见的是网络欺凌、色情引诱、个人信息泄露等。特别是,疫情防控期间,网络侵害问题更为突出。这些未成年人因为自身年龄上的差异,对于内容往往没有明确的辨识和过滤能力,极有可能导致身心健康受到影响,甚至在部分极端视频的引导下做出不理智的行为。


目前,我国在多个互联网内容领域均施行了监管审核,但针对更广泛的网络内容监管审核手段较少,存在较大的真空地带真空地带,未成年人上网内容审核和分级迫在眉睫。


国家监管机构也已经注意到未成年内容杂乱的情况,国家网信办今年 5 月启动的 2020:“清朗”行动中专门组织针对未成年人暑期网络环境的整治,国家扫黄打非办上半年的“护苗 2020”专项行动中,更是查删处置淫秽色情、恐怖暴力、低俗恶俗等不良信息超过 603 万条;查缴非法有害少儿类出版物 13.2 万多册。此外,查办网上传播涉未成年人色情信息、制售非法有害少儿出版物等“护苗”类案件 70 多起。


此次腾讯优图实验室推出的未成年保护方案,是在标准内容审核基础能力之上增加了很多针对未成年设计的能力,主要有两大功能。一是面向青少年的不宜内容过滤,除过滤常规成人裸露内容外,比如血腥、暴露真实场景成人裸露场景,包括加入对虚拟场景的色情、暴力的识别,这类称为“ACG 识别”;二是未成年人敏感内容识别,主要用来发现以青少年儿童为实施主体的违规内容,例如儿童色情,这也是国际上打击比较多的。这两个功能综合运用了腾讯优图多项视觉 AI 技术,包括人脸识别、OCR、动作识别、场景识别以及图文分析等。


ACG 识别难度比真实场景要大很多。首先由于动漫,游戏中的人物和行为是创作出来的,天马行空,内容相对隐晦、甚至是意向化的,不如真实场景容易定义(如明确的漏点或者性行为)。仅仅去定义标准就是件细致和繁琐的工作。其次,特征的复杂性和非典型性也比真实场景要大。比如针对卡通脸识别,脸部细节的艺术手法使得展现上和真实的人脸照片差异很大。优图实验室今年也重点针对卡通动漫场景做了专门研发,例如今年 6 月份参加“IJCAL2020”时获得“iCartoonFace(卡通人脸挑战赛)”第一。


目前,这套解决方案对于明显色情图片的召回率超过 96%;对于烟赌毒、纹身、床上直播等低俗内容的召回率能够达到 80%以上;在识别“未成年人直播”、“儿童裸露”等不良行为和图片方面,在“区分 14 岁以上或以下”两分类测试标准条件下,召回率接近 80%。

结束语

对于计算机视觉技术的未来发展,郭晓威表示视觉感知层面还有很多突破的可能,一是应对开放场景下的精度挑战。举个例子,人脸识别是视觉里相对成熟的技术,配合产品上的场景设计与限制,在受限的场景中可以达到商业可用。但面向开放场景,挑战就很大了,比如行人重识别(REID)技术,需要在各种室内、室外环境通过衣帽外观、行为体态等特征精准锁定一个人的行为轨迹,这其中不可控的因素很多,包括摄像头的角度,分辨率,行人的朝向,姿态,衣着,遮挡,以及天气等等。另外,如何大幅降低 AI 生产成本,并适应快速复制,满足规模化落地的商业需求也是业界亟待解决的挑战。当前数据需求与网络架构优化是生产成本居高不下的主要痛点,相关技术例如领域自适应,半/自监督,模型剪枝,NAS 等也已成为业界研究的热点与趋势,但整体来说还有很长的路要走。


未来,腾讯优图实验室将继续聚焦人工智能技术的研究,持续探索更多前沿算法,让更好的算法去找更多的场景,并通过腾讯云对外输出,研究员也需要走到客户一线,从客户的需求角度出发,对算法提出更高要求。深挖应用场景,结合产业需求和实际应用场景落地解决方案,并且注重产业应用的广度和深度,帮助传统企业降本、增效、提质,驱动产业智慧化升级。


采访嘉宾:


黄飞跃  腾讯优图实验室副总经理。拥有清华大学计算机博士学位,于 2008 年加入腾讯。黄飞跃负责优图实验室主要研究和落地项目,包括人脸识别、图像识别等视觉 AI 重点方向。目前,优图实验室专注在图像处理、模式识别等领域开展技术研发和业务落地,多次刷新世界纪录。


郭晓威,2007 年毕业于中山大学数计学院信息与计算科学专业,主攻机器学习与图像处理方向。2011 年加入腾讯公司,主要从事计算机视觉、机器学习、深度学习等技术研究与应用工作。现担任优图专家研究员及昊天研究中心技术负责人。具备十年以上视觉领域以及海量数据处理的一线技术研发与项目落地经验。


2020-11-02 09:412106

评论

发布
暂无评论
发现更多内容

技术干货丨Inspire Cast 如何避免自动网格划分失败?

Altair RapidMiner

人工智能 仿真 智能制造 altair Inspire

CCF - 网易雷火基金项目成果:基于大小模型协同的低资源标注技术|CNCC 2024 演讲实录

网易伏羲

人工智能 网易伏羲 cncc

框图是什么,如何制作?10个框图模板推荐!

职场工具箱

职场 IT 在线白板 绘图软件 线框图软件

双十一降本增效新路径!华为云Flexus X实例为中小企业注入“硬核”动力

YG科技

在华为开发者空间,简单几步带你实现AI风格化编程

华为云开发者联盟

云主机 华为云ModelArts FunctionGraph AI 大底座

掌握项目管理的流程:实现项目目标的系统步骤

爱吃小舅的鱼

项目管理流程

双十一轻松跨越数字鸿沟!华为云Flexus X实例引领中小企业低成本上云

YG科技

StarRocks Summit Asia 2024 全部议程公布!

StarRocks

浅谈低代码平台助力企业数字化转型

EquatorCoco

低代码

鸿蒙NEXT开发案例:年龄计算

zhongcx

鸿蒙

5.7 与 8.0 对相同文件的 LOAD DATA 语句结果不同

GreatSQL

数据库

14.策略者模式设计思想

杨充

微博热搜榜数据:免费API调用与市场洞察

幂简集成

API 微博热搜 微博

权限系统:权限应用服务设计

不在线第一只蜗牛

架构 应用开发

简单聊聊微前端

快乐非自愿限量之名

前端

打造透明、高效的分布式系统:通过 EMQX ECP 集成实现链路追踪功能

EMQ映云科技

链路追踪 emqx EMQX ECP 边缘服务

科技赋能绿色“碳”索,下党零碳示范基地启幕

新消费日报

甘特图与项目管理:深入了解两种项目管理方式

爱吃小舅的鱼

项目管理 甘特图

IPQ5322: Qualcomm’s Wi-Fi 7 Chipset for Superior Indoor Networking

wallyslilly

牛客网Java面试题及答案整理(2024年最新版,持续更新)

采菊东篱下

编程 java面试

快递鸟快递查询API接口参数代码

快递鸟

快递

深入了解测试开发与DevOps体系

测试人

软件测试

Mysql篇-三大日志

EquatorCoco

MySQL 数据库

双十一首款柔性算力云服务器亮相全新亮相!华为云Fleus X 实例到底有多强?

YG科技

一夜之间,内容行业和大模型行业被这个All in One产品改变了

脑极体

AI

微短剧出海大升级:窄带高清降本,极致播放体验,海外合规更安心

阿里云CloudImagine

人工智能 AIGC 窄带高清 视频翻译 短剧出海

为什么DDoS攻击如此普遍?

网络安全服务

黑客 流量 DDoS AI人工智能 DDoS 攻击

硬核剧透!龙蜥开源软件供应链及操作系统安全MeetUp全议程来啦

OpenAnolis小助手

开源 操作系统 龙蜥社区 龙蜥meetup

Greptime 空降深圳|「从云原生到 AI 时代,全栈可观测性的实践与演进」 Meetup 圆满结束

Greptime 格睿科技

云原生 活动 可观测

OmniGraffle for mac(思维导图软件)中文版

Mac相关知识分享

One Switch for Mac(系统功能快速开关工具)

Mac相关知识分享

腾讯优图实验室:践行科技向善,选择人脸识别是过往八年最重要的抉择之一_大数据_赵钰莹_InfoQ精选文章