过往,人工智能的发展一直伴随着业界对是否会引发伦理问题的讨论,这也让很多技术停留在了实验室中,很难走出去,真正落到产业界。自 2012 年成立以来,腾讯优图实验室便在人工智能的各个领域展开了研究,尤以人脸识别为最,坚持基础研究、产业落地两条腿走路的优图实验室在科技向善上找到了最佳的落地姿势。
一家实验室的竞争力是什么?
在不同的阶段、不同的环境和不同的位置,实验室所扮演的角色以及承载的使命不尽相同。
在人工智能领域,很多技术突破尚需依赖学术进展,科技巨头们纷纷开始扶持内部实验室的发展,并不断招揽学术界的大佬加盟工业界。但是,实验室在一家企业中的定位一直不是很清晰,纯粹的学术研究意味着不仅烧钱,短期内还很难看到收益。
历史上最成功的实验室当属贝尔实验室,辉煌时期的贝尔实验室平均每天都会获得一项专利,这里诞生了 UNIX 系统、C 语言、手机通讯系统基础理论等,11 位科学家获得了诺贝尔奖,16 位获得美国最高科学、技术奖,4 位获得图灵奖…
20 世纪末,美国司法部依据《反托拉斯法》拆分了 AT&T,贝尔实验室也被剥离成为了朗讯科技公司的组成部分,由于朗讯的经营情况不甚乐观,根本养不起一万多人的贝尔实验室,这导致实验室不得不裁员,实力大幅下降,被迫以出售专利来平衡支出,此后辗转到了诺基亚所有,也依旧没有恢复往昔荣耀。
创造出如此多辉煌的贝尔实验室最终都难逃落败,其他实验室又该如何抉择呢?如果存在的价值明确,那发展路径大致清晰。那么,实验室在一家科技巨头内部存在的价值是什么呢?当时,刚刚加入腾讯优图实验室的黄飞跃或许也在思考这个问题。
2012 年,现任腾讯优图实验室副总经理的黄飞跃发现公司内部众多业务部门都对图片压缩和传输有着较高需求,因此将图片二次压缩作为当时的重点研究方向,并借解决该问题为优图团队打开了声量。随后的几年,优图实验室成功协助微众银行完成了线上 AI 核身,并将技术在 QQ、QQ 空间、QQ 音乐、财付通、天天 P 图等明星产品中成功落地,这一落地将优图实验室顺利从一个单纯提供 AI 能力的实验室转型为一家能够助力行业的机构,并在公司内部找到了实验室的特殊价值。
在接受 InfoQ 的独家采访中,黄飞跃表示希望将腾讯优图实验室打造成为国际最顶尖的人工智能实验室。一直以来,优图实验室坚持基础研究和产业落地两条腿同时走路,秉持着“研究成果落地才能产生价值的原则”,技术研究以落地为导向,关注产业落地和科技向善。
“虽然行业越来越强调 AI 的落地了,但是技术一定有一个“研究-落地”的过程。技术永远是在持续更新和进步的,实验室可以给到相对纯粹的研究环境,技术的更新迭代也可以反哺产业,给产业持续带来活力。”
腾讯在 AI 领域建立了实验室矩阵,包括腾讯 AI Lab、优图实验室、Robotics X(机器人)等 AI 实验室;其中优图实验室聚焦计算机视觉这一领域。在产业落地层面,优图实验室通过腾讯云对外输出 AI 能力,技术深度应用到内容、游戏、社交、医疗、零售、到出行多个产业及领域。
“如果说 AI 路上的重要决定,我觉得做人脸识别技术是一个重要决策。”
超前布局人脸识别,这是一个正确的选择
早在 2012 年,人脸识别尚未成为热门技术,而优图实验室就已经把它当作中长期技术项目在布局。团队同学都相信,自己所做的研究终究会产生价值,因此愿意潜心去做一些中长期的研究。从 2017 年开始,人脸的相关应用开始发光发亮,从 2017 年 7 月被业界点赞的微信办证服务,到微信刷脸支付,再到后来一系列基于人脸识别的科技向善应用等,都是得益于优图实验室早期的技术积累。
“在人工智能领域,人脸识别算是落地比较成功的,包括中国的前几大人工智能创业公司都以此起家,这也在侧面说明了该项技术具有一定的成熟度,并且已经探索出了一些合适的商业化的模式。”
“可能我们运气比较好吧”,优图专家研究员及昊天研究中心技术负责人郭晓威表示,2012 年前后,深度学习才开始表现出在大规模集成上的有效性,优图就认为其将来一定会有较好的发展。2014 年,团队刚好接到微众银行人脸核身的需求,就是做远程登录核审;2015 年前后,又赶上了人工智能的风口;随后,又遇到了产业互联网的风口。
AI 落地难,产业落地这条腿怎么动?
2018 年,腾讯正式宣布向产业互联网进军,随着公司级整体业务方向的转变,优图实验室也在思考自己未来的发展方向。
同年 9 月 30 日,腾讯宣布组织架构调整,当时优图实验室被调整进入全新的 CSIG 云与智慧产业事业群,优图实验室因此也和云与智慧产业形成更密切的联动配合。
当腾讯优图的定位调整为面向产业互联网的时候,现有很多技术可以直接走到客户面向。以内容平台为例,现在可以通过调用腾讯云,直接对广电、媒体等行业输出技术,他们不需要自己研发就能进行内容的分析和理解。这个技术实际上相当于无缝地从腾讯内部被研发,直接对外发布使用。
然而,从技术到产业转化,这个过程谈何容易。“优图是面向业务落地做技术研究,并不是为了创新而创新”。在优图,做一项技术之前首先要判断是不是解决用户痛点,是否真正有足够的业务价值,并在行业里挑选一到两个标杆攻关,在攻关过程中丰富各项能力和解决方案。标杆打完以后,看解决方案能否快速推广复制到其他客户。在规模化落地阶段,往往会遇到成本问题,迁移周期及可复用范围都需要重点关注。围绕落地的降本提效上,优图去年在 AAAI 上发表的非对称互学习(Asymmetric Co-Teaching)的领域自适应 ReID 技术,可以极大降低对新场景数据标注的需求,场景复制效率整体提升了 3 倍以上。
随着科技的创新发展,AI 技术的落地应用在优化生活方式的同时,也不断刷新着我们对于世界的认知。在众多场景规模化应用落地的过程中,腾讯优图始终秉持着“科技向善”的愿景,让 AI 能够更好的为社会服务。
以腾讯优图本次发布的未成年内容审核解决方案为例,就是腾讯优图首个专门针对未成年人这一网络弱势群体的可落地技术方案。这种基于保护未成年人的技术研发和能力实现,就是腾讯科技向善的最好体现。
未成年内容审核解决方案发布
根据《2019 年全国未成年人互联网使用情况研究报告》显示,2019 年我国未成年网民规模为 1.75 亿,未成年人互联网普及率达到 93.1%。有统计数据显示,目前我国年龄低于 10 岁的网民已超过 1800 万,56%的儿童初次上网的年龄低于 5 岁。
15.6%的未成年人表示曾遭遇网络侵害,最常见的是网络欺凌、色情引诱、个人信息泄露等。特别是,疫情防控期间,网络侵害问题更为突出。这些未成年人因为自身年龄上的差异,对于内容往往没有明确的辨识和过滤能力,极有可能导致身心健康受到影响,甚至在部分极端视频的引导下做出不理智的行为。
目前,我国在多个互联网内容领域均施行了监管审核,但针对更广泛的网络内容监管审核手段较少,存在较大的真空地带真空地带,未成年人上网内容审核和分级迫在眉睫。
国家监管机构也已经注意到未成年内容杂乱的情况,国家网信办今年 5 月启动的 2020:“清朗”行动中专门组织针对未成年人暑期网络环境的整治,国家扫黄打非办上半年的“护苗 2020”专项行动中,更是查删处置淫秽色情、恐怖暴力、低俗恶俗等不良信息超过 603 万条;查缴非法有害少儿类出版物 13.2 万多册。此外,查办网上传播涉未成年人色情信息、制售非法有害少儿出版物等“护苗”类案件 70 多起。
此次腾讯优图实验室推出的未成年保护方案,是在标准内容审核基础能力之上增加了很多针对未成年设计的能力,主要有两大功能。一是面向青少年的不宜内容过滤,除过滤常规成人裸露内容外,比如血腥、暴露真实场景成人裸露场景,包括加入对虚拟场景的色情、暴力的识别,这类称为“ACG 识别”;二是未成年人敏感内容识别,主要用来发现以青少年儿童为实施主体的违规内容,例如儿童色情,这也是国际上打击比较多的。这两个功能综合运用了腾讯优图多项视觉 AI 技术,包括人脸识别、OCR、动作识别、场景识别以及图文分析等。
ACG 识别难度比真实场景要大很多。首先由于动漫,游戏中的人物和行为是创作出来的,天马行空,内容相对隐晦、甚至是意向化的,不如真实场景容易定义(如明确的漏点或者性行为)。仅仅去定义标准就是件细致和繁琐的工作。其次,特征的复杂性和非典型性也比真实场景要大。比如针对卡通脸识别,脸部细节的艺术手法使得展现上和真实的人脸照片差异很大。优图实验室今年也重点针对卡通动漫场景做了专门研发,例如今年 6 月份参加“IJCAL2020”时获得“iCartoonFace(卡通人脸挑战赛)”第一。
目前,这套解决方案对于明显色情图片的召回率超过 96%;对于烟赌毒、纹身、床上直播等低俗内容的召回率能够达到 80%以上;在识别“未成年人直播”、“儿童裸露”等不良行为和图片方面,在“区分 14 岁以上或以下”两分类测试标准条件下,召回率接近 80%。
结束语
对于计算机视觉技术的未来发展,郭晓威表示视觉感知层面还有很多突破的可能,一是应对开放场景下的精度挑战。举个例子,人脸识别是视觉里相对成熟的技术,配合产品上的场景设计与限制,在受限的场景中可以达到商业可用。但面向开放场景,挑战就很大了,比如行人重识别(REID)技术,需要在各种室内、室外环境通过衣帽外观、行为体态等特征精准锁定一个人的行为轨迹,这其中不可控的因素很多,包括摄像头的角度,分辨率,行人的朝向,姿态,衣着,遮挡,以及天气等等。另外,如何大幅降低 AI 生产成本,并适应快速复制,满足规模化落地的商业需求也是业界亟待解决的挑战。当前数据需求与网络架构优化是生产成本居高不下的主要痛点,相关技术例如领域自适应,半/自监督,模型剪枝,NAS 等也已成为业界研究的热点与趋势,但整体来说还有很长的路要走。
未来,腾讯优图实验室将继续聚焦人工智能技术的研究,持续探索更多前沿算法,让更好的算法去找更多的场景,并通过腾讯云对外输出,研究员也需要走到客户一线,从客户的需求角度出发,对算法提出更高要求。深挖应用场景,结合产业需求和实际应用场景落地解决方案,并且注重产业应用的广度和深度,帮助传统企业降本、增效、提质,驱动产业智慧化升级。
采访嘉宾:
黄飞跃 腾讯优图实验室副总经理。拥有清华大学计算机博士学位,于 2008 年加入腾讯。黄飞跃负责优图实验室主要研究和落地项目,包括人脸识别、图像识别等视觉 AI 重点方向。目前,优图实验室专注在图像处理、模式识别等领域开展技术研发和业务落地,多次刷新世界纪录。
郭晓威,2007 年毕业于中山大学数计学院信息与计算科学专业,主攻机器学习与图像处理方向。2011 年加入腾讯公司,主要从事计算机视觉、机器学习、深度学习等技术研究与应用工作。现担任优图专家研究员及昊天研究中心技术负责人。具备十年以上视觉领域以及海量数据处理的一线技术研发与项目落地经验。
评论