写点什么

OPPO 研究院成立智能感知与交互研究部,首次公开展示研发成果

  • 2020-06-17
  • 本文字数:1764 字

    阅读完需:约 6 分钟

OPPO研究院成立智能感知与交互研究部,首次公开展示研发成果

一年一度的全球计算机视觉顶级会议 CVPR(Conference on Computer Vision and Pattern Recognition 国际计算机视觉与模式识别会议)落下帷幕,该会议是由 IEEE(国际计算机视觉与模式识别会议)举办的计算机视觉和模式识别领域的顶尖会议。每年汇聚全球顶尖的相关专家、学者和研究者,共同关注和探讨计算机视觉技术的发展方向与趋势。


InfoQ 了解到,在 CVPR 2020 的一系列学术竞赛中,OPPO 共获得两项第一、两项第三,获奖技术成果包括:将模糊的照片智能处理清晰的超分技术,凭照片定位拍摄方位技术以及通过录像识别人类行为技术。


据悉,此次 OPPO 参加 CVPR 2020 的多项获奖成果均来自今年年初新成立的智能感知与交互研究部门。今年 3 月,前小鹏首席科学家郭彦东加入 OPPO 并担任 OPPO 智能感知首席科学家,领导快速组建并完善专业科研团队。目前,智能感知与交互研究部已初具规模,并引进了许多顶尖科技公司与科研院校人才。


郭彦东表示:“非常高兴能在今年的 CVPR 竞赛中取得优秀成绩,这是 OPPO 研究院智能感知与交互研究部成立以来首次公开展示研发成果,分别对应环境感知、以人为本的计算、以及数字生成三个核心研究方向,充分反映了 OPPO 在人工智能领域的深厚积淀与实力。”


在本次大会上,OPPO 获得第一名的技术成果为:将模糊图片“算”清晰的“极端超级分辨率感知”技术;此外,通过照片计算拍照方位的"手持设备视觉定位"技术则获得第三名和分项第一;通过读取录像智能识别其中人类行为的“长视频行为识别”技术同时获得第三名。

超分技术成果,凭空将模糊图片算清晰

“极端超分辨率感知”( Perceptual Extreme Super-Resolution)是 CVPR 难度最高的赛项之一,要求从模糊的低分辨率图片中,获得细节更清晰、更接近真实情况的高清图像。


针对这项挑战,OPPO 提出了独创的神经网络架构 RFB-ESRGAN,通过更智能的方式提取原图特征,用分布式算法提高计算效率,以更多元的采样与计算模型配合,通过计算把模糊的图片清晰放大了 16 倍,从全球 280 多个顶尖参赛团队中脱颖而出,获得第一名。



OPPO 极端超分辨率感知处理效果,最左侧图片红框内为原图,最右侧为最终结果


这项技术将在未来为诸多应用场景提供帮助,例如将用户手机拍摄到的模糊影像处理成细节丰富的高清效果,修复图像受到损坏的老照片、老电影,或者对卫星、航天图像进行细节分析等工作。



人工智能程序对图片从多维度进行分析

视觉定位和长视频行为识别

在“手持设备视觉定位”挑战(Visual localization for handheld devices challenge)中,OPPO 获得了面向室外场景的数据集(Aachen Day-Night)第一名,与面向室内场景的数据集(InLoc)第三名。


“视觉定位”是通过搜集和分析图像中的海量信息,对自身拍摄方位作出精确判断。OPPO 团队自主设计的全新分析流程,可以智能分析图像信息的分类标签及图像深浅信息,大量排除错误结果,从而显著提升分析准确程度。这一技术对未来的 AR 眼镜,智能机器人,精准导航等应用都能起到重要作用。例如,当智能机器人助手安装了摄像头之后,就可以利用视觉定位技术对拍摄到的图像作运算分析,获得准确定位,从而精准的移动。


此外,OPPO 在“长视频行为识别”(Activity detection in extended videos)赛项中获得了第三名。


“视频行为识别”是指在某段视频中分析并判断人或物体对象的行为动作。OPPO 的智能程序可高效识别并重组每一帧画面中的人物,辨别复杂动态视频中的人类行为。在一段数十人出镜的长视频中,它准确识别了视频中每个人走动或是聊天等的数十种动作。这项技术在未来能广泛应用在人机交互、运动分析等领域,例如未来的手机产品便可以自动识别正在运动的拍摄对象,并自动调节快门对焦。



视频行为识别结果


除 OPPO 研究院智能感知与交互研究部之外,OPPO 美国研究所也在 CVPR 上有所收获,取得了“真实世界超分辨率图像处理技术”(Real-World Super-Resolution Challenge:Track 1: Image Processing artifacts)第六名的成绩。


OPPO 美研所时空实验室主管孟子博在 CVPR 做了暗光影像技术演讲“穿透黑暗:从图像到视频”(Looking into the dark: from image to video),AI 计算机视觉高级技术总监全书学做了“从零开始构建可在智能手机和 AR 眼镜上运行的统一 SLAM 系统”演讲(Building a unified SLAM system running on both smartphone and AR glass from scratch)。


2020-06-17 16:582514

评论

发布
暂无评论
发现更多内容

扫盲低代码

互联网工科生

前端 低代码 应用开发

4个维度重构组织能力,实现人力资源数智化

用友BIP

人力资源

Swagger 自动生成 Api 文档:提高效率的利器

Liam

程序员 接口文档 swagger 自动生成 API 文档

Flink Metrics&REST API 介绍和原理解析

腾讯云大数据

流计算 Oceanus

推荐 9 个很牛的项目管理软件

高端章鱼哥

项目管理 软件 企业管理软件

支付宝小程序云李铮:科技赋能,敏捷增长

TRaaS

支付宝小程序 小程序云开放 蚂蚁

万字长文浅析配置对MySQL服务器的影响 | 京东物流技术团队

京东科技开发者

MySQL 数据库 服务器 企业号 7 月 PK 榜 MySQL服务器

数据库集群方案详解

KaiwuDB

KaiwuDB 数据库集群技术

实践分析丨AscendCL应用编译&运行案例

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 企业号 7 月 PK 榜

KaiwuDB 资深解决方案专家周幸骏:打造核心时序引擎,释放数据新价值

KaiwuDB

时序数据 KaiwuDB

科研类项目核算的“法、术、器”(二)

用友BIP

项目管理 科研项目

从分片传输到并行传输之大文件传输加速技术

镭速

大文件传输

基于开源IM即时通讯框架MobileIMSDK:RainbowChat v9.0版已发布

JackJiang

网络编程 即时通讯 IM

中小微企业选择哪家云管平台好?理由有哪些?

行云管家

云计算 云管平台 云管理

Docker 入门教程(简明易懂、零基础篇)

搞大屏的小北

Docker 容器 Docker-compose 入门 Docker 镜像

共话AIGC与企业数字化转型 PolarDB开源数据库技术沙龙南京站报名中!

阿里云数据库开源

数据库 postgresql 阿里云 开源 polarDB

一种配置化的数据脱敏与反脱敏框架实现 | 京东云技术团队

京东科技开发者

数据安全 脱敏 数据脱敏 企业号 7 月 PK 榜

动态QPS压测模型【Go语言】

FunTester

用友BIP助力企业全球化运营与人才管理

用友BIP

中企出海 数智人力

MobPush 创建推送

MobTech袤博科技

前端 消息推送 智能推送 前端‘’ 推送系统

HDMI接口需注意的PCB可制造性设计问题

华秋PCB

接口 工具 PCB PCB设计 可制造性

使用 njs 0.7.7 提高 NGINX 配置的模块化程度和可复用性

NGINX开源社区

5分钟迁移关系型数据库到图数据库

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

源码解析Collections.sort ——从一个逃过单测的 bug 说起 | 京东云技术团队

京东科技开发者

排序算法 源码解读 企业号 7 月 PK 榜 Collections.sort

明晚直播:可重构计算芯片的AI创新应用分享!

飞桨PaddlePaddle

人工智能 百度 paddle 飞桨 百度飞桨

揭秘ChaosBlade CPU故障:实现CPU故障的黑科技

柠檬汁Code(binbin0325)

源码分析 cpu 混沌工程 ChaosBlade 故障模拟

2023年广西等保测评机构名单看这里!新增一家哦!

行云管家

广西 等级保护 等保测评

MatrixOne:HTAP数据库中的OLAP设计

MatrixOrigin

云原生 超融合 HTAP MatrixOrigin MatrixOne

Vulkan并非“灵药“

江湖修行

移动端 opengl Android; 渲染

618技术揭秘 - 大促弹窗搭投实践 | 京东云技术团队

京东科技开发者

前端 弹窗 xview 企业号 7 月 PK 榜

GaussDB(for Redis)多租户:读写权限控制和数据库隔离的完美融合

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 7 月 PK 榜

OPPO研究院成立智能感知与交互研究部,首次公开展示研发成果_AI&大模型_罗燕珊_InfoQ精选文章