写点什么

手机摄影挑战单反,旷视 AI 多摄技术揭秘

  • 2021-10-14
  • 本文字数:1548 字

    阅读完需:约 5 分钟

手机摄影挑战单反,旷视AI多摄技术揭秘

手机已经成为人们身边最为便捷的影像设备。

 

调研机构艾瑞咨询发布的《2020 中国人工智能手机白皮书 — AI 重新定义光感知》报告显示,短视频相关应用的流行使拍摄功能成为消费者最关注的要素。

 

随着 AI 技术的发展,消费者对智能手机摄影功能的需求也越来越高。近期多款最新手机的发布,让以多摄为代表的 AI 计算摄影技术受到了越来越多的关注。

 

智能手机毫无疑问已经进入了多摄时代。但可能鲜有人知的是,当多摄技术在各厂商的智能手机上“争奇斗艳”的背后,其实是计算机视觉 AI 公司在提供者底层技术的支撑。

 

据了解,旷视科技自 2016 年起开始研发多摄技术,经过 5 年多的技术迭代和优化,旷视的 AI 多摄算法目前已在多款畅销手机机型中实现技术应用落地。

 

InfoQ10 月 12 日获悉,在旷视 MegTech Lite 漫谈 AI 技术分享会上,旷视研究院研究员范浩强详细介绍了 AI 多摄技术的发展历程,并并分享了旷视在 AI 多摄领域的技术创新和实践成果。


旷视研究院研究员范浩强在旷视 AI 多摄技术分享会上的演讲


用户需求升级,促进 AI 多摄技术发展

 

从 2000 年世界上第一款配备摄像头的手机诞生至今,手机拍摄能力经过了一轮轮的迭代升级。

 

与此同时,用户的拍照需求逐渐释放,不再拘泥于简单的高清图像,更加追求兼顾“所见即所得”的真实性与媲美相机的质感,开始利用手机进行专业级别的影像创作。

 

囿于手机空间和模组尺寸的局限性,单个摄像头的拍摄效果有限,手机多摄技术应运而生。

 

范浩强表示,摄像头最大的功能是变焦,多摄最大的作用是可以切换不同的焦段或者不同的视野。通过多个摄像头的协调配合,AI 技术加持的手机摄影可以实现媲美单反相机的拍摄效果,为终端消费者带来更好的拍摄体验。

 

在手机后置摄像头从双摄逐渐升级到三摄、四摄的过程中,AI 算法已成为多摄像头联动不可或缺的纽带。

 

变焦、虚化、融合,多摄助力手机影像突破

 

主摄、广角、超广角、长焦、潜望式、微距、ToF……随着多摄技术的成熟和发展,手机后置摄像头的数量和类别不断增加,让多摄形成了花样繁多的排列组合,也为终端用户带来了更优的拍摄体验:通过双摄变焦实现最佳拍摄效果、利用双摄虚化实现媲美单反相机的光圈效果、多摄融合有效提升图片质量。

 

然而,后置摄像头不是越多越好,也不是越大越好。旷视认为,手机成像,是系统工程,是重要的要素之间的匹配。

 

旷视提出了“AI 重新定义光感知系统”的理念,将光感知系统“硬件升级 — 算法辅助 — 优化后期处理”相对流程化和独立化的传统运作方式,转变为光感知系统软硬件“一体化协同升级”。

 

这一理念从整个影像系统设计出发,配合智能手机的光学系统以及传感系统,借力人工智能算法,通过图像识别、融合、增强、分割等方式,优化拍摄能力、丰富拍摄功能、升级成像质量,带来指数级的效果提升。

 

面向未来,AI 驱动的图像获取

 

AI 多摄逐渐走进大众视野,既得益于手机厂商对于产品的迭代升级,也离不开旷视等 AI 企业对于底层技术的创新和赋能。

 

以多摄融合为例,旷视的多摄融合算法采用神经网络设计模型,可有效解决清晰度不均匀、主体边缘线条弯曲、部分位置重影、线条断裂错位、重复纹理错位等传统多摄融合算法中的常见问题。

 

基于多年的技术积累和项目工程落地经验,旷视的双摄虚化、多摄平滑变焦、多摄融合等算法均具有很强的泛用性,可适配多种模组组合和排布方式。

 

随着算力的丰富和以多摄为代表的 AI 计算摄影技术的不断优化和发展,未来的手机拍摄,将会向着利用 AI 技术,理解用户意图,利用算法自动调配摄像头,完美捕捉到用户想要拍摄的画面,从“所见即所得”到“所想即所得”。在这个过程中,计算和 AI 所占的比重会越来越大,会成为主要要素。

 

范浩强表示,除了 AI 之外,旷视还在传感器方面进行探索,推出更多新形态传感器的解决方案,从而实现面向未来的画质。

 

期待,未来 AI 会把智能手机摄影带到新的高度。

 

2021-10-14 08:573895
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 534.2 次阅读, 收获喜欢 1976 次。

关注

评论

发布
暂无评论
发现更多内容

BAT大厂java程序员面试必问:JVM+Spring+分布式+tomcat+MyBatis

钟奕礼

程序员 Java 面试 Java、 java 编程

华为云弹性负载均衡服务,如何助企业应付流量压力

爱科技的水月

Zebec的“Web3.0 TechHive Summit 2022 大会”圆满落幕,回顾与展望

股市老人

2022年度盘点|聚焦运维服务,云智慧的高光时刻

云智慧AIOps社区

运维 AIOPS 智能运维 云智慧 智能运维AIOps

java程序员:拜托别再问我Spring原理了!你问的这篇文章都有

钟奕礼

程序员 Java 面试 Java、 java 编程

华为云智能云接入ICA,助力企业轻松上云

与时俱进的时代

更加灵活、稳定,华为云虚拟专用网络VPN双活网关优势明显!

清欢科技

回顾与展望Zebec举办的“Web3.0 TechHive Summit 2022 大会”

BlockChain先知

华为云弹性负载均衡ELB,如何保障服务器不瘫痪?

爱科技的水月

什么是WebSocket

穿过生命散发芬芳

websocket 12月月更

5分钟搞懂Web3架构

俞凡

架构 web3

开启全新身份!华为阅读畅读会员震撼来袭,限时首月9元快来领取

最新动态

史上最全JVM大全详解!java程序员细节到极致的一次,魔鬼

钟奕礼

程序员 Java 面试 Java、 java 编程

无代码的未来

俞凡

无代码

Github星标80k的阿里大牛强推JDK源码笔记,6到飞起

程序知音

Java 源码 jdk 后端技术

安全可靠,弹性灵活--华为虚拟专用网络VPN

清欢科技

从各行业的实际运用中,窥见华为云虚拟专用网络VPN的强大性能

清欢科技

无需企业搭建基础设施,华为云弹性公网IP经济实惠又便捷!

与时俱进的时代

华为云全球加速GA,为企业跨国办公保驾护航

与时俱进的时代

华为云连接CC服务助企业联通全球

爱科技的水月

阿里高工珍藏版“亿级高并发系统设计手册(全彩版)”面面俱到,太全了!

架构师之道

Java 编程 高并发

笑对过往、活在当下、期盼未来

阿Q说代码

程序员 flag 年度总结

华为云智能云接入ICA,企业数据上云的信赖之选

与时俱进的时代

GitHub屠榜第一的微服务架构深度解析,简直太硬核了

小小怪下士

Java 程序员 微服务

5分钟搞懂BFF

俞凡

架构 BFF

8年java技术岗面试官总结:2022超强面试大全,抓住2022的小尾巴

钟奕礼

程序员 Java 面试 Java、 java 编程

如何实现线上线下良好互通?华为云CC支持一点接入多点通达

爱科技的水月

【kubernetes入门到精通】Kubernetes的健康监测机制以及常见ExitCode问题分析「探索篇」

洛神灬殇

Kubernetes 云原生 服务监控 12月月更

出海有“云”!华为云全球加速助力跨国企业提升网络体验

与时俱进的时代

运维训练营第十课作业

好吃不贵

手机摄影挑战单反,旷视AI多摄技术揭秘_AI&大模型_刘燕_InfoQ精选文章