AI 年度盘点与2025发展趋势展望,50+案例解析亮相AICon 了解详情
写点什么

腾讯多媒体实验室开源国内首个视频质量评估算法 DVQA

  • 2020-04-08
  • 本文字数:1232 字

    阅读完需:约 4 分钟

腾讯多媒体实验室开源国内首个视频质量评估算法DVQA

视听时代,音视频应用越来越广泛:直播、短视频、视频节目、音视频通话……近期由于新冠疫情带来的在线协同办公、在线教育类产品的崛起,更带来了线上音视频需求的爆发,用户对音视频质量诉求也愈加强烈。


在整个视频链路中,大部分模块都可以精确度量,如采集、上传、预处理、转码、分发等。然而未知的部分却恰恰是最关键的部分,即用户的视频观看体验到底怎么样。目前行业内的视频质量评估方法分为两大类:客观质量评估与主观质量评估。前者计算视频的质量分数,又根据是否使用高清视频做参考、源视频是专业视频还是用户原创视频等进一步细分;后者主要依赖人眼观看并打分,能够直观反映观众对视频质量的感受。然而,这些方法仍存在耗时费力、成本较高、主观观感存在偏差等难题。


多媒体实验室提出的视频质量评估解决方案,首先结合业务需求,使用“在线主观质量评测平台”,来构建大规模主观质量数据库,同时使用所收集的主观数据来训练基于深度学习的客观质量评估算法,最后把训练好的质量评估算法部署到业务线中,闭环监控可能存在的质量问题。从以上三个角度出发,DVQA 能够在兼顾不同业务、场景的前提下,满足效率与精度两大需求。


DVQA 包含多个质量评估算法模型,本次开源的是针对 PGC 视频的算法 C3DVQA。本项目使用 Python 开发,深度学习模块使用 PyTorch。代码使用模块化设计,方便集成较新的深度学习技术,灵活的自定义模型,训练和测试新的数据集。


在算法设计上,C3DVQA 所使用的网络结构如下图所示。其输入为损伤视频和残差视频。网络包含两层二维卷积来逐帧提取空域特征。级联后使用四层三维卷积层来学习时空联合特征。三维卷积输出描述了视频的时空掩盖效应,再使用它来模拟人眼对视频残差的感知情况:掩盖效应弱的地方,残差更容易被感知;掩盖效应强的地方,复杂的背景更能掩盖画面失真。



网络最后是池化层和全连接层。池化层的输入为残差帧经掩盖效应处理后的结果,它代表了人眼可感知残差。全连接层学习整体感知质量和目标质量分数区间的非线性回归关系。


在评测结果上,腾讯多媒体实验室在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。并使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。将所提出的 C3DVQA 与常用的全参考质量评估算法进行对比,包括 PSNR,MOVIE,ST-MAD,VMAF 和 DeepVQA,结果如下表所示。



(LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较)


目前该评估算法已在腾讯内外部多款产品中进行使用验证,如腾讯会议就借助实验室上百个符合 ITU/3GPP/AVS 等国外内标准的指标进行评判,闭环监控全网的用户体验质量,从用户真实体验出发,不断优化产品性能。


作为最早布局音视频领域的公司之一,从最早的 QQ 平台,腾讯就试图解决在当年网络条件下若干的音视频通信问题。伴随着 5G、云计算、大数据、人工智能技术的发展,腾讯多媒体实验室基于多年的技术沉淀和行业经验,逐步打磨出一条完善且高质量的音视频技术链条。


本文转载自 腾讯多媒体实验室 公众号。


原文链接: 腾讯多媒体实验室


2020-04-08 17:232419

评论

发布
暂无评论
发现更多内容

Reflector 3:将iPhone、iPad、iPod Touch屏幕投屏到mac电脑上

理理

Mac软件 iOS投屏 Reflector 3激活版 Reflector 3下载

macOS Ventura 13.6.9 (22G830) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO ventura

聚焦OLAP性能提升,火山引擎ByteHouse发布六大场景方案

字节跳动数据平台

数据库 云原生 Clickhouse 数仓

海外成品语聊交友软件APP(英语+阿拉伯语版本)相比定制研发,优势有哪些?

山东布谷科技胡月

源码搭建 语音直播源码 语音聊天APP源码 海外直播App开发 海外语聊APP

AI自动化应用开发,让创意与效率并驾齐驱!

霍格沃兹测试开发学社

京东企业业务前端监控实践

京东零售技术

前端 监控 企业号 8 月 PK 榜

Enfocus PitStop Pro:PDF编辑与印前检查的一站式解决方案

理理

Enfocus PitStop Pro 2021 PDF 编辑器和注释器

大咖公开课 | AI自动化应用开发,让创意与效率并驾齐驱!

测试人

软件测试

我叫小舞,跳舞的舞!新斗罗大陆游戏详细图文架设教程

echeverra

斗罗大陆

永久激活版Trapcode Particular AE 3D粒子插件详细安装教程

理理

macOS Sonoma 14.6.1 (23G93) 正式版发布,ISO、IPSW、PKG 下载

sysin

macos ISO Sonoma

全国高校软件测试开发教学师资培训会圆满落幕

测试人

软件测试

技术同学如何应对降薪裁员

老张

职场 裁员 认知 互联网裁员

聚焦OLAP性能提升,火山引擎ByteHouse发布六大场景方案

字节跳动数据平台

数据库 大数据 云原生 Clickhouse 数仓

全国高校软件测试开发教学师资培训会圆满落幕

霍格沃兹测试开发学社

数据分析的关键点有哪些?如何做好数据分析?

Aloudata

数据分析 指标平台 noetl

LED显示屏行业可突破的六大领域

Dylan

云计算 虚拟现实 LED显示屏 全彩LED显示屏 led显示屏厂家

如何保护您的 Angular 应用程序:API 调用的端到端加密

哦豁完蛋了

和鲸科技CEO范向伟出席江苏省信息技术应用学会软件技术专委会学术年会,解读“AI+教育”创新实践

ModelWhale

人工智能 软件 信息技术 产学研

不可重复读和幻读有什么区别

江南一点雨

Java MySQL 面试题

使用观测云构建业务的可观测性

观测云

可观测性 业务监控

高价值数据源于结构化和非结构化融合分析

AI数据云Relyt

AI 数据湖 数据

iMovie 剪辑 for mac中文版:创建好莱坞风格预告片和精美影片

理理

视频特效 Mac视频剪辑软件 iMovie 剪辑

观测云产品更新 | 异常追踪、用户访问监测、链路、监控等

观测云

异常追踪

云图说|一图告诉你主机安全的运维效率如何提升超出预期

华为云开发者联盟

运维 主机安全 新版本 企业号 8 月 PK 榜 2024企业号8月pk

危化品安全生产风险监测预警系统的构建与实施

天津汇柏科技有限公司

安全生产 安全生产平台

数据分析慢?火山引擎ByteHouse发布六大场景性能提升方案

字节跳动数据平台

数据库 云原生 OLAP 数仓

【AIGC】 0成本学习:AI工作流生成Joy(ComfyUI)

京东零售技术

AIGC 企业号 8 月 PK 榜

MES系统是什么?MES软件有什么用?

万界星空科技

制造业 生产管理系统 mes 万界星空科技 生产管理

AI安全新纪元:智能体驱动的网络安全新范式

云起无垠

AI 智能体

和鲸科技助力 Datathon 会前培训成功举行,“理-工-医-信”跨学科合作,以数据驱动医疗实践

ModelWhale

医疗AI R 语言 datathon 医疗大数据

腾讯多媒体实验室开源国内首个视频质量评估算法DVQA_开源_腾讯多媒体实验室_InfoQ精选文章