写点什么

腾讯开源视频质量评估算法 DVQA,性能优于多项传统算法

  • 2020-03-11
  • 本文字数:1223 字

    阅读完需:约 4 分钟

腾讯开源视频质量评估算法DVQA,性能优于多项传统算法

近日,腾讯多媒体实验室设计的基于深度学习的全参考视频质量评估算法 DVQA 在 Github 上正式开源,该算法模型的性能目前在公开测试数据集上取得业界领先成绩。


开源地址:https://github.com/Tencent/DVQA


国内镜像地址(登录后才能访问公开项目):


https://git.code.tencent.com/Tencent_Open_Source/DVQA


视听时代,音视频应用越来越广泛:直播、短视频、视频节目、音视频通话……近期由于新冠疫情带来的在线协同办公、在线教育类产品的崛起,更带来了线上音视频需求的爆发,用户对音视频质量诉求也愈加强烈。


在整个视频链路中,大部分模块都可以精确度量,如采集、上传、预处理、转码、分发等。然而未知的部分却恰恰是最关键的部分,即用户的视频观看体验到底怎么样。


目前行业内的视频质量评估方法分为两大类:客观质量评估与主观质量评估。前者计算视频的质量分数,又根据是否使用高清视频做参考、源视频是专业视频还是用户原创视频等进一步细分;后者主要依赖人眼观看并打分,能够直观反映观众对视频质量的感受。然而,这些方法仍存在耗时费力、成本较高、主观观感存在偏差等难题。


腾讯多媒体实验室提出的视频质量评估解决方案,首先结合业务需求,使用“在线主观质量评测平台”,来构建大规模主观质量数据库,同时使用所收集的主观数据来训练基于深度学习的客观质量评估算法,最后把训练好的质量评估算法部署到业务线中,闭环监控可能存在的质量问题。从以上三个角度出发,DVQA 能够在兼顾不同业务、场景的前提下,满足效率与精度两大需求。


DVQA 包含多个质量评估算法模型,本次开源的是针对 PGC 视频的算法 C3DVQA。本项目使用 Python 开发,深度学习模块使用 PyTorch。代码使用模块化设计,方便集成较新的深度学习技术,灵活的自定义模型,训练和测试新的数据集。


在算法设计上,C3DVQA 所使用的网络结构如下图所示。其输入为损伤视频和残差视频。网络包含两层二维卷积来逐帧提取空域特征。级联后使用四层三维卷积层来学习时空联合特征。三维卷积输出描述了视频的时空掩盖效应,再使用它来模拟人眼对视频残差的感知情况:掩盖效应弱的地方,残差更容易被感知;掩盖效应强的地方,复杂的背景更能掩盖画面失真。



网络最后是池化层和全连接层。池化层的输入为残差帧经掩盖效应处理后的结果,它代表了人眼可感知残差。全连接层学习整体感知质量和目标质量分数区间的非线性回归关系。


在评测结果上,腾讯多媒体实验室在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。并使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。将所提出的 C3DVQA 与常用的全参考质量评估算法进行对比,包括 PSNR、MOVIE、ST-MAD、VMAF 和 DeepVQA,结果如下表所示。



(LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较)


目前该评估算法已在腾讯内外部多款产品中进行使用验证,如腾讯会议就借助实验室上百个符合 ITU/3GPP/AVS 等国外内标准的指标进行评判,闭环监控全网的用户体验质量,从用户真实体验出发,不断优化产品性能。


2020-03-11 14:053676

评论

发布
暂无评论
发现更多内容

Nacos托管LangChain应用Prompts和配置,助力你的AI助手快速进化

阿里巴巴云原生

阿里云 云原生 nacos

吉利汽车采用 EMQX 与AutoMQ联合方案构建公私有云一体化的车联网核心架构

AutoMQ

云计算 大数据 混合云架构 AutoMQ 吉利汽车

条件锁存在的意义:用生活中的例子秒懂线程间的"暗号系统"

不在线第一只蜗牛

Java

腾讯云服务器怎么对接高防

网络安全服务

CDN DDoS 腾讯云服务器 高防IP DDoS 攻击

AI数字人开发的技术难点

北京木奇移动技术有限公司

AI技术开发 软件外包公司 AI数字人

如何优雅实现电商API的统一调用:订单与物流接口整合实战

代码忍者

API 接口

AI如何降本增效 将零售商从“Excel地狱”中解救出来?

第七在线

极氪汽车云原生架构落地实践

阿里巴巴云原生

阿里云 微服务 云原生

企业多分支机构组网有哪些难点?怎么解决?

Ogcloud

SD-WAN 企业组网 SD-WAN组网 异地组网 分支组网

科技向善|智源联合南开大学HLT Lab开源两大中文语音数据集,填补老幼人群语音研究空白

智源研究院

API安全与管理(上海)技术沙龙,火热报名中!

云智慧AIOps社区

API 策略

DApp开发必看!全球合规白皮书:DAO治理+跨链技术落地策略

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

不懂API接口,产品真的做不好吗?说点大实话

代码忍者

API接口

im即时通讯 | BeeWorks为企业构建专属的内部沟通软件

BeeWorks

即时通讯IM 私有化部署 企业级应用

低代码平台的技术演进与优化分析

JeeLowCode低代码平台

低代码 低代码开发 低代码选择

2025链游开发爆款攻略:AI+跨链技术实战指南

区块链软件开发推广运营

交易所开发 dapp开发 链游开发 公链开发 代币开发

zk源码—数据节点与Watcher机制及权限

不在线第一只蜗牛

源码 架构 zk

鸿蒙版小红书如何让图库访问完全由“你”掌控

HarmonyOS SDK

harmoyos

博睿数据全面接入DeepSeek:运用AI 铺就大模型可观测性进阶之路

博睿数据

博睿数据 DeepSeek v3

Swagger 中的 x-nullable 是什么意思?

数据追梦人

抓住AI时代机遇,从伙伴与华为共筑行业解决方案开始

脑极体

AI

Kube Scheduler 可观测性最佳实践

观测云

Kubernetes

私有化视频会议系统,业务沟通协作安全不断线

BeeWorks

即时通讯IM 私有化部署 企业级应用 局域网视频软件

十个很实用的前端工具库,快来看看吧!

伤感汤姆布利柏

企业网络优化:如何通过SD-WAN实现办公应用加速

Ogcloud

SD-WAN SD-WAN组网 SD-WAN厂商 sd-wan专线 SD-WAN厂家

【2025年最全电商数据API清单】商品/订单/物流一键搞掂!程序员&运营速藏

代码忍者

API 接口

​​JNPF快速开发平台的八大核心职能

伤感汤姆布利柏

XEOS 与 AutoMQ 推出联合方案,共筑云原生 Kafka 新生态

AutoMQ

云计算 大数据 云原生 XSKY AutoMQ

AI数字人的应用领域

北京木奇移动技术有限公司

软件外包公司 AI技术应用 AI数字人

RK首款AI四模机械键盘来袭!一机多用超进化,让时间更自由

科技热闻

zk基础—Curator的使用与剖析

量贩潮汐·WholesaleTide

架构

腾讯开源视频质量评估算法DVQA,性能优于多项传统算法_大数据_腾讯多媒体实验室_InfoQ精选文章