2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

基于三维卷积神经网络的全参考视频质量评估算法(三)

  • 2020-01-17
  • 本文字数:1060 字

    阅读完需:约 3 分钟

基于三维卷积神经网络的全参考视频质量评估算法(三)

结果

我们在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。LIVE 数据库包含 10 个参考视频和对应每个参考视频的 15 个失真视频。CSIQ 数据集包含 12 个源视频和相对应的 18 个失真视频。我们使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。


因为这两个数据库相对较小,我们参考另外一片深度学习文章[10]的做法,每次随机抽取 80%的参考视频和由它们所得到的失真视频作为测试集。我们重复了 20 次这样的数据集划分并且每次都从头开始训练模型。具体质量评估的散点图如图 5 所示。


图 5 质量估计结果散点图,每一个点代表一个待测视频。其中 Y 轴为估计视频质量,X 轴为主观打分结果,左图为 LIVE 上测试结果,右图为 CSIQ 上测试结果。


我们与常用的全参考质量评估算法进行了对比,比较的算法包括 PSNR,MOVIE[ 11],ST-MAD [12],VMAF 和 DeepVQA [10]。每次测试都会得到一个 PLCC 和 SROCC,下表中我们使用多次实验结果的中值来代表最终性能。


我们可以清楚的看到本文所设计的算法 C3DVQA 在两个数据库上均大幅领先 PSNR,MOVIE,ST-MAD,VMAF 等传统算法。值得一提的是 DeepVQA 也是一个基于深度学习的算法,也取得了不错的性能。我们把这些性能提提升归结为两方面的原因,1)使用 CNN 来学习质量相关特征要优于传统的特征提取算法;2)DeepVQA 和 C3DVQA 均学习视频的时空联合特征,显性的利用运动信息更能刻画视频质量。



表一 LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较

总结

本文简要回顾了目前学术界和工业界视频质量评估方向的发展状况。处于复杂度考虑,工业界仍倾向于使用复杂度较低的基于图像质量评估的方案。但是这样做的缺陷就是不能不能把视频作为一个整体来学习时空特性,尽管结果差强人意,也算是性能与复杂度很好的折中。


我们提出了一种基于三维卷积神经网络的全参考算法。通过学习视频的时空联合特征,能更好的解决运动信息丢失问题。相对于传统特征提取算法,我们的算法能大幅度的提升准确度。


当然,这一切才刚刚开始,还有很多工作需要补充。我们想要详细的复杂度分析,特别是在没有 GPU 可用的场景。我们也想知道所训练的算法在其它数据库上的性能,而且不仅仅局限于 PGC 视频,也包括 UGC 视频。


好消息是我们有计划对业界开源模型训练代码,这样能方便所有人去使用自己的数据库训练测试特定视频业务场景。同时,我们也欢迎任何形式的协同开发,不管是贡献数据库,还是贡献预训练模型,甚至是抛出业务场景中所遇到的问题。


本文转载自 腾讯多媒体实验室公众号。


原文链接:https://mp.weixin.qq.com/s/Kk7J8dLMhHbhksxMumHuwA


2020-01-17 18:051289

评论

发布
暂无评论
发现更多内容

真香!阿里P8耗时半年著作660页Java高并发与网络编程实战总结

Java架构之路

Java 程序员 架构 面试 编程语言

字典树 —— 字符串分析算法

三钻

算法 大前端 七日更 字典树

用 Range 实现 CSSOM 精准操作

三钻

大前端 Range 七日更 CSSOM

万字详解 阿里面试真题:请你说说索引的原理

Java架构师迁哥

TARS RPC 通信框架|提供多种远程调用方式

TARS基金会

微服务 RPC 远程调用 TARS

世界之书:《一个人的朝圣》与重归信仰

lidaobing

一个人的朝圣 28天写作

盘点2020 | 所思、所遇、所学、所悟

三钻

程序员 大前端 盘点2020

第五课技术选型作业

Geek_michael

极客大学架构师训练营

TypeScript | 第四章:命名空间和模块

梁龙先森

typescript 大前端 七日更

计算存储分离在消息队列上的应用

京东科技开发者

大数据 云原生 中间件 消息中间件

【数据结构与算法】分析时间复杂度与空间复杂度

三钻

数据结构与算法

使用LL算法构建AST —— 编程训练

三钻

Java 算法 大前端 七日更

摸透原理|一文带你了解 Redis 列表底层的实现方式

Java架构师迁哥

Java并发编程:AQS的自旋锁

李尚智

Java java 并发

10万级ETL批量作业调度工具Taskctl-Web应用版0元授权永久使用

敏捷调度TASKCTL

大数据 kettle 运维自动化 海豚调度 批量任务

全国首张数字人民币保单成功出单

CECBC

数字人民币保单

后端缓存代码实践

Albert

缓存击穿 七日更

Nice!有了这份Alibaba内部 “Java面试宝典”,跳槽面试稳了

Java架构之路

Java 程序员 架构 面试 编程语言

鹅厂面经,希望对大家有用

Bryant-cx

大前端 面经

数字资产币种钱包APP系统开发方案

week5-homework-一致性哈希

J

极客大学架构师训练营

音乐后期处理:音乐失真效果制作

懒得勤快

音乐制作 编曲 编曲宿主 mid 音乐后期

分布式缓存架构

raox

极客大学架构师训练营

用 Proxy 简单实现 Vue 3 的 Reactive

三钻

Java 大前端 Vue3 Proxy 七日更

有效破解行业难点 专家称区块链+医疗发展还需找准应用场景

CECBC

区块链 大数据 医疗

四年Java开发,刚从美团、京东、阿里面试归来(已拿offer),分享个人面经

Java架构之路

Java 程序员 架构 面试 编程语言

Prometheus的使用:编写自己的exporter

Rayzh

Prometheus 监控告警

区块链钱包app系统开发源码案例

TARS 服务信息上报|全方位服务监控

TARS基金会

微服务 TARS 监控告警

区块链和通证经济带来的,是一部分股份制公司的消亡与重生

CECBC

金融 通证经济

阿里高工手码”537页Spring源码速成手册“3天直接带你飙向实战

比伯

Java 编程 架构 面试 计算机

基于三维卷积神经网络的全参考视频质量评估算法(三)_文化 & 方法_腾讯多媒体实验室_InfoQ精选文章