写点什么

基于三维卷积神经网络的全参考视频质量评估算法(三)

  • 2020-01-17
  • 本文字数:1060 字

    阅读完需:约 3 分钟

基于三维卷积神经网络的全参考视频质量评估算法(三)

结果

我们在 LIVE 和 CSIQ 两个视频质量数据集上对所提出算法的性能进行验证。LIVE 数据库包含 10 个参考视频和对应每个参考视频的 15 个失真视频。CSIQ 数据集包含 12 个源视频和相对应的 18 个失真视频。我们使用标准的 PLCC 和 SROCC 作为质量准则来比较不同算法的性能。


因为这两个数据库相对较小,我们参考另外一片深度学习文章[10]的做法,每次随机抽取 80%的参考视频和由它们所得到的失真视频作为测试集。我们重复了 20 次这样的数据集划分并且每次都从头开始训练模型。具体质量评估的散点图如图 5 所示。


图 5 质量估计结果散点图,每一个点代表一个待测视频。其中 Y 轴为估计视频质量,X 轴为主观打分结果,左图为 LIVE 上测试结果,右图为 CSIQ 上测试结果。


我们与常用的全参考质量评估算法进行了对比,比较的算法包括 PSNR,MOVIE[ 11],ST-MAD [12],VMAF 和 DeepVQA [10]。每次测试都会得到一个 PLCC 和 SROCC,下表中我们使用多次实验结果的中值来代表最终性能。


我们可以清楚的看到本文所设计的算法 C3DVQA 在两个数据库上均大幅领先 PSNR,MOVIE,ST-MAD,VMAF 等传统算法。值得一提的是 DeepVQA 也是一个基于深度学习的算法,也取得了不错的性能。我们把这些性能提提升归结为两方面的原因,1)使用 CNN 来学习质量相关特征要优于传统的特征提取算法;2)DeepVQA 和 C3DVQA 均学习视频的时空联合特征,显性的利用运动信息更能刻画视频质量。



表一 LIVE 和 CSIQ 两个数据库上不同全参考算法性能比较

总结

本文简要回顾了目前学术界和工业界视频质量评估方向的发展状况。处于复杂度考虑,工业界仍倾向于使用复杂度较低的基于图像质量评估的方案。但是这样做的缺陷就是不能不能把视频作为一个整体来学习时空特性,尽管结果差强人意,也算是性能与复杂度很好的折中。


我们提出了一种基于三维卷积神经网络的全参考算法。通过学习视频的时空联合特征,能更好的解决运动信息丢失问题。相对于传统特征提取算法,我们的算法能大幅度的提升准确度。


当然,这一切才刚刚开始,还有很多工作需要补充。我们想要详细的复杂度分析,特别是在没有 GPU 可用的场景。我们也想知道所训练的算法在其它数据库上的性能,而且不仅仅局限于 PGC 视频,也包括 UGC 视频。


好消息是我们有计划对业界开源模型训练代码,这样能方便所有人去使用自己的数据库训练测试特定视频业务场景。同时,我们也欢迎任何形式的协同开发,不管是贡献数据库,还是贡献预训练模型,甚至是抛出业务场景中所遇到的问题。


本文转载自 腾讯多媒体实验室公众号。


原文链接:https://mp.weixin.qq.com/s/Kk7J8dLMhHbhksxMumHuwA


2020-01-17 18:051259

评论

发布
暂无评论
发现更多内容

域名解析无法修改的常见原因及解决方法

国科云

LaunchControl for Mac|launchd 终极管理工具,告别命令行!

柠檬与橘子

鸿蒙Next仓颉语言开发实战教程:懒加载

幽蓝计划

Studio 3T 2025.11 (macOS, Linux, Windows) - MongoDB 的终极 GUI、IDE 和 客户端

sysin

Studio 3T

已获近 100 万美元融资!斯坦福本科生创业团队用 Trae 开发 K12 教育神器

火山引擎开发者社区

Trae

mac启动项管理

春天的风暖暖的

HarmonyOS桌面快捷功能开发指南:从原理到实战

电子尖叫食人鱼

HarmonyOS

VMware Live Site Recovery 9.0.3 - 数据中心灾难恢复 (DR)

sysin

vSphere

MacOS Sonoma14.2.1系统SSH免密登录

春天的风暖暖的

ThingsBoard与MyEMS的比较分析

开源能源管理系统

开源 能源管理

移动开发范式跃迁:FinClip驱动的Native+小程序生态融合与技术创新

xuyinyin

京东商品评论数据接口详解

tbapi

京东商品评论接口 京东API 京东商品评论采集

AI 在英语教学中的主要应用

北京木奇移动技术有限公司

AI教育 软件外包公司 AI技术公司

VMware ESXi 9.0 正式版发布下载 - 领先的裸机 Hypervisor

sysin

esxi

分析西门子Smart ECX 与MyEMS对比

开源能源管理系统

开源 能源管理

ISO 50001能源管理体系标准全解析

开源能源管理系统

开源 能源管理 ISO 50001

API 接口的使用场景及应用方向总结

Noah

当 Agent 学会了搜图是什么体验?

火山引擎开发者社区

agent

硅基流动入驻阿里云云市场,核心API服务将全面接入阿里云百炼平台

新消费日报

平衡的艺术——精确财务规划与敏捷业务管理

智达方通

财务分析 财务规划

尝鲜体验 | 通义灵码近期新增了哪些功能?用户快速上手指南来了!

阿里巴巴云原生

阿里云 云原生 用户体验 通义灵码

尝鲜体验 | 通义灵码近期新增了哪些功能?用户快速上手指南来了!

阿里云云效

阿里云 通义灵码

VMware vSphere 9.0 正式版发布 - 企业级工作负载平台

sysin

vSphere

一文讲解,Trae 如何在 SWE-bench Verified 中达到70.6%的求解率

火山引擎开发者社区

火山引擎 Trae

从扣子,看 AI Agent 产品开发范式演进

火山引擎开发者社区

agent 扣子

HDC 2025丨华为云云原生剧透!智能驱动的全新一代AI-Native云原生基础设施

华为云原生团队

云计算 容器 云原生

VMware Tools 13.0 正式版发布下载 - 客户机操作系统无缝交互必备组件

sysin

vmware

VMware vSphere Replication 9.0.3 - 虚拟机复制和数据保护

sysin

vSphere

VMware vCenter Server 9.0 正式版发布下载 - 集中管理 vSphere 环境

sysin

vcenter

Metasploit Pro 4.22.7-2025061201 (Linux, Windows) - 专业渗透测试框架

sysin

Metasploit

【保姆级】用 Trae + 高德 MCP 配置老幼友好型路线导航

火山引擎开发者社区

MCP

基于三维卷积神经网络的全参考视频质量评估算法(三)_文化 & 方法_腾讯多媒体实验室_InfoQ精选文章