写点什么

编码技术新突破:字节跳动 AVG 让视频缩小 13%

字节跳动

  • 2023-03-04
    北京
  • 本文字数:1196 字

    阅读完需:约 4 分钟

编码技术新突破:字节跳动AVG让视频缩小13%

据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。


字节跳动 AVG 在美国加州建立研发团队,成员有来自高通、微软、英特尔等巨头的资深研究员,也有出身海内外顶级院校的新生代。在此前 JVET 制定新一代国际视频编解码标准 H.266/VVC 的过程中,字节跳动 AVG 累计提交 260+ 项技术提案,其中 130+ 项被采纳,被采纳提案数和采纳率均排在世界前列,是 H.266/VVC 核心算法的主要贡献者之一。


视频是由一张张图片连接起来的动态图像序列,视频编解码则是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送高质量的视频数据。 H.266/VVC 能够在不影响画质的情况下,把视频码率降低到前一代标准 H.265/HEVC 的一半。本来只够放标清视频的网速,也能流畅播放高清视频。


此次字节跳动 AVG 提出的新算法,旨在通过深度学习技术构建减少视频压缩失真的滤波器( DAM ),主干是基于残差单元堆叠的深度卷积网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。所谓残差单元是指通过引入跳层连接,允许网络把注意力放在变化的残差上,这与视频图像帧之间的残差有异曲同工之妙,比如武林高手决斗,“剑光一闪”,每一帧图像绝大部分内容是相同的,闪动的剑光形成残差,这也是视频编码压缩的重点关注对象。


实验结果显示,相比 H.266/VVC 最新标准,字节跳动的 DAM 解决方案能够为视频编码性能带来显著提升,亮度信号 Y 可实现 10.28% 的性能增益,两个色度信号 U 和 V ,性能增益也分别达到 28.22% 和 27.97% ,在视频质量有所优化的同时,至少还可缩小 13% 的数据体积。


图:测试用例来自国际标准组织的测试视频


据悉,字节跳动 AVG 已自主研发了 BVC2.0 编码器,首次参加国际权威的 MSU 2020 视频编码器大赛,就在四项评价指标上包揽第一。 AVG 的各项研究成果,也将通过 BVC 编码器的升级换代投入应用,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域,从而为用户带来更高清画质、更流畅播放的视频体验。


AVG 除了深度参与国际视频标准制定外,也为国产新一代视频压缩标准 AVS3 做出重要贡献,包括块划分、运动矢量编码及预测、色-亮度帧内预测等多项原创性技术被 AVS3 视频标准所采纳。字节跳动因此获得 2019 年度 AVS 产业技术创新之提案奖,是迄今唯一获奖的互联网企业。


字节跳动 AVG 的张莉博士介绍说,视频压缩标准作为服务商必须遵循的规范,不仅蕴含着难以估量的商业价值,也会为用户带来实实在在的便利。通过标准制定与产品研发,字节跳动会持续创新并输出技术能力,与行业一起为用户提供更优质的视频服务。

2023-03-04 18:518170
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 364 篇内容, 共 281.5 次阅读, 收获喜欢 298 次。

关注

评论

发布
暂无评论
发现更多内容

彻底理解JavaScript执行上下文

Walker

Java 大前端 this指针 函数执行

用Go-Guardian写一个Golang的可扩展的身份认证

朱亚光

微服务 身份认证 Go 语言

USDT跑分承兑系统开发,区块链支付平台搭建

在Ubuntu 20.04 搭建 Django 开发环境 以及 快速构建一个简单的 Blog

Matrix Chan

Python django 后端 Ubuntu20.04

架构师训练营 - 大作业

张明森

@所有人 Flink Forward Asia 2020 向您发出议题征集邀请!

Apache Flink

flink

Apache Pulsar 在腾讯 Angel PowerFL 联邦学习平台上的实践

Apache Pulsar

Apache 学习 开源 Apache Pulsar

繁星计划将成为引领全球币值管理的带动计划!

InfoQ_967a83c6d0d7

架构师训练营-第1周课后作业(1期)

阿甘

百度大脑6.0重磅升级 不断进阶中的中国AI底座实力尽显

脑极体

甲方日常 15

句子

工作 随笔杂谈 日常

我写了一个TypeScript虚拟机。

渔子长

Java typescript 大前端 deno Node

哈哈,成为作者了

大海

架构师训练营-第1周学习总结(1期)

阿甘

UML

架构师训练营第 0 期 期末大作业

无名氏

oeasy 教您玩转 linux 010215 随机谚语 fortune

o

如何让知识图谱告诉你“故障根因”

华为云开发者联盟

华为云 知识图谱 图谱

Netty之旅三:Netty服务端启动源码分析,一梭子带走!

一枝花算不算浪漫

Netty

介绍

剑心

学习

Week 13 学习总结

Jeremy

面试常考算法题之 Top K 问题

小齐本齐

数据结构 算法

滴滴基于 Flink 的实时数仓建设实践

Apache Flink

flink

Clickhouse在大数据分析平台-留存分析上的应用

腾讯云大数据

大数据

两年Java开发经验赶上金九招聘季涨到23K,这究竟是怎么做到的?

Java架构师迁哥

Java面试史上最全的JAVA专业术语面试100问 (前1-50)

Java架构师迁哥

应对高并发系统有没有通用的解决方案呢?

架构师修行之路

架构 高并发 异步

LeetCode题解:206. 反转链表,双指针,JavaScript,详细注释

Lee Chen

大前端 LeetCode

服务质量分析:腾讯会议&腾讯云Elasticsearch玩出了怎样的新操作?

腾讯云大数据

大数据

读书笔记之《普罗普:故事形态学》

AI代笔

金融企业敏捷转型大咖风采 | 中国出口信用保险公司的 DevOps 落地之道

Atlassian

项目管理 DevOps 敏捷 行业资讯 Atlassian

Week 13 命题作业

Jeremy

编码技术新突破:字节跳动AVG让视频缩小13%_语言 & 开发_InfoQ精选文章