写点什么

编码技术新突破:字节跳动 AVG 让视频缩小 13%

字节跳动

  • 2023-03-04
    北京
  • 本文字数:1196 字

    阅读完需:约 4 分钟

编码技术新突破:字节跳动AVG让视频缩小13%

据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。


字节跳动 AVG 在美国加州建立研发团队,成员有来自高通、微软、英特尔等巨头的资深研究员,也有出身海内外顶级院校的新生代。在此前 JVET 制定新一代国际视频编解码标准 H.266/VVC 的过程中,字节跳动 AVG 累计提交 260+ 项技术提案,其中 130+ 项被采纳,被采纳提案数和采纳率均排在世界前列,是 H.266/VVC 核心算法的主要贡献者之一。


视频是由一张张图片连接起来的动态图像序列,视频编解码则是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送高质量的视频数据。 H.266/VVC 能够在不影响画质的情况下,把视频码率降低到前一代标准 H.265/HEVC 的一半。本来只够放标清视频的网速,也能流畅播放高清视频。


此次字节跳动 AVG 提出的新算法,旨在通过深度学习技术构建减少视频压缩失真的滤波器( DAM ),主干是基于残差单元堆叠的深度卷积网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。所谓残差单元是指通过引入跳层连接,允许网络把注意力放在变化的残差上,这与视频图像帧之间的残差有异曲同工之妙,比如武林高手决斗,“剑光一闪”,每一帧图像绝大部分内容是相同的,闪动的剑光形成残差,这也是视频编码压缩的重点关注对象。


实验结果显示,相比 H.266/VVC 最新标准,字节跳动的 DAM 解决方案能够为视频编码性能带来显著提升,亮度信号 Y 可实现 10.28% 的性能增益,两个色度信号 U 和 V ,性能增益也分别达到 28.22% 和 27.97% ,在视频质量有所优化的同时,至少还可缩小 13% 的数据体积。


图:测试用例来自国际标准组织的测试视频


据悉,字节跳动 AVG 已自主研发了 BVC2.0 编码器,首次参加国际权威的 MSU 2020 视频编码器大赛,就在四项评价指标上包揽第一。 AVG 的各项研究成果,也将通过 BVC 编码器的升级换代投入应用,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域,从而为用户带来更高清画质、更流畅播放的视频体验。


AVG 除了深度参与国际视频标准制定外,也为国产新一代视频压缩标准 AVS3 做出重要贡献,包括块划分、运动矢量编码及预测、色-亮度帧内预测等多项原创性技术被 AVS3 视频标准所采纳。字节跳动因此获得 2019 年度 AVS 产业技术创新之提案奖,是迄今唯一获奖的互联网企业。


字节跳动 AVG 的张莉博士介绍说,视频压缩标准作为服务商必须遵循的规范,不仅蕴含着难以估量的商业价值,也会为用户带来实实在在的便利。通过标准制定与产品研发,字节跳动会持续创新并输出技术能力,与行业一起为用户提供更优质的视频服务。

2023-03-04 18:517950
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 363 篇内容, 共 278.2 次阅读, 收获喜欢 298 次。

关注

评论

发布
暂无评论
发现更多内容

开源的价值观与文化的传递

开源社

#开源

4步教你学会使用Linux-Audit工具

华为云开发者联盟

Linux 工具 安全 监控 开发

全新物联网数据集成:Flow可视化编排&双向数据桥接

EMQ映云科技

物联网 IoT flow emqx 8月月更

mybatis基础的crud

Geek_5829b6

Java mybatis

闲谈Serverless,价值和未来

白留明(Armin.Lionheart)

云计算 Serverless Faas

加密市场的投资布局,Zebec实属价值洼地

西柚子

动态尺寸模型优化实践之Shape Constraint IR Part I

阿里云大数据AI技术

深度学习 编译器

加密市场由阴转晴,Zebec或成2022后半段黑马

鳄鱼视界

OpenHarmony轻量设备Hi3861芯片开发板启动流程分析

OpenHarmony开发者

OpenHarmony

开源一夏 | 在 STM32L051 上使用 RT-Thread (二、无线温湿度传感器 之 CubeMX配置)

矜辰所致

开源 RT-Thread 8月月更 STM32L051

【限时领奖】消息队列 MNS 训练营重磅来袭,边学习充电,边领充电宝~

阿里巴巴中间件

阿里云 云原生 消息队列 课程 MNS

10种有用的Linux Bash_Completion 命令示例

华为云开发者联盟

Linux 后端 开发

关起门来搞开源,做不了开源世界的Leader

源字节1号

开源 软件开发

企业应用现代化实用教程 | 如何快、准、狠地进行应用容器化改造?

York

容器 云原生 数字化转型 架构设计 应用现代化

微服务、网关、服务发现/注册的正确打开方式

Java全栈架构师

Java 程序员 架构 微服务 程序人生

量化交易合约机器人系统开发策略分析

薇電13242772558

量化策略

融会贯通,并行不悖 | 2022年8月《中国数据库行业分析报告》精彩抢先看

墨天轮

数据库 greenplum MPP 国产数据库 HTAP

基于深度学习的细粒度分类研究及应用

之家技术

人工智能 深度学习 模型 图像 CVPR

泄露了,22年阿里巴巴秋招内部面试资料,看完之后剑指offer

Java面试那些事儿

Java 编程 程序员 面试 架构师

我和谷歌共成长——我的Google Play上车之路

云村的泊

8月月更

怎样评测对比报表工具的性能?

Bug终结者

Java sql SPL 8月月更

短视频直播app源码——软件系统开发方案

开源直播系统源码

软件开发 直播系统源码 短视频直播源码 短视频直播

数据结构——二叉树

工程师日月

8月月更

秒验丨Android端SDK API使用说明

MobTech袤博科技

android UI 秒验

面向大规模数据的云端管理,百度沧海存储产品解析

百度Geek说

人工智能 数据

国产系统的不足或许可以靠小程序弥补

Geek_99967b

小程序

华为云构建云原生DevSecOps平台,保障软件供应链全流程安全可信

华为云开发者联盟

云计算 云原生 安全 后端 华为云

2min速览:从设计、实现和优化角度浅谈Alluxio元数据同步

Alluxio

元数据 数据同步 Alluxio 大数据 开源 8月月更

.NET 6 SignalR websocket 入门(一)

辣么大

.net SignalR 8月月更

mybatis入门案例

Geek_5829b6

Java 数据库 mybatis

怎么理解后App时代的轻应用技术

FN0

App 小程序容器 轻应用 快应用

编码技术新突破:字节跳动AVG让视频缩小13%_语言 & 开发_InfoQ精选文章