写点什么

编码技术新突破:字节跳动 AVG 让视频缩小 13%

字节跳动

  • 2023-03-04
    北京
  • 本文字数:1196 字

    阅读完需:约 4 分钟

编码技术新突破:字节跳动AVG让视频缩小13%

据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。


字节跳动 AVG 在美国加州建立研发团队,成员有来自高通、微软、英特尔等巨头的资深研究员,也有出身海内外顶级院校的新生代。在此前 JVET 制定新一代国际视频编解码标准 H.266/VVC 的过程中,字节跳动 AVG 累计提交 260+ 项技术提案,其中 130+ 项被采纳,被采纳提案数和采纳率均排在世界前列,是 H.266/VVC 核心算法的主要贡献者之一。


视频是由一张张图片连接起来的动态图像序列,视频编解码则是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送高质量的视频数据。 H.266/VVC 能够在不影响画质的情况下,把视频码率降低到前一代标准 H.265/HEVC 的一半。本来只够放标清视频的网速,也能流畅播放高清视频。


此次字节跳动 AVG 提出的新算法,旨在通过深度学习技术构建减少视频压缩失真的滤波器( DAM ),主干是基于残差单元堆叠的深度卷积网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。所谓残差单元是指通过引入跳层连接,允许网络把注意力放在变化的残差上,这与视频图像帧之间的残差有异曲同工之妙,比如武林高手决斗,“剑光一闪”,每一帧图像绝大部分内容是相同的,闪动的剑光形成残差,这也是视频编码压缩的重点关注对象。


实验结果显示,相比 H.266/VVC 最新标准,字节跳动的 DAM 解决方案能够为视频编码性能带来显著提升,亮度信号 Y 可实现 10.28% 的性能增益,两个色度信号 U 和 V ,性能增益也分别达到 28.22% 和 27.97% ,在视频质量有所优化的同时,至少还可缩小 13% 的数据体积。


图:测试用例来自国际标准组织的测试视频


据悉,字节跳动 AVG 已自主研发了 BVC2.0 编码器,首次参加国际权威的 MSU 2020 视频编码器大赛,就在四项评价指标上包揽第一。 AVG 的各项研究成果,也将通过 BVC 编码器的升级换代投入应用,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域,从而为用户带来更高清画质、更流畅播放的视频体验。


AVG 除了深度参与国际视频标准制定外,也为国产新一代视频压缩标准 AVS3 做出重要贡献,包括块划分、运动矢量编码及预测、色-亮度帧内预测等多项原创性技术被 AVS3 视频标准所采纳。字节跳动因此获得 2019 年度 AVS 产业技术创新之提案奖,是迄今唯一获奖的互联网企业。


字节跳动 AVG 的张莉博士介绍说,视频压缩标准作为服务商必须遵循的规范,不仅蕴含着难以估量的商业价值,也会为用户带来实实在在的便利。通过标准制定与产品研发,字节跳动会持续创新并输出技术能力,与行业一起为用户提供更优质的视频服务。

2023-03-04 18:517579
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 362 篇内容, 共 265.7 次阅读, 收获喜欢 294 次。

关注

评论

发布
暂无评论
发现更多内容

从ClickHouse的名字由来讲起

nauu

数据库 大数据 分布式 OLAP Clickhouse

Android | Tangram动态页面之路(一)需求背景

哈利迪

android

Serverless: 2020年函数计算的冷启动怎么样了

刘宇

Kafka零数据丢失的配置方案

奈学教育

kafka kafka配置 kafka数据

揭秘!开源软件背后的神秘组织

Apache Flink

大数据 flink 流计算 实时计算

学习型组织的修炼之道

Yanel 说敏捷产品

团队管理 项目管理 敏捷 团队协作 组织转型

MySQL索引知识介绍

Simon

MySQL 索引结构

多多益善的MacOS文件管理方案

陈东泽 EuryChen

macos Mac apple 提升效率 文件管理

看完这篇操作系统,和面试官扯皮就没问题了

苹果看辽宁体育

操作系统 计算机基础

工程师、程序员和产品经理

王泰

程序员 产品经理 IT 软件工程师 工程师思维

BVR 才是变革的核心

Yanel 说敏捷产品

团队管理 项目管理 敏捷 敏捷开发 敏捷精髓

常见的主从报错集锦

一个有志气的DB

MySQL 主从配置 主从同步

MySQL备份基础

一个有志气的DB

MySQL 数据

敏捷团队成员的工作量指标真的那么重要吗?

金生水起

敏捷开发 Scrum精髓 敏捷精髓 Agile

太赞了,VSCode 上也能画流程图了!

GitHubDaily

visual-studio GitHub 程序员 vscode 开发者工具

真的!只需 “六步” 实现图像特定物体识别!!!

攀岩飞鱼

Python OpenCV 计算机视觉 图像识别 物体检测

Java实现Base64

Java

提升编程效率:重构

Page

高效工作 敏捷开发 重构 高效

Intellij IDEA2020.x如何安装Lombok插件

龙眼果

开发者工具

用"结构性张力"构建自驱力

Yanel 说敏捷产品

团队管理 敏捷 团队协作 项目

【Howe学爬虫】全国统计用区划代码爬取

Howe

Java 爬虫

搜商:高效的使用搜索引擎

石云升

高效搜索 搜索技巧 搜商

【大咖说问大咖】关于开源的那些事 —— PingCAP CTO 黄东旭 Q&A 交流帖

InfoQ写作社区官方

开源 写作平台 大咖说 技术交流 热门活动

为什么我喜欢的大V拉黑我?

lmymirror

经历 后真相时代 日常思考

数据分析的利器-clickhouse概述

流沙

数据库 Clickhouse

spring注入bean的几种策略模式

王德发

Java Spring Boot 测试驱动开发实战营

KK日知录20200515

kimmking

原创 | 使用JUnit、AssertJ和Mockito编写单元测试和实践TDD (七)CORRECT边界条件

编程道与术

Java 编程 软件测试 TDD 单元测试

何时开始重构?

Page

敏捷开发 重构

2020 敏捷产品基本盘

Yanel 说敏捷产品

产品 敏捷 产品设计 产品推荐

近期工作的几点感想

Leiy

app退出登录

编码技术新突破:字节跳动AVG让视频缩小13%_语言 & 开发_InfoQ精选文章