HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

编码技术新突破:字节跳动 AVG 让视频缩小 13%

字节跳动

  • 2023-03-04
    北京
  • 本文字数:1196 字

    阅读完需:约 4 分钟

编码技术新突破:字节跳动AVG让视频缩小13%

据联合视频专家组 JVET 官网显示,字节跳动 AVG (先进视频团队)在 2021 年 2 月发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。例如,一段 180 分钟 H.266/VVC 标准的高清视频( 1080P 分辨率),大约需要 3GB 的数据体积,应用新技术后只需要 2.6GB 。这是业界公开的单个智能编码工具的最佳性能增益。


字节跳动 AVG 在美国加州建立研发团队,成员有来自高通、微软、英特尔等巨头的资深研究员,也有出身海内外顶级院校的新生代。在此前 JVET 制定新一代国际视频编解码标准 H.266/VVC 的过程中,字节跳动 AVG 累计提交 260+ 项技术提案,其中 130+ 项被采纳,被采纳提案数和采纳率均排在世界前列,是 H.266/VVC 核心算法的主要贡献者之一。


视频是由一张张图片连接起来的动态图像序列,视频编解码则是视频应用的底层核心技术,作用是对图像进行压缩和数字编码,以尽可能小的带宽传送高质量的视频数据。 H.266/VVC 能够在不影响画质的情况下,把视频码率降低到前一代标准 H.265/HEVC 的一半。本来只够放标清视频的网速,也能流畅播放高清视频。


此次字节跳动 AVG 提出的新算法,旨在通过深度学习技术构建减少视频压缩失真的滤波器( DAM ),主干是基于残差单元堆叠的深度卷积网络,辅以自适应模型选择以最大程度适应特性复杂的自然视频。所谓残差单元是指通过引入跳层连接,允许网络把注意力放在变化的残差上,这与视频图像帧之间的残差有异曲同工之妙,比如武林高手决斗,“剑光一闪”,每一帧图像绝大部分内容是相同的,闪动的剑光形成残差,这也是视频编码压缩的重点关注对象。


实验结果显示,相比 H.266/VVC 最新标准,字节跳动的 DAM 解决方案能够为视频编码性能带来显著提升,亮度信号 Y 可实现 10.28% 的性能增益,两个色度信号 U 和 V ,性能增益也分别达到 28.22% 和 27.97% ,在视频质量有所优化的同时,至少还可缩小 13% 的数据体积。


图:测试用例来自国际标准组织的测试视频


据悉,字节跳动 AVG 已自主研发了 BVC2.0 编码器,首次参加国际权威的 MSU 2020 视频编码器大赛,就在四项评价指标上包揽第一。 AVG 的各项研究成果,也将通过 BVC 编码器的升级换代投入应用,包括抖音、西瓜视频、今日头条等 App 的视频类内容处理,以及云计算、云游戏等基础架构领域,从而为用户带来更高清画质、更流畅播放的视频体验。


AVG 除了深度参与国际视频标准制定外,也为国产新一代视频压缩标准 AVS3 做出重要贡献,包括块划分、运动矢量编码及预测、色-亮度帧内预测等多项原创性技术被 AVS3 视频标准所采纳。字节跳动因此获得 2019 年度 AVS 产业技术创新之提案奖,是迄今唯一获奖的互联网企业。


字节跳动 AVG 的张莉博士介绍说,视频压缩标准作为服务商必须遵循的规范,不仅蕴含着难以估量的商业价值,也会为用户带来实实在在的便利。通过标准制定与产品研发,字节跳动会持续创新并输出技术能力,与行业一起为用户提供更优质的视频服务。

2023-03-04 18:517327
用户头像
鲁冬雪 GMI Cloud China Marketing Manager

发布了 362 篇内容, 共 258.4 次阅读, 收获喜欢 293 次。

关注

评论

发布
暂无评论
发现更多内容

2022年中国音频市场年度综合分析

易观分析

音频市场

Vue3 - $attrs 的几种用法(1个或多个根元素、Options API 和 Composition API)

德育处主任

Vue composition-api 组件通信 6月月更 Vue透传

Substrate 源码追新导读: 4月底重大更新: Nomination Pool 即将上线, NFT增加锁定功能

彭亚伦

Substrate 波卡 波卡生态

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

西柚子

一套系统,减轻人流集中地10倍的通行压力

天天预约

人脸识别 考勤管理 设备接入 预约工具 疫情防控

关于企业数字化的展望(38/100)

hackstoic

数字化

开箱即用!Linux 内核首个原生支持,让你的容器体验飞起来!| 龙蜥技术

阿里巴巴云原生

Linux 阿里云 容器 云原生

大促场景下,如何做好网关高可用防护

阿里巴巴云原生

阿里云 高可用 云原生 网关 高可用微服务

跟着官方文档学 Python 之:简介

甜甜的白桃

Python 零基础 6月月更

在线文本按行批量反转工具

入门小站

工具

可观测,才可靠:云上自动化运维CloudOps系列沙龙 第一弹

阿里云弹性计算

DevOps 可观测性 自动化运维 CloudOps

如何制作登录界面

海瞳Seapupil

Hi,你有一份Code Review攻略待查收!

Jianmu

后端 Code Review 代码规范 SonarQube checkstyle

什么是 ICMP ?ping和ICMP之间有啥关系?

wljslmz

网络协议 ping ICMP 6月月更

2022年第一季度消费金融APP用户洞察——总数达4479万人

易观分析

消费金融

工作流自动化 低代码是关键

力软低代码开发平台

从科研创新到产业落地 华为发布人工智能大模型全流程使能体系

科技热闻

国内首家!EMQ加入亚马逊云科技“初创加速-全球合作伙伴网络计划”

EMQ映云科技

物联网 IoT emq 亚马逊 6月月更

如何使用物联网低代码平台进行画面管理?

AIRIOT

低代码 物联网 低代码开发 低代码开发平台 低代码,项目开发

【干货分享】红黑树硬核讲解

C++后台开发

后端开发 红黑树 linux开发 Linux内核 C++开发

大数据性能提升28%!阿里云新一代本地SSD实例i4开放公测

阿里云弹性计算

大数据 io SSD NoSQL 数据库

拥抱云原生:江苏移动订单中心实践

鲸品堂

云原生

数仓的字符截取三胞胎:substrb、substr、substring

华为云开发者联盟

数据库 后端 开发 华为云

SQL报了一个不常见的错误,让新来的实习生懵了

华为云开发者联盟

数据库 sql 程序员 后端 华为云

OpenSSF 安全计划:SBOM 将驱动软件供应链安全

SEAL安全

软件物料清单

【ELT.ZIP】OpenHarmony啃论文俱乐部—见证文件压缩系统EROFS

ELT.ZIP

OpenHarmony 压缩数据 压缩算法 ELT.ZIP

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

鳄鱼视界

带你认识图数据库性能和场景测试利器LDBC SNB

华为云开发者联盟

人工智能 华为云 图数据库

4种方法教你如何查看java对象所占内存大小

华为云开发者联盟

Java 开发 内存 代码

【ELT.ZIP】OpenHarmony啃论文俱乐部—数据密集型应用内存压缩

ELT.ZIP

OpenHarmony 压缩数据 压缩算法 ELT.ZIP

Bit.Store:熊市漫漫,稳定Staking产品或成主旋律

小哈区块

编码技术新突破:字节跳动AVG让视频缩小13%_语言 & 开发_InfoQ精选文章