写点什么

在 AI 应用爆发前夜,H.266 成熟了

  • 2025-02-28
    北京
  • 本文字数:1605 字

    阅读完需:约 5 分钟

大小:868.26K时长:04:56
在 AI 应用爆发前夜,H.266 成熟了

2024 年,随着生成式 AI、多模态大模型、全景直播、三维重建等技术逐渐落地行业,我们从流畅、实时、高清的数字视频世界逐步进入更智能、交互性更强、沉浸感更强的的 AI 视频世界。这是一次行进中的音视频革命,我们能从诸多痕迹,验证它的进展:


  • 据 ResearchAndMarkets 预测,到 2027 年,全球视频流媒体市场规模将高达 184.3 亿美元,这一惊人的数据充分彰显了视频产业的蓬勃发展态势;

  • XR 设备出货量年增 35%,虚实融合的"空间互联网"逐步成型;

  • 2024 年央视春晚采用 XR 技术,围绕舞台效果进行了设计,并验证落地;

  • ……


以上并非终局,事实上,生成式 AI 正在进一步扩展视频流媒体领域的市场天花板。


内容生产正从 UGC/PGC 发展到 AIGC,内容的生产量将呈几何倍数的增长。有数据显示,AIGC 工具将视频创作门槛降低 90%,预计 2027 年全球短视频日产量突破 50 亿条;用户的交互空间也在从 2D、3D,VR 拓展到了虚拟世界与现实世界的无缝融合。


这一系列新需求,对视频编解码技术的要求是:在带宽不变的情况下,画质更优;同等画质下,存储和传输成本更低。


最新一代视频编码标准 H.266/VVC 正是在这种背景下,走入“舞台”中央。作为支撑庞大视频产业的核心关键要素,H.266 在流媒体生态中起着举足轻重的作用。


H.266 的重点应用场景可分为三个部分:点播、直播、RTC。虽然 H.266 硬解码器的支持正在逐步增加,但目前市场上硬解支持 H.266 的设备相对较少,尤其是一些移动终端。因此,优化 H.266 的软件解码器就显得尤为重要。


其中,点播编解码更注重压缩效率与画质平衡,H.266 的核心优势在于压缩效率提升约 50%(理论值)。通过四叉树加多类型树(QT+MTT)分块法和色度分量双树编码,H.266 能更精细地划分编码单元,减少冗余数据。例如,在 4K/8K 视频中,128×128 的编码树单元(CTU)相比 H.265 的 64×64 单元,显著提升大分辨率视频的编码效率。


在动态范围与色彩支持方面,H.266 的 Main10 Profile 原生支持 10bit 色深和 HDR,解决了点播内容在宽色域和高动态范围下的色彩断层问题。


直播则更看重实时性与复杂度平衡,因而对编码速度要求苛刻,H.266 的编码复杂度较 H.265 增加约 10 倍,可通过硬件加速(如 GPU 或专用芯片)实现高效实时编码,这点与当下新型算力中心的构建思路相通,适合复用冗余的、低功耗的 GPU 算力。


RTC (实时通信)更关注低延迟与交互优化,要求端到端延迟低于 100ms。H.266 通过多种技术手段提升运动矢量预测(HMVP)和编码(SMVD) 效率,提升编码效率,降低重传率。


针对视频会议中的 PPT 共享、白板协作等场景,H.266 引入帧内块复制(Intra Block Copy)技术,直接复用屏幕内容中的重复块(如文字、图表),压缩效率提升 40%(理论值)。


此外,H.266 的环绕运动补偿(Wrap Around Motion Compensation),也可以优化 360 度视频的边界连续性。


这些特性使得 H.266 已经成为视频企业必选的技术栈、必做的标准升级。有数据显示,2026 年支持 H.266 硬解设备将超 20 亿台,推动 8K/VR 内容普及。唯一的问题在于,直接使用开源软件做简单定制,还是基于付费版商业软件来构建业务。


我们必须考虑到,对比十年前,视频编解码领域的实力派玩家,数量增加了,其中最重磅的,非字节跳动及火山引擎莫属。


字节及火山在视频业务上有积累独到的 Know-How ,且在技术上的嗅觉足够敏锐,这赋予了字节及火山自研的 H.266 系列产品夸张的性能表现。比如,从官方数据口径来看,火山引擎 H.266 解码器的计算复杂度几乎只有 VTM-23.5 的四分之一到七分之一,是 FFmpeg 7.1 的三分之一。


本专题将首先回顾 H.266/VVC 的技术沿革,而更多、更详细的性能指标对比和技术解读,将在接下来的章节中逐步展开。专题末尾,我们会单独提及火山引擎对点播、直播、RTC 场景下编码器及解码器的优化工作。


我认为这个技术专题,对于即将基于  H.266 标准构建视频流业务的团队,有着极强的借鉴意义,也几乎是一名技术决策者,在完成技术选型前,所必须参考的资料。

2025-02-28 19:0711184

评论

发布
暂无评论
发现更多内容

迭代器的一些简单理解

不在线第一只蜗牛

迭代 迭代器

LinkedIn最新研究:图+向量数据库,客服解答时间缩短64%

Fabarta

数据互通新纪元,企业如何实现系统无缝对接?

聚道云软件连接器

案例分享

邀您参会丨飞天技术沙龙 AI 原生应用架构专场·北京站

阿里巴巴云原生

阿里云 AI 云原生

客户案例|博睿数据助力中泰证券App用户体验全面升级

博睿数据

1688商品API接口:电商数据自动化的新引擎

Noah

API面临哪些风险,如何做好API安全

德迅云安全杨德俊

虚拟ECU:汽车空调压缩机控制系统

DevOps和数字孪生

虚拟ECU 汽车行业

优化数据查询性能:StarRocks 与 Apache Iceberg 的强强联合

StarRocks

加速短剧出海,阿里云视频云获优秀出海产品技术服务金帆奖

阿里云CloudImagine

云计算 视频云 出海 微短剧 短剧

常态化运营,让数据安全工作落地生根!

极盾科技

数据安全

SDK实战指南:从配置到管理,一步步创建阿里云ECS实例

极客天地

英伟达一季净利暴增 6 倍;消息称 TikTok 计划本周大幅裁员丨 RTE 开发者日报 Vol.210

声网

自动化运维实战:Docker与TASKCTL在ETL调度中的深度应用

敏捷调度TASKCTL

运维 自动化运维 TASKCTL #docker

2023全球DDoS攻击态势分析,与众多行业专家共议DDoS破局之道

百度安全

最后一天,职场火焰杯测试开发大赛报名马上结束

霍格沃兹测试开发学社

全面掌握甲骨文云 OCI MySQL 服务:从自动运维到高效管理

极客天地

腾讯面试:如何提升Kafka吞吐量?

王磊

高效查询秘诀,解码YashanDB优化器分组查询优化手段

YashanDB

数据库 优化器 分组查询 yashandb 崖山数据库

Python打包成exe的方法介绍

我再BUG界嘎嘎乱杀

Python 后端 开发 打包exe

面向对象变成VS函数式编程

FunTester

8家券商综合评级上升,4月券商App终端业务体验评测报告发布

博睿数据

AI日报|腾讯,科大讯飞加入百模价格战,黄仁勋预言AGI或五年内出现,DeepL获3亿融资...

可信AI进展

人工智能

高效简单办赛的秘诀:自定义判题器

华为云PaaS服务小智

云计算 华为云 大赛 赛事

在 AI 应用爆发前夜,H.266 成熟了_字节跳动_王一鹏_InfoQ精选文章