卷首语
龙年开端,OpenAI 推出的视频生成模型,横空出世,引发业界广泛关注,而 24 年也被认为是 AI 视频元年,从泛互联网到全行业应用,从 2D 视频到 3D 互动,从虚实结合到虚实融合,技术将推动我们走向全新的世界。
而技术从来不曾孤单,它在无尽的探索中寻找同伴,渴望得到协助,一同照亮未知的领域。共享与进化,是它永恒的方向,每一步前行都承载着时代的梦想,引领我们共同迈向一个更加美好的未来。
火山引擎视频云,基于抖音集团音视频技术沉淀,致力于打造面向体验的视频云,帮助企业端到端提升视频能力,实现播放体验、画质体验、交互体验、性能体验的全面提升与创新。
特别推出《火山引擎视频云实践精选集》 2023 版,收录了全年 70 余位音视频专家倾情出品的 24 篇技术深度 Blog,期待给各位同仁带去一些思考和启发的同时,也能在 AI 视频元年到来的今天,一起探索、融合和推动音视频技术进步和发展。
精选集内容将围绕火山引擎视频云与抖音集团在过去一年的音视频技术实践,包括:
计算机视觉、人工智能 & 视频质量、音频技术领域等全球前沿的论文精选;
AIGC、6DoF 互动、三维重建等能力叠加的技术探索;
画质、交互、播放、性能等用户指标的体验优化;
赛事、游戏、汽车、VR 大空间等行业场景的最佳实践;
目录
一、全球前沿
Interspeech 2023
火山引擎流媒体音频技术之语音增强和 AI 音频编码
火山引擎获全国人工智能大赛 AI+ 视频质量评价冠军
CVPR 2024 满分论文
基于可变形 3D 高斯的高质量单目动态重建新方法
CVPR 2024
模块化无参视频质量评估
CVPR 2024
CAMixerSR 动态注意力分配的超分辨率加速框架
二、技术探索
和德爷一起 6DoF 互动探险火山引擎空间重建和虚实融合技术
让文物“活”起来揭秘火山引擎视频云三维重建技术
基于深度学习的超分辨率效果优化
火山引擎实时、低延时拥塞控制算法的优化实践
云上智能驾驶三维重建最佳实践
三、体验优化
如何利用播放器节省 20% 点播成本?
深度解读字节跳动的画质评估工具抖音也在用
实战超低延时直播技术的落地实践
超低延时直播技术演进之路
WebTransport 开播的应用实践之路
veImageX 演进之路:iOS 高性能图片加载 SDK
RTC 端到端视频体验优化技术实践与探索
视频时代需要一个新的“体验增长论”了
四、最佳实践
抖音世界杯的画质优化实践解析
“世界杯直播”技术实践解析:抖音视频编码器优化
抖音世界杯直播的低延迟是怎么做到的?
游戏出海,如何让全球玩家“纵享丝滑”体验?
毫末智行 & 火山引擎,迈向自动驾驶“智”高点
龙游神州:揭秘云 VR 大空间背后的技术魔法
评论