火山引擎视频云,基于字节跳动音视频技术沉淀,致力于打造面向体验的视频云,帮助企业端到端提升视频能力,实现播放体验、画质体验、交互体验、性能体验的全面提升与创新。
本专栏将围绕画质、交互、播放等用户体验核心关键点,介绍核心技术与方案,分享火山引擎视频云与字节跳动音视频技术的最佳实践。
随着人工智能时代的到来,儿歌点点正积极致力于探索 AI 技术与儿童启蒙的融合之道,旨在为孩子们提供更加个性化且丰富的内容资源以及更加多元有趣的互动体验。
技术的成熟,叠加应用的爆发,AI 视频的战争,正迎来市场化为导向的下半场。
近日,第 2024 届 ECCV 联合举办的 AIM Workshop 大赛公布比赛结果,在视频显著性预测赛道上,火山引擎多媒体实验室凭借自研的显著性检测算法获得冠军
近日,第 2024 届 ECCV 联合举办的 AIM Workshop 大赛公布比赛结果,在视频超分辨率质量评估赛道上,火山引擎多媒体实验室凭借基于大模型的画质评估算法获得冠军,技术能力达到行业领先水平。
火山引擎多媒体实验室联合中国科学技术大学智能媒体计算实验室 (IMCL) 团队在盲压缩图像恢复领域实现了突破性的进展
本文介绍抖音 Android 端通过使用 BDFresco 图片框架进行图片优化的实践、经验和价值,分享问题和解决策略,旨在为同行提供参考。
Babit Multimedia Framework(BMF 框架)是一个由火山引擎视频云与 NVIDIA 共同开源的跨语言、跨设备、跨系统的多媒体处理框架,旨在为 Windows 平台提供高效、稳定的多媒体处理能力,支持模块自定义开发,已在字节跳动内部服务于抖音直播伴侣业务,实现算法与业务的解耦,并通过 DirectX 在 Windows 端展示其兼容性和功能适配能力。
火山引擎视频云于 AI 视频元年(2024 年)重磅推出《火山引擎视频云实践精选集》 2023 版,收录 24 篇精选 Blog,助力音视频技术进步与发展。
第六届深度学习图像压缩挑战赛,比赛结果公布,由火山引擎多媒体实验室与北大组成的联合参赛平台 b-2 在高码率视频压缩和低码率视频压缩两个赛道均夺得主客观指标冠军
《Deformable 3D Gaussians for High-Fidelity Monocular Dynamic Scene Reconstruction》已被计算机视觉顶级国际学术会议 CVPR 2024 接收。值得一提的是,该论文是首个使用变形场将 3D 高斯拓展到单目动态场景的工作,并且在公开数据集上取得了 SOTA 结果。
本文中,提出了一种模块化 BVQA 模型,以及一种训练该模型以提高其模块化性的方法。
本文将介绍一种名为 CAMixerSR 的超分框架,可以做到内容感知,通过对 Conv 和 Self-Attention 的分配做到计算量的大幅优化。
北京地坛网红打卡项目龙游神州是如何通过技术打造古老庙会与现代科技完美融合的云 VR 体验的?
《跟着德爷闯东非》实现的是全新的 VR 空间互动。
实践证明,通过播放器的优化可以为点播业务节省 20% 甚至更多的成。
IDC 数据预测,到 2025 年整个视频投向数据总量将达到 72.7%,这个趋势可能带来两个较大挑战。
从抖音集团内部画质评估体系的建设历程着笔,主要分享画质评测对于业务的重要性、主要应用场景和内部产品的一些典型实践。
火山引擎《超低延时直播技术演进之路》系列文章第二篇
探索超低延时直播技术的演进历程,揭示背后的挑战和突破,以及对未来直播行业的影响。
走近技术前沿
WebTransport 是如何稳定传输高质量音视频的?
本文主要介绍 iOS 客户端图片加载 SDK,包括图片网络加载、图像解码、图片基础处理与变换以及图片服务质量监控上报等能力。
更高清,更互动,更沉浸
超分辨率,是一种提高图像、影片分辨率的技术。
随着 5G 网络和具有更强视频拍摄和图形处理能力的智能手机推广, 360 视频应用的质量将得到很大改进,而且低延迟的实时交互式 360 视频应用服务成为可能。
本文提出了一种低成本且易用的六自由度全景视频技术。
如何提高用 golang 实现的基于 UDP 的传输协议的性能
本文主要介绍火山引擎多媒体实验室在世界杯期间画质的相关工作。
抖音实现了业界首次的世界杯比赛支持 4K HDR 10-bit 直播,其内容信息量相较于以往有极大提升,对编码器的实时性提出了更高要求。
世界杯期间,抖音直播提供的 4K 超高清超低延迟看播能力给亿万观众留下了深刻的印象
火山引擎视频云的技术实践分享
实时音视频技术在抖音上的深度磨砺
火山引擎 RTC 基于亿级 DAU 用户的真实反馈和 RTC 全链路质量监测数据,通过长期、大规模的数据分析、归因、验证,建立了一套“标准透明、度量准确、归因全面、预测可靠”的指标体系
视频会议对 RTC 有什么新挑战?
字节跳动旗下 To B 业务「火山引擎」对外开放了视频点播服务。
字节跳动 AVG (先进视频团队)在 2021 年发起了一项视频压缩的技术提案,该提案能够在优化压缩质量的同时,节约至少 13% 的存储和带宽。
视频压缩的核心在于去除视频信号中的冗余信息,而其中对于空域冗余的去除通常使用帧内预测的方式来实现。
视频已经在人们的日常工作和生活中无处不在,并且正逐步替代文字成为人们获得知识和资讯的最重要方式。
「零首帧」并不是真的 0 毫秒启播,而是用户几乎感知不到有首帧时间的存在。
火山引擎 RTC 负责人宋慎义从实时性、富媒体传输、多人互动、全球化、RTC 与其他模块协同 5 个方面,详细阐述了火山引擎 RTC 的技术实践。
压缩技术对于图像、视频应用十分重要。
详细解读字节跳动背后的图像技术。
字节跳动图像处理实践。
veImageX 图片系统的演进贯穿在字节跳动发展的过程中,在不同时期以不同的形式解决图片分发的各类问题,最终“生长”成为图片中台。
码率控制技术是实际视频编码器中一个非常重要的技术模块。
一篇硬核干货
更高的色深、更广的动态范围和更强的色彩表现力。
火山引擎 RTC 脱胎于字节跳动自研的 RTC 技术中台。目前,字节跳动旗下约 40+ 业务产品都由此技术中台提供底层 RTC 服务,其中不乏抖音这样亿级 DAU 的国民应用。
火山引擎视频中台支撑了火山引擎视频相关的 toB 业务,同时也支持了字节跳动抖音、西瓜视频等产品的视频生产、下发、播放等全部视频周期。本文主要向大家全面介绍我们的视频处理系统以及在高可用性方面做的一些工作。
一篇深度技术论文
作为 HEVC 的继任者, H.266/VVC 能够在相同的质量下将压缩效率再提升一倍。 H.266/VVC 标准的推动将能为未来视频内容的发展提供巨大的潜力。
基于深度学习的编码工具方兴未艾,其展现诱人性能的同时,亦引起较高的复杂度。
字节跳动火山引擎 - 多媒体实验室团队获得了 ICME 21 Best Grand Challenge Winner Team。
VVC 使用了大量的新技术,如多叉树块划分技术、历史运动矢量预测技术、亮度色度线性模型预测技术等。本文将重点介绍 VVC 中的仿射运动模型技术。
字节跳动技术团队的一篇技术干货分享
本文将剥去云游戏的各种产品外衣,对云游戏技术的演进历史,面临的挑战,和未来的优化方向进行一个梳理和汇总。
7 月 26 日消息,在多媒体领域世界顶级学术会议 ICME 2021 的「压缩 UGC 视频质量评估」比赛中,字节跳动旗下火山引擎多媒体实验室组成的“QA-FTE”队伍,凭借自研的 VQScore 算法,拿下了该比赛「无参考视频质量评价(NR-VQA)MOS 赛道」的第一名。