

 写点什么

音视频（后端）

 关注

收录了音视频（后端）频道下的 1164 篇内容
关注后端音视频研发实践、技术趋势

上海交通大学 AI 学院副教授赵波将在 AICon 上海分享大模型在长视频理解中的前沿进展

系统解析长视频理解大模型的技术挑战与创新突破。

作者 : AICon 全球人工智能开发与应用大会

2025-04-21

6651

RTE 与 AI 共舞：Voice Agent 点燃生态新引擎

本篇文章围绕 RTE 与 AI 生态融合下的用户新体验，Voice Agent 的新生态展开描述，并在结尾提出五大问题以供读者思考。

作者 : 崔白洁 | InfoQ研究中心

2025-01-15

6694

RTE 和 AI 融合生态洞察报告 2024

本报告专注于探索如何利用实时互动技术与 AI 相结合来提升用户体验，以及社区是如何帮助 Voice Agent 生态建设和发展的。

作者 : 崔白洁 | InfoQ研究中心

2025-01-14

8290

百度视频搜索架构演进

随着信息技术的迅猛发展，搜索引擎作为人们获取信息的主要途径，其背后的技术架构也在不断演进。本文详细阐述了近年来视频搜索排序框架的重大变革，特别是在大模型技术需求驱动下，如何从传统的多阶段级联框架逐步演变为更加高效、灵活的端到端排序框架。

百度Geek说

2025-01-09

11938

第十届 RTE 大会开幕，探讨生成式 AI 时代 RTE 的发展与进化

第十届实时互联网大会在北京正式开幕，InfoQ 作为本次大会的社区伙伴。AI、空间计算等 20+ 行业及技术分论坛。

作者 : RTE开发者社区

2024-10-26

8384

字节跳动基于 TrafficRoute DNS 的超千亿级调度解析优化实践

本文介绍了火山引擎 TRDNS 在泛 CDN 场景中的实践经验和优化措施。内容从能力出发，详细介绍了遇到的挑战、TRDNS 的优化措施、取得的效果。

作者 : 火山引擎

2024-07-08

7170

抖音 Android 端图片优化实践

本文介绍抖音 Android 端通过使用 BDFresco 图片框架进行图片优化的实践、经验和价值，分享问题和解决策略，旨在为同行提供参考。

抖音客户端架构和火山引擎veImageX团队策划: 鲁冬雪

2024-06-07

11936

在 Windows 下玩转多媒体处理框架 BMF

Babit Multimedia Framework（BMF 框架）是一个由火山引擎视频云与 NVIDIA 共同开源的跨语言、跨设备、跨系统的多媒体处理框架，旨在为 Windows 平台提供高效、稳定的多媒体处理能力，支持模块自定义开发，已在字节跳动内部服务于抖音直播伴侣业务，实现算法与业务的解耦，并通过 DirectX 在 Windows 端展示其兼容性和功能适配能力。

火山引擎视频云陶柏杨策划: 鲁冬雪

2024-05-07

7275

火山引擎国际深度学习图像压缩挑战赛蝉联冠军

第六届深度学习图像压缩挑战赛，比赛结果公布，由火山引擎多媒体实验室与北大组成的联合参赛平台 b-2 在高码率视频压缩和低码率视频压缩两个赛道均夺得主客观指标冠军

火山引擎多媒体实验室策划: 鲁冬雪

2024-03-29

4752

CVPR 2024 | Modular Blind Video Quality Assessment：模块化无参视频质量评估

本文中，提出了一种模块化 BVQA 模型，以及一种训练该模型以提高其模块化性的方法。

火山引擎多媒体实验室策划: 鲁冬雪

2024-03-06

9219

CVPR 2024 满分论文 | Deformable 3D Gaussian: 基于可变形 3D 高斯的高质量单目动态重建新方法

《Deformable 3D Gaussians for High-Fidelity Monocular Dynamic Scene Reconstruction》已被计算机视觉顶级国际学术会议 CVPR 2024 接收。值得一提的是，该论文是首个使用变形场将 3D 高斯拓展到单目动态场景的工作，并且在公开数据集上取得了 SOTA 结果。

火山引擎多媒体实验室策划: 鲁冬雪

2024-03-06

12108