音视频(前端)
关注前端音视频研发实践、技术趋势
2024 火山引擎视频云技术大会,一起来“智启新视界”
视频时代已悄然来临。创新巡展深圳站带来重大突破,豆包大模型发布两款视频生成模型,令人瞩目的是首次实现了多主体互动。
火山引擎联合中国科学技术大学 IMCL 团队夺得 NTIRE 大赛盲压缩图像增强赛道冠军
火山引擎多媒体实验室联合中国科学技术大学智能媒体计算实验室 (IMCL) 团队在盲压缩图像恢复领域实现了突破性的进展
音视频常见问题(六):视频黑边或放大
本文介绍了视频黑边或放大的原因和解决方案。主要原因包括视频分辨率与显示视图尺寸不一致、摄像头采集、美颜滤镜格式兼容和分辨率。为了解决这些问题,开发者可以选择合适的渲染模式、动态调整分辨率、处理视频旋转和使用自定义视频渲染。
Sora 很难跟进?微调就不是一个岗位?大力出奇迹将继续适用?大模型将对软件生态带来哪些变化?
QCon 全球软件开发大会迎来全新升级,现已华丽转型为【QCon 全球软件开发大会暨智能软件开发生态展】。 2024 年 4 月 11 日至 13 日于北京国测国际会议会展中心证实召开。
《云上新视界》第七期:GPU 图像编码解码技术
进行图像解码时需要注意的一些问题。
CVPR 2024 | Modular Blind Video Quality Assessment:模块化无参视频质量评估
本文中,提出了一种模块化 BVQA 模型,以及一种训练该模型以提高其模块化性的方法。
CVPR 2024 满分论文 | Deformable 3D Gaussian: 基于可变形 3D 高斯的高质量单目动态重建新方法
《Deformable 3D Gaussians for High-Fidelity Monocular Dynamic Scene Reconstruction》已被计算机视觉顶级国际学术会议 CVPR 2024 接收。值得一提的是,该论文是首个使用变形场将 3D 高斯拓展到单目动态场景的工作,并且在公开数据集上取得了 SOTA 结果。
深度拆解:CVPR 2024 CAMixerSR 动态注意力分配的超分辨率加速框架
本文将介绍一种名为 CAMixerSR 的超分框架,可以做到内容感知,通过对 Conv 和 Self-Attention 的分配做到计算量的大幅优化。
龙游神州:揭秘云 VR 大空间背后的技术魔法
北京地坛网红打卡项目龙游神州是如何通过技术打造古老庙会与现代科技完美融合的云 VR 体验的?
实时互动行业人才生态报告 2024
RTE 开发者社区联合极客邦科技双数研究院旗下 InfoQ 研究中心,协同社区生态伙伴、业界资深从业者、学者专家等共同策划撰写和发布,报告围绕「RTE 行业特征解读」、「RTE Builder 人才画像洞察」、「RTE Builder 人才建设展望」。
《云上新视界》特别筹划:使用 FFmpeg 以及 GMAT 在 GPU 上加速视频编解码
详解如何使用 FFmpeg 的 GPU 加速能力,并分析 FFmpeg 中对 GPU 支持的不足,以及如何应用 GMAT 进行改进。
RTE2023 开幕 声网宣布首创广播级 4K 超高清实时互动体验
10 月 24 日,由声网和 RTE 开发者社区联合主办的 RTE2023 第九届实时互联网大会在北京举办,声网与众多 RTE 领域技术专家、产品精英、创业者、开发者一起,共同开启了以“智能·高清”为主题的全新探讨。
答记者问:从 PICO 视角,看 XR 行业发展
9 月 25 日 “PICO 2023 首届 XR 开发者挑战赛” 媒体启动会在北京圆满落幕,本文为现场记者问精华整理。
PICO 首届 XR 开发者挑战赛正式启动,助推行业迈入“VR+MR”新阶段
报名通道正式开启,PICO 2023 首届 XR 开发者挑战赛期待开发者加入
字节跳动智能创作 CV 技术负责人吴兴龙,确认担任 QCon 北京视频与智能创作专题出品人
智能创作如何为视频生态的繁荣而赋能?
实战:超低延时直播技术的落地实践
火山引擎《超低延时直播技术演进之路》系列文章第二篇
喜马拉雅直播秒开优化实践
喜马音频直播的秒开率达到了 90% 以上。
朱明鹏确认出席 ArchSummit 深圳,将分享《D2C & 低代码在腾讯音乐人业务中的探索实践》话题
朱明鹏将于会上分享《D2C & 低代码在腾讯音乐人业务中的探索实践》话题,详细介绍 D2C 结合低代码技术在音乐人业务中的研究和实践案例,并与大家分享在这个过程中遇到的难点和解决方案。
趣丸科技媒体算法负责人马金龙确认出席 ArchSummit 深圳
马金龙将分享《AI 多媒体技术在内容审核场景实践探索》话题,主要针对海量语音内容的审核场景提出了四维一体的多媒体审核技术和流程,通过对特定场景的分析和优化,建设性的提出了基于多模态内容识别的怒骂和炸房标签,为进一步净化语音生态提供了技术支撑。
用大模型自动做笔记、提取 PPT、整理访谈,阿里云 AI 新产品“通义听悟”开放公测
用户可免费领 100 小时转写服务。
作业帮多云多活架构的探索和实践
作业帮从创立之初就 base 在云上,享受了云计算红利的同时,也慢慢遇到了单云架构的瓶颈。
WebTransport 开播的应用实践之路
WebTransport 是如何稳定传输高质量音视频的?
腾讯 Q1 财报:重回增长曲线,并持续发力自研技术
释放技术红利,发力自研
涉及数万人、历时三年,国内最大规模的云原生实践是如何打造出来的?
腾讯云原生底座的“养成”计划
围绕「在线」,深入探讨如何打造数字时代的企业平台
今年大火的 ChatGPT、Midjourney 都以聊天为主要交互形式,如何基于「聊天」打造数字时代的企业平台?本文从数字化协同办公领域一线产品经理的视角进行分析。
抖音世界杯中 RTC 的技术挑战与实现
世界杯和 RTC 有什么样的关系,RTC 在抖音世界杯里边承担了什么样的玩法?
火山引擎视频云“再升段位”:本次发布的新产品有点儿意思!
更高清,更互动,更沉浸
腾讯披露自研芯片“沧海”最新进展
腾讯自研芯片“沧海”已经广泛应用到实际环境。
保利威敏捷开发之下的软件质量控制流程
本文讲述了保利威在不断建设完善的产品矩阵中,QA 团队是对质量是如何思考和落地的。