腾讯多媒体实验室：信号处理×深度学习，语音通信新技术的研发实践_云计算_云加社区_InfoQ精选文章

高品质的音视频能力是怎样的？ | Qcon 全球软件开发大会·上海站邀请函了解详情 



 写点什么

登录/注册

腾讯多媒体实验室：信号处理×深度学习，语音通信新技术的研发实践

随着 5G 时代的正式到来，又一次产业革命大潮正在悄然而至，人工智能、物联网 loT、云计算、5G 等前沿技术出现在大众视野。11 月 6 日-7 日，Techo 开发者大会在北京举行，在音视频及通信专场上，腾讯多媒体实验室专家研究员肖玮带来以“信号处理遇见深度学习，语音通信新技术的研发实践”为主题的演讲，从语音通信面临的挑战，以及智慧语音通信技术的发展两方面介绍深度学习为语音通信带来的创新。

（腾讯多媒体实验室专家研究员肖玮）

Techo 开发者大会由腾讯云发起，汇聚全球顶尖行业专家和技术爱好者，通过一场主论坛、18 个技术方向分论坛和多场创新互动活动，为全球开发者搭建一个开放、中立、活跃的技术平台，助力于开发者的能力成长和实践创新。本届大会聚集来自全球 5000 多位开发者，并邀请超 150 位业界大咖围绕前沿技术发展进行分享和交流。

作为多媒体技术的重要组成部分，语音通信扮演着非常重要的角色，而语音通信体验则成为了打造沉浸式多媒体体验的关键一步。

相较于模拟信号时代的语音通信，数字信号时代的语音通信在流程上要复杂许多。“从技术层面出发，语音通信主要存在三个技术挑战。”据肖玮介绍，其一，信源层面上，如何获得近似无噪声、无回声、无混响的声音信号源？其二，传输链路层面上，如何兼容不同的的压缩与传输标准，并确保传输稳定？其三，工程化层面上，如何确保功能模块在维持低复杂度的同时，做到更优秀的性能及低时延？这三项挑战成为摆在语音通信技术面前的“三座大山”。

看似简单的数字语音通信，其实存在着众多需要解决的问题以及复杂的流程，想要打造一套具备普适性的语音通信系统，自然少不了深度学习的助力。

肖玮介绍，多媒体实验室将深度学习应用于信号处理过程中，一方面，基于深度学习，对瞬态等非平稳噪声形成有效抑制，实现语音增强；另一方面，结合经典信号处理和深度学习设计了音频超分技术，前向兼容现有协议前提上，提升信号的分辨率，将窄带语音输入腾讯云，补足窄带语音所丢失的部分，提升回放内容质量。同时，轻量级设计方法，能够保证模型小，可以在云端（支持大并发）或者终端（低功耗）部署。

此外，由于信号传输过程中可能出现的衰减等问题，在转码的过程中很容易出现转码失真的情况，影响音频回放的质量。为了解决这一问题，打造了一套盲式下行后处理技术。该技术兼容包括 ITU-T G.711 在内的各种标准协议，并且可以与音频超分协同；无需修改现有的通信协议，可降低转码失真，同时具备便于部署的轻量级建模的特性。

“借助深度学习，我们打通了从上行到传输再到下行的完整链路，这一系列技术不仅性能强大，同时又具备着轻建模，易部署的特性，能够广泛应用于基于数字信号传播的语音通话中。”肖玮表示，基于深度学习手段，腾讯多媒体实验室将语音信号处理与人工智能技术进行深入结合，打造出端到端的智慧语音通信解决方案，实现自然的人与人之间的交流。

作为腾讯旗下顶尖的音视频通信和处理研发团队，腾讯多媒体实验室在标准制定方面已经取得了令人瞩目的成绩，有近 50 项提案被下一代视频编码标准 VVC/H.266 采纳。此外，在虚拟现实（VR）、点云（PCC）、网络传输协议（DASH）、多媒体系统（OMAF、CMAF、NBMP）等相关多媒体标准中也取得了突破性进展，获得多项标准核心专利。

在 5G 浪潮下，多媒体的技术和形式不断发生改变，高效率低延迟的传输，带来了更丰富的落地场景，让 8K、VR、AI 更加触手可及。腾讯多媒体实验室也开始在沉浸式媒体和泛媒体方向发力，目前，多媒体实验室已经产出了相应的 SDK（软件开发工具包）供文旅以及教育行业使用，未来将会在融媒体、新媒体等更多更丰富的场景落地，为用户带来极具 5G 时代色彩的沉浸式体验。

提升语音通信的质量只是智慧语音通信的一个侧面，它能够实现的功能则远不止于此。肖玮表示，随着智慧语音通信技术的进一步发展，未来，腾讯多媒体实验室也将持续进行技术创新，让沉浸式音视频体验更加触手可及。

评论

发布

暂无评论

2020阿里P8单写给Android程序员的建议：这样的offer不能要啊!注意避坑

android 程序员移动开发

模块二作业及总结

架构训练营

2020年8月30写篇文章，记录我的字节跳动客户端面试之旅！

android 程序员移动开发

2020我的坑爹Android面试经历，（百度，android路由器

android 程序员移动开发

2020最新中高阶Android面试题总结-下（附解题思路），androidwifi开发框架

android 程序员移动开发

2020年度整理国内一线互联网公司内部Android面试题库，androidstudio开发项目

android 程序员移动开发

2020年的大厂末班车！啃完这些资料，我拿到了字节跳动Android高级开发工程师的offer

android 程序员移动开发

架构训练营 - 模块二作业

架构训练营架构实战营

2020年Android高级面试题总结（附答案解析），面试突击版

android 程序员移动开发

2020最新Android大厂高频面试题解析大全(BAT TMD JD 小米)

android 程序员移动开发

2021字节跳动，金三银四内幕Android中高级面试题合集-令人细思极恐！

android 程序员移动开发

2020年中总结之----怎么挤进一线大厂？非软文！，2021Android面试心得

android 程序员移动开发

模块二作业：微信朋友圈复杂度分析

架构实战营

2021了，为什么说音视频技术是技术风口？Android音视频开发这么吃香

android 程序员移动开发

2021 年 9 月美团 Android 面试总结，flutter屏幕旋转监听

android 程序员移动开发

[ CloudWeGo 微服务实践 - 04 ] 尝试操作数据(2)

golang 11月日更

2020适合中高级工程师的面试题——java基础，移动网页开发框架

android 程序员移动开发

2021年Android开发的前景如何？，安卓面试题及答案

android 程序员移动开发

2021年3月份Android 面经总结！（OPPO和腾讯等大厂，android底层开发百度网盘

android 程序员移动开发

2020年Android开发年终总结之如何挤进一线大厂？(1)，如何成为杰出的程序员

android 程序员移动开发

2020年，Android技术人如何实现自我成长？，带你碾压面试官

android 程序员移动开发

2020应届毕业生，Android春招总结，已入职小米，深入解析android核心组件和应用框架

android 程序员移动开发

2020最新Android大厂面试真题大全（附答案），移动应用开发的前景

android 程序员移动开发

2020最新Android大厂高频面试题解析大全(BAT TMD JD 小米)(1)

android 程序员移动开发

2020这一年的Android面经汇总(百度、腾讯、滴滴，职场中的中年危机

android 程序员移动开发

2020非科班生的Android秋招，金九银十求职经历（快手，android游戏开发实践指南

android 程序员移动开发

2021Android性能优化总结最新、最全面、最完整的资料，大厂内部资料

android 程序员移动开发

2020年Android开发年终总结之如何挤进一线大厂？，android界面开发实验报告

android 程序员移动开发

2020年中总结之----怎么挤进一线大厂？非软文！(1)，Android面试题整理

android 程序员移动开发

2020年末知识大总结：Java程序员转Android开发必读经验一份

android 程序员移动开发

2020我的-Android-年中面试复盘：怎么挤进一线大厂？需要掌握些什么

android 程序员移动开发