写点什么

实时互动场景应用指数级增长,背后的 RTC 技术发展到哪里了?

  • 2018-09-12
  • 本文字数:2284 字

    阅读完需:约 7 分钟

随着 5G 的逐步落地,几乎每个人都相信,随时可用、高清、流畅的音视频通话即将到来。同时,我们看到,实时互动技术催生的“爆款”、风口和实用场景增长迅猛,比如之前的狼人杀、视频社交、互动连麦直播,过去一年还有在线抓娃娃、HQ 直播答题、连麦小游戏,同时还有金融、可穿戴、机器人、电商等行业应用场景。

但是,你知道这背后实时互动技术到底发展到了什么阶段,正在攻克哪些技术上的难关呢? 从音视频角度来看,决定音视频通话质量的,一个是网络,另一个是编解码。本文将从这两个角度对技术发展趋势进行详细剖析和解读,并将对实时互动技术催生的创新场景角度进行介绍。

软件定义网络提升跨网实时传输质量

网络面临的主要问题一个是基础建设,另一个是跨网通信,带宽提升、5G 落地可以帮我们解决基础设施建设的问题,但跨网通信仍然是一个问题。

这里的跨网通信障碍在行业人士眼里指的是“四跨”,是指跨国、跨运营商、跨地域、跨时段的网络传输质量存在波动的问题。互联网从业者则提出一种覆盖网络(overlay network)技术来解决这个问题,其最重要的实现就是 VoIP。近年来,随着直播的火热,实时音视频对网络低延迟的要求又提升了一个层次,随之而来的是 SD-RTN™解决方案,它通过 SDN+UDP 技术,能够显著的降低延迟,减少丢包,进而改善通信质量。这方面最新的进展则是融合 SD-RTN™,以共享方式搭建 SD-RTN™,可以降低建设 SD-RTN™的成本。

声网的 SD-RTN™就是当前最新实时网络技术的一个代表,从官网的性能测试数据可以看到,它在跨国、跨洲等情况下比传统 P2P 网络延迟降低了 50% 左右。

下一代编解码标准仍处战国时代

在编解码方面,我们请教了声网 Agora 首席科学家钟声老师,他分别在美国博通公司、海信集团芯片公司、声网公司等主要从事图像处理、图像压缩、模式识别和计算机视觉算法以及芯片架构设计的研究,在美国和中国拥有多项专利,并且曾是标准组织 MPEG/JVT (H.264) 与 INCITS 主要成员,可以说是编解码方面的权威。

今年上半年,在音视频编解码领域发生了一件大事,就是 AOM 联盟发布了 AV1 标准的 1.0 版,其执行董事兼创始董事会成员 Gabe Frost 表示,桌面浏览器会在今年就开始支持 AV1,到 2020 年几乎所有新型硬件都会支持 AV1. 这对 HEVC/H.265 编解码形成了强劲的挑战。

钟声表示,AV1 视频编码比 H.265 标准能够进一步降低 30% 左右的码率,但其编码复杂性也高出几十倍甚至更多。可以预测其会先在 on-demand 的视频收看中应用,比如 NetFlix、Youtube、Amazon 等可能最先推出 AV1 格式的高清、超高清电影,而且接收端也要有相应的芯片解码支持。AV1 在 RTC 中的应用也会依赖于芯片对 AV1 编解码的支持,尤其是高效的编码器复杂度较高。NetFlix、Youtube、Amazon、Apple 等公司的大力推进很可能会促使芯片公司也加快其主流手机、电视、PC 机芯片对 AV1 编解码的支持。

下一代的编解码标准仍然处在战国时代,其中大部分标准首要考虑的就是对 RTC 流媒体播放的支持,特别是抗丢包的支持。钟声介绍说,声网也自研了新一代音频编码算法 Agora SOLO™,主要是为了增强在实时互联网上传输音频信号时对网络丢包的对抗能力而设计的。公共互联网通常会因传输线路拥堵、延时过大等原因导致数据丢失,SOLO™的音频压缩编码算法是针对网络的这个特性来设计的。他们测试的结果表明其能达到对抗 70% 的抗丢包率。适用基于互联网的实时音视频通信、直播等应用。

RTC 快速发展的本质是实时互动需求逐渐强烈

将网络和编解码、音视频采集等等整合起来的代表技术就是 WebRTC,近年来,随着实时互动需求和技术的发展,RTC 成为 WebRTC 技术的延伸和补充。RTC 在网络、编解码和音视频采集领域都有重要的技术突破。另外,上半年斯坦福大学的实验室还发布了将网络和编解码整合起来的新一代通信技术 Satisfy,在这方面未来我们仍然有提升的空间。

在声网 Agora 创始人 &CEO 赵斌看来,RTC 技术快速发展的本质是人类对“实时”与“互动”的需求逐渐强烈。伴随着多个垂直领域的场景创新和深度应用,RTC 将成为全球最受关注的实用技术之一。RTC 已经在很多行业领域持续输出爆款,比如直播、社交、游戏、教育等,以社交为例,声网支撑了全球 80% 的社交直播平台。对于 RTC 技术催生的各类应用场景的发展情况,赵斌也进行了介绍。

“吃鸡”的语音对讲到直播连麦、直播答题组队开黑,狼人杀,再到最近有望成为风口的后狼人杀产品“剧本杀”,都是已经被市场印证过的实时通信的应用场景。“休闲类小游戏”、“竞技类游戏”的社交性需求都很强,需要实时语音增强社交属性,进而提升玩家的游戏时长和用户粘性。

同时,游戏、社交、直播正在发生更大的融合,并且出现了很多新的场景,比如对战连麦小游戏、互动视频电商等独特品类。

而当下火热的人工智能也可以和实时音视频结合起来,未来几年互联网实时视频传输会有十倍以上的增长,人工智能可以用来提升用户对音视频内容消费的体验。机器学习如何有效地帮助达到极低延时、极高流畅度、极高画质以及高效的运维服务值得深入的研究。这也是声网目前最关注的研究方向。

结束语

2018 RTC 实时互联网大会即将开始,据赵斌介绍,此次大会上会公布 RTC 和 AI 结合的一些技术进步,也会在编解码方面有更多的技术上的突破。如果你想了解以上技术细节,还想了解更多嘉宾精彩分享,快来点击阅读原文或者扫描下方二维码预定专属大会门票,您将会听到来自 Google、声网、WebRTC、Twitch、新浪微博、华为、腾讯、Cocos、陌陌、花椒直播、VIPKID、Bilibili、沪江、招商银行等知名互联网公司的技术领袖、音视频技术大咖、产品创新专家,以及来自亚洲各地区的 2500 名开发者,将共同与您交流分享。

2018-09-12 08:221268
用户头像
张晓楠 InfoQ总编辑

发布了 144 篇内容, 共 99.7 次阅读, 收获喜欢 378 次。

关注

评论

发布
暂无评论
发现更多内容

2021年阿里巴巴面试参考指南泰山版开源(Java版)

Java架构追梦

Java 架构 面试 分布式 微服务

Spark 扫描 HDFS lzo/gz/orc异常压缩文件

kwang

大数据 spark hdfs

又双叕更新,开源网络插件Kube-OVN 1.4.0 版发布!支持跨集群容器网络、NetworkPolicy 日志

York

灵雀云 Kubernetes k8s Kube-OVN

电商后链路如何做好私域运营?

Linkflow

客户数据平台 CDP 客户画像

性能压测工具-JAVA

区块链挖矿软件系统开发|区块链挖矿APP开发

系统开发

当我们谈论云原生网络时,Kube-OVN 究竟能带来什么?(下)|视频回顾

York

灵雀云 Kubernetes k8s Kube-OVN

MDF智能合约系统开发技术

薇電13242772558

智能合约 dapp

2021年的28天写作,从微信视频号开始

赵新龙

法庭上的CTO 28天写作

20 行代码:Serverless 架构下用 Python 轻松搞定图像分类和预测

Serverless Devs

Python 人工智能 Serverless 云原生

【架构中的物联网】影子机制

soolaugust

架构 物联网 28天写作

TCP波场拼智能合约系统开发技术

薇電13242772558

智能合约 dapp

视频课程|Kube-OVN 入门与应用实战 (第4期)

York

灵雀云 Kubernetes k8s Kube-OVN

@Repeatable注解作用

张健

OVS 设计与实现阅读笔记,五年前的这篇论文里这些问题已经明了

York

Kubernetes k8s Kube-OVN

容器网络方案调研:都是网络插件,Kube-OVN凭啥脱颖而出?

York

灵雀云 Kubernetes k8s Kube-OVN

微信沟通小技巧

熊斌

远程办公 职场成长 远程协作 28天写作

视频课程|Kube-OVN 入门与应用实战 (第2期)

York

灵雀云 Kubernetes k8s Kube-OVN

即时通讯是怎么做到的?

v16629866266

架构师训练营第 1 期 -大作业2

习习

架构师训练营第 1 期 - 大作业 1

习习

代码整洁之道

田维常

代码

“58同城”架构师分享:联盟广告平台架构及实践

Java架构师迁哥

视频课程|Kube-OVN 入门与应用实战 (第1期)

York

灵雀云 Kubernetes k8s Kube-OVN

区块链多币种钱包系统软件开发|区块链多币种钱包APP开发

系统开发

视频课程|Kube-OVN 入门与应用实战 (第3期)

York

灵雀云 Kubernetes k8s Kube-OVN

DeFi去中心化金融借贷系统开发有哪些需要了解的?

W13902449729

defi 去中心化金融借贷系统开发

剖析JDK:强引用、软引用、弱引用、虚引用有何区别?

后台技术汇

28天写作

Spring Cloud(零)《总有一偏概述告诉你SpringCloud是什么》

小傅哥

小傅哥 springboot 28天写作

28 天写作营 Day 1--120%的技术人员体系

张老蔫

28天写作

面向开发者的播客清单

LeanCloud

程序员 开发者 苹果 私有云 播客

实时互动场景应用指数级增长,背后的RTC技术发展到哪里了?_语言 & 开发_张晓楠_InfoQ精选文章