写点什么

RTC2018 现场速递:实时互动在线上创造了一个新世界

  • 2018-09-12
  • 本文字数:2577 字

    阅读完需:约 8 分钟

“实时互动技术正在一点一点在线上创造一个新世界!”9 月 7 日 -8 日,RTC2018 在北京召开,RTC 大会发起人之一 、声网 Agora 创始人 &CEO 赵斌在主题演讲中表示:实时互动技术正在改变很多场景中的应用形态,这种改变是颠覆式的改造,而不仅仅是锦上添花。

声网 Agora 创始人 &CEO 赵斌

从本次大会内容来看,亮点颇多。WebRTC 1.0 Feature Complete,这是行业多年发展和推动下的巨大成果和进展,本次大会请来 WebRTC 标准作者、RTC 大会发起者之一 Daniel C. Burnett 进行题为“What is next for the WebRTC standard”的主题分享;AOM 联盟发布 AV1 标准的 1.0 版、AVS 2.0 音频标准颁布对行业带来很大改变,这些也在此次大会演讲中有所体现;另外伴随 AI 和深度学习在 RTC 技术上深度融合,以及各国 5G 应用时间表的落地,更多 RTC 场景将被催生,这方面的更多技术细节和实践的分享,都是本次大会的重头戏。

提及实时互动技术对业务场景带来的颠覆式改造,赵斌列举了在线教育、直播答题、连麦小游戏、智能 AR 眼镜、金融开户双录、视频政务警务等多个场景实例。因为实时互动技术的影响和改变,很多“休闲类小游戏”、“竞技类游戏”的社交性需求都很强,实时语音技术增强了这其中的社交属性,进而提升玩家的游戏时长和用户粘性。

同时,游戏、社交、直播正在发生更大的融合,并且出现了很多新的场景,比如对战连麦小游戏、互动视频电商等独特品类。而当下火热的人工智能也可以和实时音视频结合起来,未来几年互联网实时视频传输会有十倍以上的增长,人工智能可以用来提升用户对音视频内容消费的体验。

另外,实时互动技术还能够赋能更多使用场景,这其中的一个代表就是百万人实时互动场景。这一场景不仅仅只是人数的增加,更要有全场互动的能力,包括表演者到观众的实时送达能力、观众到表演者的实时反馈能力。现在的很多互动都是不自然的,人类最自然的互动是声音、动作、表情,而不仅仅是文字、图片,这就对音视频、实时服务的要求非常高。

如果继续深入分析 RTC 快速发展的本质原因,声网国际业务负责人、COO Reggie Yativ 在他的演讲中进行了详细阐述,Reggie Yativ 认为这是因为世界已经真正迎来了移动时代的到来。到 2019 年年底,预计全球市场上将有 60 亿部智能手机,这意味着人们的沟通方式发生了显著变化,这种变化在过去五年尤为明显。

在演讲中,Reggie 把实时通信市场增长有关的一些因素都进行了阐述,我们可以归纳为一组数字:全球 CPaaS 市场总值增长至 80 亿美元;全球智能手机总量达到 60 亿部;社交媒体预计到 2019 年将拥有超过 27.7 亿名用户。

在大会第一天的主题演讲中,华为多媒体实验室首席科学家、实验室副主任王田, 西北工业大学教授陈景东,声网首席科学家钟声,分别带来了“Real-time communication from 2D to 3D”、“临境通信与智能交互中的声信号获取、处理与重构”、“实时视频通信的机会和技术挑战”的精彩演讲。

王田的演讲围绕 3D 实时通信方面的技术研究和标准,在他看来,实时动态 3D 建模技术挑战仍然很大,研究与标准工作仍然处于早期的阶段,希望通过现场演讲和演示,能让大家对这一领域新的技术方向和标准进展有更多了解。

华为多媒体实验室首席科学家、实验室副主任王田

陈景东认为,RTC 未来发展的一个明显趋势是逐渐从单一通信走向临境通信。多媒体、空间信息等技术的进一步演进将增强用户的实时通信交互体验。

钟声详细介绍和演示的深度学习 For RTC 场景令人印象深刻,他认为端到端实时传输的过程中,有许多需要进行质量优化的环节,而在未来,AI 将是我们应用其中的主要工具之一。  

声网首席科学家钟声

会议期间高峰论坛海外专场、机器学习与实时技术专场、编解码技术专场、实时互动架构设计专场、大前端实时技术专场、实时网络与质量专场、社交游戏专场精彩纷呈。

 

Twitch 首席视频架构师沈悦时表示:我们的 VP9 实时转码方案在 x264 medium 的基准上还能省超过 25% 的码率,这种压缩率的进步会使 Twitch 的运营成本有一个非常显著的下降。对于 H.264 之后的编码格式,视频界的各个领域(传统电视、IPTV、互联网视频网站等等)莫衷一是,同时国内国外的看法也大相径庭。他在演讲中详细解释 Twitch 在选择 VP9 的过程中,对于压缩效率、封装格式、播放器支持、法律风险、商业收益等各方面的考量。除此之外,还将介绍最新视频编码协议 AV1 中的新功能 SWITCH_FRAME。

AVS 视频组组长马思伟表示:音视频编解码作为 RTC 技术栈的一部分,在近两年有明显的发展,越来越多开发者认识到其重要意义。驭势科技智能驾驶运营与服务平台总监鲜余强表示:智能驾驶虽然是新兴技术领域,但对数据的处理与传输有很高的实时性要求。

对于 Google 视频压缩核心算法组软件工程师陈诚来说,AV1 在 VVC 之前率先定稿,并且比 VP9 有 30% 的压缩效率提升。这正抓住了 HEVC 推广受阻,而 VVC 尚未到来的真空期。因此 AV1 可能会在业界内得到比其上一代 VP9 更为广泛的应用。当然 AV1 在学术界还不如 HEVC,VVC 一样吸引到足够的研究兴趣, 在工业界的发展也要接受时间的检验。但是 AV1 的前景还是值得期待。

58 速运移动研发部总负责人、架构师马健的分享题目是“AR 中的模型同步”,在他看来,AR 方面的模型同步还是要依赖于 RTC 基础服务的发展水平,随着技术的进步,未来更多用户将有机会获得更沉浸的 AR 体验。

在实时互动架构设计专场,新浪微博系统开发工程师陈浩进行了题为“微博直播场景下百万并发的消息互动系统”的分享,对于百万用户直播场景下的海量高并发问题,新浪微博的核心解决思想是将大体量数据拆分,对细分单元做并行处理,将问题以大化小。

在机器学习与实时技术专场,美图技术总监赵丽丽分享了美图在短视频领域的 AI 赋能,据她介绍,一方面数据仍然是 AI 落地的核心因素,越接近业务场景,其重要性越大;另一方面,通用算法技术的作用在逐渐弱化,需要结合具体业务场景深入优化。

从 2015 年开始,声网始终坚持做 RTC 技术的布道者,连续参与主办四届 RTC 大会,坚持不以营利为目的,坚持门票几乎免费,坚持全球化技术交流,打造出全球规模最大的实时通信技术大会。除了邀请来自全球范围的 RTC 技术领袖和行业洞察者外,还希望让大家亲身感受实时互动产品给我们带来的体验变化,希望能让 RTC 技术社区中的每一位技术专家、开发者、爱好者皆有所获。

2018-09-12 03:44962
用户头像
张晓楠 InfoQ总编辑

发布了 144 篇内容, 共 102.8 次阅读, 收获喜欢 378 次。

关注

评论

发布
暂无评论
发现更多内容

精准记录:使用 Playwright 实现屏幕截图

霍格沃兹测试开发学社

9大原因分析贝莱德投资RWA赛道的ONDO 逻辑,内附

股市老人

知识付费的感想

玄兴梦影

哪些公司擅长开发类似HohoBuy的电商代购系统软件

tbapi

淘宝代购系统 Pandabuy Hohobuy

图数据库原理在构建实体血缘关系图中的应用与实践

鲸品堂

企业号 5 月 PK 榜 实体血缘

从零开始:使用 Playwright 脚本录制实现自动化测试

霍格沃兹测试开发学社

文档解析与向量化技术加速多模态大模型训练与应用

热爱编程的小白白

PrismNET棱镜协议丨安全吗?可靠吗?

PrismNET

区块链 web3 PrismNET棱镜协议 PrismNET

芯盾时代特权账号管理系统帮你填坑

芯盾时代

iam 企业安全 统一身份认证 特权账号管理

ChatGPT竟然有记忆力功能了,这对用户体验有哪些改变?

蓉蓉

openai #人工智能 ChatGPT GPT-4

探索车路云深度融合的优化与实践

观测云

人工智能

俄罗斯方块游戏编程

芯动大师

编程 俄罗斯方块游戏 51单片机

F5G-A万兆光网商用启航,挥动FTTR F50星光之翼

脑极体

光网络

解锁!智能代码助手 Baidu Comate 硬核能力

百度Geek说

编码 大模型 企业号 5 月 PK 榜 企业号2024年5月PK榜 Baidu Comate

解锁弹框:Python 下的 Playwright 弹框处理完全指南

霍格沃兹测试开发学社

浅谈设计模式

Ethan

Java 设计模式

Python函数与模块的精髓与高级特性

华为云开发者联盟

Python 华为云 函数 华为云开发者联盟 企业号2024年5月PK榜

JDBC连接openGauss6.0和PostgreSQL16.2性能对比

华为云开发者联盟

数据库 JDBC 华为云 华为云开发者联盟 企业号2024年5月PK榜

hoobuy淘宝代购系统 VS Pandabuy淘宝代购系统哪些软件公司可以开发

tbapi

淘宝代购系统 Pandabuy 淘宝代购集运 Hohobuy

RTC2018现场速递:实时互动在线上创造了一个新世界_语言 & 开发_张晓楠_InfoQ精选文章