“实时互动技术正在一点一点在线上创造一个新世界!”9 月 7 日 -8 日,RTC2018 在北京召开,RTC 大会发起人之一 、声网 Agora 创始人 &CEO 赵斌在主题演讲中表示:实时互动技术正在改变很多场景中的应用形态,这种改变是颠覆式的改造,而不仅仅是锦上添花。
声网 Agora 创始人 &CEO 赵斌
从本次大会内容来看,亮点颇多。WebRTC 1.0 Feature Complete,这是行业多年发展和推动下的巨大成果和进展,本次大会请来 WebRTC 标准作者、RTC 大会发起者之一 Daniel C. Burnett 进行题为“What is next for the WebRTC standard”的主题分享;AOM 联盟发布 AV1 标准的 1.0 版、AVS 2.0 音频标准颁布对行业带来很大改变,这些也在此次大会演讲中有所体现;另外伴随 AI 和深度学习在 RTC 技术上深度融合,以及各国 5G 应用时间表的落地,更多 RTC 场景将被催生,这方面的更多技术细节和实践的分享,都是本次大会的重头戏。
提及实时互动技术对业务场景带来的颠覆式改造,赵斌列举了在线教育、直播答题、连麦小游戏、智能 AR 眼镜、金融开户双录、视频政务警务等多个场景实例。因为实时互动技术的影响和改变,很多“休闲类小游戏”、“竞技类游戏”的社交性需求都很强,实时语音技术增强了这其中的社交属性,进而提升玩家的游戏时长和用户粘性。
同时,游戏、社交、直播正在发生更大的融合,并且出现了很多新的场景,比如对战连麦小游戏、互动视频电商等独特品类。而当下火热的人工智能也可以和实时音视频结合起来,未来几年互联网实时视频传输会有十倍以上的增长,人工智能可以用来提升用户对音视频内容消费的体验。
另外,实时互动技术还能够赋能更多使用场景,这其中的一个代表就是百万人实时互动场景。这一场景不仅仅只是人数的增加,更要有全场互动的能力,包括表演者到观众的实时送达能力、观众到表演者的实时反馈能力。现在的很多互动都是不自然的,人类最自然的互动是声音、动作、表情,而不仅仅是文字、图片,这就对音视频、实时服务的要求非常高。
如果继续深入分析 RTC 快速发展的本质原因,声网国际业务负责人、COO Reggie Yativ 在他的演讲中进行了详细阐述,Reggie Yativ 认为这是因为世界已经真正迎来了移动时代的到来。到 2019 年年底,预计全球市场上将有 60 亿部智能手机,这意味着人们的沟通方式发生了显著变化,这种变化在过去五年尤为明显。
在演讲中,Reggie 把实时通信市场增长有关的一些因素都进行了阐述,我们可以归纳为一组数字:全球 CPaaS 市场总值增长至 80 亿美元;全球智能手机总量达到 60 亿部;社交媒体预计到 2019 年将拥有超过 27.7 亿名用户。
在大会第一天的主题演讲中,华为多媒体实验室首席科学家、实验室副主任王田, 西北工业大学教授陈景东,声网首席科学家钟声,分别带来了“Real-time communication from 2D to 3D”、“临境通信与智能交互中的声信号获取、处理与重构”、“实时视频通信的机会和技术挑战”的精彩演讲。
王田的演讲围绕 3D 实时通信方面的技术研究和标准,在他看来,实时动态 3D 建模技术挑战仍然很大,研究与标准工作仍然处于早期的阶段,希望通过现场演讲和演示,能让大家对这一领域新的技术方向和标准进展有更多了解。
华为多媒体实验室首席科学家、实验室副主任王田
陈景东认为,RTC 未来发展的一个明显趋势是逐渐从单一通信走向临境通信。多媒体、空间信息等技术的进一步演进将增强用户的实时通信交互体验。
钟声详细介绍和演示的深度学习 For RTC 场景令人印象深刻,他认为端到端实时传输的过程中,有许多需要进行质量优化的环节,而在未来,AI 将是我们应用其中的主要工具之一。
声网首席科学家钟声
会议期间高峰论坛海外专场、机器学习与实时技术专场、编解码技术专场、实时互动架构设计专场、大前端实时技术专场、实时网络与质量专场、社交游戏专场精彩纷呈。
Twitch 首席视频架构师沈悦时表示:我们的 VP9 实时转码方案在 x264 medium 的基准上还能省超过 25% 的码率,这种压缩率的进步会使 Twitch 的运营成本有一个非常显著的下降。对于 H.264 之后的编码格式,视频界的各个领域(传统电视、IPTV、互联网视频网站等等)莫衷一是,同时国内国外的看法也大相径庭。他在演讲中详细解释 Twitch 在选择 VP9 的过程中,对于压缩效率、封装格式、播放器支持、法律风险、商业收益等各方面的考量。除此之外,还将介绍最新视频编码协议 AV1 中的新功能 SWITCH_FRAME。
AVS 视频组组长马思伟表示:音视频编解码作为 RTC 技术栈的一部分,在近两年有明显的发展,越来越多开发者认识到其重要意义。驭势科技智能驾驶运营与服务平台总监鲜余强表示:智能驾驶虽然是新兴技术领域,但对数据的处理与传输有很高的实时性要求。
对于 Google 视频压缩核心算法组软件工程师陈诚来说,AV1 在 VVC 之前率先定稿,并且比 VP9 有 30% 的压缩效率提升。这正抓住了 HEVC 推广受阻,而 VVC 尚未到来的真空期。因此 AV1 可能会在业界内得到比其上一代 VP9 更为广泛的应用。当然 AV1 在学术界还不如 HEVC,VVC 一样吸引到足够的研究兴趣, 在工业界的发展也要接受时间的检验。但是 AV1 的前景还是值得期待。
58 速运移动研发部总负责人、架构师马健的分享题目是“AR 中的模型同步”,在他看来,AR 方面的模型同步还是要依赖于 RTC 基础服务的发展水平,随着技术的进步,未来更多用户将有机会获得更沉浸的 AR 体验。
在实时互动架构设计专场,新浪微博系统开发工程师陈浩进行了题为“微博直播场景下百万并发的消息互动系统”的分享,对于百万用户直播场景下的海量高并发问题,新浪微博的核心解决思想是将大体量数据拆分,对细分单元做并行处理,将问题以大化小。
在机器学习与实时技术专场,美图技术总监赵丽丽分享了美图在短视频领域的 AI 赋能,据她介绍,一方面数据仍然是 AI 落地的核心因素,越接近业务场景,其重要性越大;另一方面,通用算法技术的作用在逐渐弱化,需要结合具体业务场景深入优化。
从 2015 年开始,声网始终坚持做 RTC 技术的布道者,连续参与主办四届 RTC 大会,坚持不以营利为目的,坚持门票几乎免费,坚持全球化技术交流,打造出全球规模最大的实时通信技术大会。除了邀请来自全球范围的 RTC 技术领袖和行业洞察者外,还希望让大家亲身感受实时互动产品给我们带来的体验变化,希望能让 RTC 技术社区中的每一位技术专家、开发者、爱好者皆有所获。
评论