写点什么

RTE2023 开幕 声网宣布首创广播级 4K 超高清实时互动体验

声网

  • 2023-10-25
    北京
  • 本文字数:3254 字

    阅读完需:约 11 分钟

RTE2023开幕 声网宣布首创广播级4K超高清实时互动体验

10 月 24 日,由声网和 RTE 开发者社区联合主办的 RTE2023 第九届实时互联网大会在北京举办,声网与众多 RTE 领域技术专家、产品精英、创业者、开发者一起,共同开启了以“智能·高清”为主题的全新探讨。本届 RTE 大会将持续 2 天,开展 1 场主论坛及 20+专场活动,包括 RTE 领域技术开发、趋势洞见、行业观察、创业投资等多维度内容分享,覆盖了 AIGC、出海、数字化转型等时下最热门的话题。


在 24 日主论坛上,声网创始人兼 CEO 赵斌、声网合伙人兼客户成功副总裁孙雨润带来了《智能·高清 开启实时互动体验新时代》的主旨演讲。Founders Space 创始人兼 CEO 史蒂夫‧霍夫曼 (Steve Hoffman)从国际投资人视角,洞察了 AI 赋能 RTE 未来的诸多可能性。声网首席科学家、CTO 钟声聚焦 AI 时代实时互动的趋势,带来了最前沿的技术观点和解读。联合国人口基金(UNFPA)驻华代表处副代表兼负责人欧雯姗(Ira Ovesen)则从“科技无国界”的角度,介绍了实时互动技术为世界带来的改变。

此外,声网首席运营官刘斌、喜马拉雅首席科学家卢恒、Soul APP 技术副总裁张高政、小红书音视频架构负责人陈靖、商汤科技商务总监 数字文娱事业部副总裁李星冶,还以”AI 如何赋能实时互动体验改善及场景升级“为主题进行了圆桌讨论。

智能·高清 开启实时互动体验新时代

回顾 2023 年,AIGC 大模型驱动着各行业迎来新业务机会,AR、VR、XR 等技术能力的迭代为实时互动在各个领域的应用提供了更多可能。在直播社交领域,弹幕玩法成为直播新风口,这些变化都影响着 RTE 行业的进化。

智能和高清正在推动实时互动体验进入全新时代,在大会开场演讲中,赵斌宣布:“声网在 RTE 行业首次实现广播级 4K 超高清实时互动体验。”他指出, “4K 不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。”广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰,并以此提升观影体验。

赵斌认为,虚拟人+AIGC 所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着 AIGC 能力的进一步加强,越来越多的应用型开发将被 AIGC 替代,API+AI 的形式将大幅提高应用开发效率。

大模型在快速发展,但交互界面仍局限于文字聊天互动方式。赵斌提到,通过过去一年的投入和打磨,声网推出行业首创 AIGC-RTC 能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。

在 AI 等核心技术驱动下,实时互动 QoE 体验的变化对于用户留存和使用行为的影响日益增强。孙雨润介绍,“根据声网某东南亚头部泛娱乐客户数据显示,当视频从标清升级高清,停留超过 30 秒观众数提升 19%,观众人均观看时长提升 30%,同时观众打赏率大幅提升。某国内知名社交出海 App,从 CDN 升级声网极速直播,送礼率增长 12.3%。”

AI 如何赋能 RTE 未来

AIGC 被认为是当前的技术革命,它与 RTE 的深度结合,又将带来什么改变呢?Founders Space 创始人兼 CEO 史蒂夫‧霍夫曼在分享中指出:“人工智能将对许多领域产生影响,在 AI 赋能的 RTE 未来,我们将看到每个人都会拥有更加个性化的体验,更加动态的程序将随着图形、音频、视频的实时变化而变化,AI 将为我们带来前所未有的连接方式。在更深层次上,AI 还将为人类增加更多的生产力水平,带来动态的虚拟世界等等,让我们感受到更多的沉浸体验。”

史蒂夫‧霍夫曼表示:“在 AI 和 RTE 技术的加持下,新的穿戴设备可能会进入市场,比如新的皮肤电子设备、感官增强设备等,它可以让我们听到人类听力范围之外的频率。此外,脑机接口也将读取我们的脑电波,从而帮助我们实现冥想或对其他设备的控制。”在工业 RTE 场景应用下,人们可以聚在一起,实时通过虚拟或真实工厂观看流水线运作、产品生产等。在 AI 陪伴场景中,人工智能伴侣这一概念将成为人们社交生活、娱乐、事业的一部分。

综上,未来可能会有各种类型的伴侣应用以及新的实时接口方式出现,甚至会出现一套为 RTE 开发的全新硬件,这些都将极大改变 RTE 领域的发展前景。

AI 时代 实时互动何去何从

AI 时代已经来临,实时互动该何去何从?声网首席科学家、CTO 钟声为我们带来了技术视角的深度分享。钟声指出,回溯过去五年,最典型的事件就是大模型的突破,从 2017 年的 Transformer,到如今的 ChatGPT-4,人工智能的发展,让信息传播和消费智能化的趋势越来越明显,万事归于中心化 AGI 接管的趋势和威胁也越来越明显。大模型在带来发展机遇的同时,也带来了计算需求快速增长、算力受能源供给力限制、大模型数据资源不够、存储需求增长过快等问题。未来,我们除了要做负责任的 AI 之外,在端上和边缘上的分布式实时智能将成为价值公平分配的重要技术手段,也是减缓中心化 AGI 对人类威胁的有效途径,这也注定会成为一个新的技术发展趋势。


钟声认为,AGI 将走进实时互动,实现人人可分身,帮助在应用场景中复制名师、网红,甚至普通人也将通过 AI 分身丰富体验、缓解时间稀缺的瓶颈。此外,他预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。

钟声介绍到,实时高清需要许多端上实时 AI,在 Low Level Vision and Audio 这一需求层面,声网的 SDK 4.1.x, 4.2.x 版本已经可以支持 1080P/4K 视频的例如超分、虚拟背景、感知编码、降噪、去回声等底层计算机视觉处理和高音质的计算机听觉处理能力。在 High Level Vision and Audio 层面,声网已经部分实现对物体、声音、场景的理解和重构能力,包括面捕、动捕、情感计算,物体识别和场景重建等,可以大力改善多种应用场景下的用户体验。

科技赋能:共筑数字包容未来

在一个科技无国界的世界里,人工智能、实时互动技术、生物技术、材料科学等技术创新力量构建了一个“数字包容”的世界。过去一年,联合国人口基金与声网通过实时互动技术,为中国偏远地区的一万多名青少年提供了适龄的健康教育。联合国人口基金(UNFPA)驻华代表处副代表兼负责人欧雯姗表示,“人工智能和实时互动技术为那些仍在使用型号较老的多媒体设备的学校提供了量身定制的解决方案。它不仅优化了直播流的分辨率,还增强了在教学和学习过程中的音视频质量。学生和直播教师可以实现像传统课堂那样身临其境的教学质量和速度。”


同时,欧雯姗宣布,联合国人口基金驻华代表处与声网及其他合作伙伴联合发起了“智享银龄”科技助老青年创新挑战赛。她表示,“我们希望激发青年人,特别是大学生和年轻毕业生,为代际数字包容贡献想法并做出积极行动。”

圆桌:AI 如何赋能实时互动体验改善及场景升级?

AI 技术的发展为各行各业带来了用户体验改善和场景玩法创新。针对这一话题,喜马拉雅首席科学家卢恒、Soul APP 技术副总裁张高政、小红书音视频架构负责人陈靖、商汤科技商务总监 数字文娱事业部副总裁李星冶、声网首席运营官刘斌进行了圆桌讨论。

谈到 AI 技术对业务发展的影响时,卢恒表示,作为全国最大的有声内容平台,喜马拉雅从文本处理到音频内容生成的过程中都使用了大量的 AI 技术,目前,AIGC 生成的音频内容日均播放量已超过 250 万小时。张高政则表示,大模型的理解能力对于 UGC 平台及用户来说都非常有利,它不仅可以快速提升内容生产效率,还能降低内容生产门槛。


AI 大模型的发展是机遇与挑战并存的。陈靖指出,对于很多公司而言,说清楚一些 AI 大模型项目的必要性是一个巨大挑战,很多项目并不像利用 AI 去做体验增强那样,能够跟用户留存及转化的一些指标建立关联。李星冶则表示,他所看到的挑战有两点。其一,在为许多 C 端流量产品提供服务时,算力、带宽、智力相关的弹性储备是一个很现实的挑战,其二,大模型开发厂商如何平衡投入以及预期收入之间的关系,也是一个挑战。各位嘉宾还分享了 AI 大模型在实时互动领域的一些玩法创新,其中陈靖提到,提高主播观看率的美颜美体功能可能是过去 AI 为实时互动领域贡献最大价值的场景,希望今后会看到更多新的尝试。

如刘斌所总结的,无论未来是挑战还是机遇,我们都应该在各自行业里去努力尝试。我们也期待,在大模型新的范式发展下,看到越来越多的场景落地及业务价值。

 

2023-10-25 15:513555

评论

发布
暂无评论
发现更多内容

一文带你检查Kubernetes应用是否为最佳实践

雪雷

k8s k8s最佳实践

Kubernetes config多集群管理工具

雪雷

k8s kubecm k8s多集群管理 kubeconfig

Gitlab CI之单元测试和代码扫描

雪雷

单元测试 CI/CD gitlab ci 代码扫描

Gitlab CI进阶之共享CI库

雪雷

DevOps gitlab CI/CD gitlab ci

微服务链路追踪之Jaeger

雪雷

全链路监控 Jaeger

一.操作系统概述

Winter

操作系统

大数据技术思想入门(一):分布式存储特点

cristal

Java 大数据 hadoop 分布式

mPaas-RPC拦截器各种场景下的使用指南

阿里云金融线TAM SRE专家服务团队

RPC

Istio微服务治理笔记(一)

雪雷

istio 服务治理 server mesh

如何优雅的备份账号相关信息

Simon

MySQL

构建统一监管制度 加快数据要素立法修法

CECBC

区块链 金融 区块链数字经济

K8s可视化监控之-Weave Scope

雪雷

k8s k8s可视化 k8s监控

玩K8S不得不会的HELM

雪雷

k8s Helm

等级三整理之深信服

Lane

Prometheus + Grafana详解

雪雷

监控 Grafana Prometheus 告警

Git 常用命令总结

迷羊

git

曾经每个手机上都有的游戏,作为前端如今你也能开发出来了,附教程

web前端程序猿

html5 大前端

XSKY新一代分布式文件系统XGFS揭秘——元数据服务

XSKY星辰天合

Java 生成解析二维码

喜瑞斯

Go: 使用pprof收集样本数据

陈思敏捷

pprof Go 语言

搜狗联合清华天工研究院推出ChoreoNet模型:让数字人随着音乐翩翩起舞

脑极体

GitOps工具Argo CD实战

雪雷

DevOps CI/CD gitops argo cd

赋能云端管理 激发智能边缘 英特尔发布超能云终端解决方案

最新动态

区块链加未来3至5年可以预见 上链将成为常态

CECBC

区块链 金融 数字时代

小小的代码分支模型如何撬动研发过程管理

陈晨

极客公园张鹏对话百度CTO王海峰,揭秘中国AI的今昔与前路

脑极体

K8s事件监控之kube-eventer

雪雷

k8s事件告警 k8s资源监控 k8s管理

支付宝蜻蜓刷脸支付

诸葛小猿

支付宝 蜻蜓 刷脸支付

Kubernetes-学习必备(awesome-kubernetes-notes)

雪雷

学习 k8s入门 k8s文档 k8s知识

必看的数据库使用规范

Simon

MySQL 技术规范

MySQL5.7应当注意的参数

Simon

MySQL 参数

RTE2023开幕 声网宣布首创广播级4K超高清实时互动体验_音视频(后端)_InfoQ精选文章