4 月 26 日,华为云“5G+X”联创营联合科技领导者高端社区鲲鹏会举办的“TGO 十问华为云”直播活动圆满落幕。本次直播邀请了来自在线教育、音视频、智慧电商、游戏领域的四位 TGO 代表与华为云专家展开巅峰对话,针对“新基建风口下,互联网企业如何进行业务升级和创新发展”进行思想碰撞。
本次参与对话的三位华为云专家分别是华为云中国区副总裁胡维琦、华为无线应用场景实验室(X Labs 主任)赵其勇、华为云 5G+X 解决方案 / 互联网解决方案 CTO 聂颂,四位 TGO 代表分别是作业帮主任算法工程师蒋宏飞、玩物得志 CTO 张淼、4399 平台技术总监张朝东、斗鱼技术负责人丁鹏。
以下为对话环节精彩观点整理:
一问 | 张朝东:在电商、游戏领域,出海是一个新的机遇,针对出海游戏厂商华为云有哪些解决方案?华为云跟游戏公司怎么做到联合创新?
聂颂:出海在过去几年里都是中国游戏行业一个非常重要的话题,华为在出海上主要通过强大的增段能力、丰富的节点产品以及有竞争力的产品解决方案三个方面帮助游戏客户。
在联合创新上,一是云游戏创新,华为云和多多云科技进行的云游戏创新,实现了游戏在云上运行的能力,打造了全新的游戏互动体验;二是 VR 游戏创新,华为云和客户一起探索如何将游戏延展到教育领域;三是新视频创新,我认为游戏和视频是绑在一块运作的,这种产品形式在国内已经处于领先阶段,如果将其带入到海外节点上,帮助游戏客户在新的市场上打造差异化体现,而不再局限于在老市场上抢占地盘。
华为云 5G+X 解决方案 / 互联网解决方案 CTO 聂颂
二问 | 张淼:直播场景说到底就是视频流 + 消息,华为提供的是基础设施层的能力还是包含一些 SAAS 和 PAAS 的能力?是否借助 5G 技术也能带来更好的体验提升?
聂颂:我们目前的能力集中在 IAAS 和 PAAS,不会提供 SAAS,因为 SAAS 涉及到上层业务逻辑的运营,华为暂时没有考虑提供这层面的能力。能力的设计思路是这样的,IAAS 层是基本层,PAAS 层会将通用的能力进行组合,变成 PAAS 能力向客户提供。
5G 一定会带来很多新的体验,一个比较大的改变就是电商和直播领域的视频流会突破原有的渲染及网络基础设施,变成视频本身的基础设施,AI、AR、VR 本质上来讲都是视频里面的一个能力模块,5G 加持下会有四个方面的提升:
第一是相对的延迟,过去移动互联网之所以发展这么迅速,也是因为移动带来的及时互动,底层毫秒级的延迟已经极大地改变了我们的生活,而未来我们可能会进入十毫秒级的延迟,低延迟将改变若干年后的互动频率,比如说在一个视频场景里可以直接把我的兴趣和你的兴趣结合起来,直接定位某一个场景或喜欢的角色,这背后其实是强大的 AI 能力和渲染能力。
第二是高画质,华为去年提出 1+8+N 多端形式,从 ICT 来说就是一个模型多个表现。现在的端上手机只是其中一个呈现形式,未来你可以选择在手机上看,也可以选择在大屏幕看,这就涉及到了模型高画质的意义,如果采集只有 1080P 模型,在大屏幕上将是一片模糊。尤其是通过 AI 来看,就更需要将画质提升到 4K、8K,高画质实现之后才能产生新的互动玩法。
第三是三维化,4G 带来二维化,5G 带来三维化世界,5G 下电商和娱乐会产生沉浸式环境,将会有很多人为此买单,在家里就能体验,节省了路上的时间成本和费用成本。
第四是低成本,这里指的是相对的低成本,云计算花的成本肯定还会更高,因为模型的复杂程度提升了十倍乃至一百倍,但是成本只有三倍到五倍的提高,而收益将会达到五倍到十倍的提升,这样一个商业逻辑下相对来说成本会变低。
三问 | 丁鹏:在 5G 飞速发展中,我们在 5G 上探索到了哪些创新的音视频业务形态? 请给一些看到的未来方向。
聂颂:我认为音视频是一个大带宽的场景,最主要的形态一定是新的基础设施,原来的基础设施是 CPU 网络,现在带来改变的是 PAAS 底座,在此基础上未来一定会产生新的业务、新的场景以及新的机会。具体来讲,一共有五大方向:
第一是游戏和互动视频,未来可以实现主播和玩家观众共享一个游戏,同时产生一个新的感情空间,互动就可以在瞬间实现。
第二是音特效,变脸特效就是其中一种,涉及到人像识别,但是现在贴合度可能还稍微差一些,未来进入 FAAS 级别的抠图后,效果会更加好,一根头发丝都能抠出来,这样底层互动效果也会更好了。
第三是手势识别和动作识别,目前在技术层面来讲是有些难度的,还没有太好的商业化的案例,但是一旦成熟了其商业空间是非常大的。现在主播做直播时后台至少有两个人帮他做工作,包括改标签、改价格等等,其实很不方便,将来如果说人体姿势识别之后,这个效率会提高一个档次,比如说在直播过程中,我随便拿起一个商品就能够识别出来它是什么品类,再说一句话可以让它上架,非常方便快捷。
第四,在技术层面上来讲,我认为端边云协同会是一个新的方向。现在很多技术都是在手机端完成了,比如企业把算力放到边缘上实现了美颜,将来会有更多的算力放到边缘或者是云上去,会产生新的架构,新的架构一定会产生新的玩法。
第五是 AR 新玩法,AR 新玩法就是要实时进行三维建模模型识别,给你导航,并且在端侧进行三维内容的叠加,产生新的效果,后面基于这些新玩法会产生的新的商业模式,以及新的技术架构。
最后说一点,这些改变不只会作用在 2C 产业,未来在 2B 产业也一定会用到。举一个例子像教育,教育不单单是一个 2C 行业,他其实还是一个 2B 的行业,音视频的上层和底层的能力都可以应用在教育行业。
四问 | 蒋宏飞:疫情期间在线教育爆火,而 5G 带来的大带宽能为在线教育“更加突出人的互动”创造条件。关于在教育场景互动体验优化方面,华为云基于 5G 有怎样的思路?
赵其勇:整体而言,我觉得有三个方面:第一,随着 5G 的到来,宽带实现了提升,原来以 720 为主的视频走向了 880P,拉近了高质量区域和低质量区域的差距。最近也看到有一些尝试,课堂授课时,偏远的乡村也可以通过 5G 实现远程听课,不仅拉近了距离,也提升了清晰度。
第二,衍生出更多新型形态,在 AR、VR 的基础上出现了一种新的互动形态 CDVR,CDVR 的兴起能够实现教育的沉浸式和三维化,这是一个重大的变化。不论是物理、化学还是其他科学实验,在 CDVR 打造出的虚拟场景中可以自定义情节、人物以及工具等,和每个学生实现强相关,在这样一个虚拟教室下可以更好地实现远程教育互动性。
第三,AI 应用下教育会变得更加准确,可以为每个学生画像,帮助老师更好的进行课堂情况的回顾,更好的来布置作业和批改作业,这都是可以想象的。
华为无线应用场景实验室(X Labs 主任)赵其勇
五问 | 张淼:5G 网络的商用大大提升了电商的体验,也使 VR 和 AR 等技术融入到电商直播中,大大提升购物体验,但对于中小型公司来说门槛相对较高,华为这次提出的联合创新,是否有这方面的支持?
赵其勇:通过商业网络的验证,5G 网络下平均单用户可以达到几百兆,4G 是几十兆,加上边缘云逐步下沉,这两者都为 AR、VR 规模化开展打下了很好的基础。2019 年,华为云已经开始支持云 VR 的服务了,今年还会进一步升级更加全面的 VR 解决方案,包括基于传统 X86 生态的云 VR、基于鲲鹏的云 VR 和 AR,以及从 4K 到 8K 的更高清视频。以整个多核为基础,我们要思考的创新点是,怎么真正在电商场景当中,包括直播以及平台购物场景中植入内容的形态。
以电商环境中的一些小视频为例,小视频中如何加入 AR 和 VR 元素?对华为来讲重点是帮助客户更快地把 AR、VR 元素植入品类当中,而不至于每个前台都开发自己全套 ARVR 的内容。去年我们尝试进行完全的虚拟场景体验,不论是在手机上的 AR 还是带上头盔来看的 VR,都可以在虚拟场景中把想卖的商品变得更加立体化,为用户呈现出 3D 化效果,并且用户可以操作、拆解它,甚至在虚拟场景中随意摆放物体,这样就可以让用户体验到通过电商的模式,足不出户也能也能够买到让自己满意的商品。
六问 | 张淼:我这边想提一些直播相关的技术问题。第一,电商非常关注链路定性,直播本身环境非常复杂,华为有什么措施保证链路稳定性?第二,电商关注转化率,但是直播间存在很多问题,比如说一个直播只能服务一个用户产生互动,5G 技术是不是能够进行一些改善?第三,我们平台比较特殊的是直播间拍卖,链路很重要,有什么相关保证手段保障实时性吗?
赵其勇:从链路的稳定性来讲主要分两个方面,第一是接入侧,第二是数据中心。随着 5G 的部署接入侧会出现很大变化,不论是从容量还是保障性来讲都会出现很大提升。在数据中心上,华为在做大量 CDN 下沉和 BAN 的部署,以及 CDN 各个节点链路之间的优化,在链路的稳定性上会得到一个很大的提升。
在主播的互动上面,目前主播跟消费者之间普遍是一对一的参与形式,我认为在技术上实现主播一对多没有太大的问题,技术上不是关键要素,主要是一个主播没有更多的精力实现跟多个客户之间的沟通,这主要是人的问题。
第三点,拍卖中涉及的交易环节。无论是拍卖平台还是买家,都需要在交易过程中进行配合,如果可以及时对信息进行识别,就能保障拍卖双方的消息传递和及时支付,当然在这个场景中会涉及很多技术细节,这块增值服务也是我们后面将要提供给用户的。
七问 | 丁鹏:云、AI、5G 对音视频行业结合将产生哪些影响?在音视频领域,我们会比较关注:云推流、云处理、云合成的发展趋势,5G 如何运用到超高清音视频传输上,能否支持更多的玩法?
赵其勇:自从 5G 开始规模化商用以来,4K 高清直播已经走入人们的视线。去年年初,集成 5G 模组的编码器已经在华为无线应用场景实验室中产生,并投入商用。5G 网络可以大幅提升 4K 超高清视频的生产效率,那么,在超高清直播已经成为常态的前提下,云处理和云合成就是一个自然的发展趋势了。
随着 AI 技术的发展,我们还发现了一个新的应用场景,它会引入大量的数字化的场景和手段。举个例子,我们现在拍的一些动画片,包括我们看到《流浪地球》都是一帧一帧做好的。那如果我们可以通过实时渲染的方式产生超高清、逼真的视频,为什么不能利用云端边算力,让每个人按照自己的视角看我们动画片呢?比如小朋友爱看的《熊出没》,你站在熊大熊二中间看,他可以站在熊二身边看。
这是新形态产生,需要在视频录制和制作上产生变化。如果说我们把动画片场景数据、过程当中动作数据,以及每个物体的位置数据录下来,并把这些数据进行分发,使得每个观看者都可以结合各自位置在这个场景当中去实时渲染,得到与之位置、兴趣相匹配的视频推送。这些都是除了超高清视频领域外,还能够更大程度上引起未来变化的方式——一个沉浸式自由的视频体验。实际上我们在这方面也有一些模型,大家感兴趣也可以进行更多探讨和交流和联创。
八问 | 蒋宏飞:政府今年出台的“新基建”政策也引发了业界的关注。5G+X 联创营和新基建之间有什么关联?5G 是新基建一个很重要的方向,华为云在新基建的政策下有哪些重要的规划?
胡维琦:其实新基建是相对于原来传统谈到的基建而言的。新基建代表的是数字化转型的底座,我们发起 5G+X 联创营,就是希望能在 5G 的历史机遇下,加上“X 化学变量”,让越来越多的技术之间产生化学反应。在 5G+X 联创营中产生的场景、方案、商业模式等,就是新基建在各个行业一个具体落地。
具体来说,新基建风口下,我们非常看重并且重视这个机会。包括这次的“5G+X”联创营活动其实也是在发改委以及相关的一些基金委创业要求下创立的,我们发挥华为的技术、品牌的能力,能够和我们伙伴一起在这方面孵化非常好的新技术、新模式。
总体而言,在这次“5G+X”联创营中大家可以看到很多机会和需求:
第一是文创行业。在文创行业中我们看到是对于消费者整个体验的升级,原来 4G 更多通过音频、或者视频、图像的方式跟消费者进行单项的交流,现在这个交流打破了单项互动,同时可以实现二维、三维,传统的商业模式中加入技术创新诞生了新的模式,比如说做直播的时候,实际上是可以将一些云游戏类的技术加入到主播的互动,这样也可以带来一些新的运营模式的变化。
第二是教育行业。教育也是 5G 应用中非常重要的场景,很多省份的教育主管部门,也在跟我聊怎么通过新技术改变教育。其实,教育本质上是一种体验式的服务,并不是一个标准化的,怎么去加强和学生的互动体验,怎么让我们千人千面、因材施教,都是有非常多的教育元素在支撑。我认为这次疫情,其实给我们的线上教育工作者一个非常好的机会,能够真正服务于更多的学生,同时也让我们这些学生、家长、甚至教育主管部门,看到我们在线的一些力量,这是教育行业的一个非常好的机遇。
技术层面我们仍需要持续探讨。首先是技术落地,其次是商业模式的闭环,再有是找准一个维度入手。哪一些商业模式和技术成熟,就先把这些梳理出来进行推广,同时把这些技术做成创新型技术,在整个网络覆盖,这样大家更容易享受到技术的红利,否则容易踩坑。
除此之外,还有很多场景也会在新的基建下有很多变化。比如智能制造方面,国家在做相关工业互联网标准的制定,怎么在上面找场景,真正帮到我们的企业能够降本增效?这一块存在非常多的关于重型器械的预测性和预防性维护,这个我们可以通过历史数据积累分析故障率,提供预防检测。
我们发现 5G 真正深入到各个行业场景中之后,会带来非常大的化学反应,这也是刚才说的 5G+X 裂变。但是我们同时需要保持足够清醒,5G 不是万能技术,不能改变所有事情。在 5G、新基建的背景下,我们需要选择一个好的场景,选择一个可变化的商业模式,才能获得更好的成功。
九问 | 张朝东:5G 下云游戏作为一种号称可以颠覆式提升玩家体验的新模式,让人看到了巨大的市场空间和各种可能性,但是同时也存在比较明显的硬件瓶颈。专家对云游戏的趋势和未来怎么看,华为在这方面是否也有一些相关的解决方案或者案例可以分享一下?
胡维琦:说实话云游戏并非新概念,而是老概念,为什么现在又热起来了呢?主要是外部环境在发生变化。5G 到来后如果能解决带宽时延和资费问题,会为游戏落地带来非常好的环境变化。
我跟很多游戏公司老板交流,他们都认可云游戏一定是游戏行业的下一跳。因为云游戏改变了两个方面体验:一是突破手机硬件性能,把渲染放在云端进行而后向终端推送视频流,这样对于终端硬件要求比较低,提升了整个画质和渲染特效的体验,客户可以获得更高质量的游戏视觉体验。二是在互动性体验方面,传统游戏虽然有互动,但体验会受地域等限制。但在云游戏下,云端操作可以方便进行控制权转化、场景画面的切换等。
为什么大家对云游戏既憧憬,同时比较纠结呢?纠结点主要是在于资费的变化,主要来自两方面:一是我们整个无线接入网络 5G 资费带宽,二是在云游戏上用了云服务器的资费带宽。这方面我个人观点是,今年年底可能各个运营商会出包流量的 5G 资费带宽套餐。对于 5G 一台云主机虚拟多个云游戏用户,华为云因为有自己鲲鹏的芯片,现在能够在高清画质下把单用户的成本得到大幅度的降低。
其次,在体验上,还需要像华为这样的技术公司和游戏公司共同努力。我一直有一个观点,云游戏一定不是把现在端游或者手游直接放到云端运转,而是在体验上得到大的翻天覆地的变化,要思考怎么将交互式体验和游戏策划相结合,真正把技术优势发挥出来。
再次,在互动性方面可以继续延伸。怎么通过云端减少人与人之间的距离感,除了一起游戏外,还能一起互动动、一起追剧、一起发弹幕,甚至可以分享。这些体验需要我们互联网公司和华为公司一起来想变化,在这个地方找到场景。
同时从我们自己来看,我们认为云游戏还是有独特的优势,因为华为云有独家支持的视频流解决方案,是直接用鲲鹏架构来做的,不用做 ARM 和 X86 转换,所以整体性能比 X86 性能提升 40%。此外还有强大的算力,以最近的 128 核鲲鹏芯片举例,我们可以让整个在线并发提升三倍,同时成本还能得到进一步下降。
最后,对体验比较大的影响是在时延,后续提出“5G+边缘”的方案会降低时延。
我个人觉得云游戏不仅改变了用户体验,也改变了发行渠道。原来发行渠道是通过应用市场一个 APP 进行安装,在云游戏阶段可能通过云游戏的一个流量平台,便能即点即玩,这种方式可以很好解决流量入口问题。对用户来说,可以跳过下载,减少中间环节,更方便高效。
十问 | 丁鹏:随着 5G 发展,音视频行业进入新的竞争阶段,用户体验会成为企业成功突围的要点,如果能做到交互,会有怎样的创新?以及未来的发展趋势?
胡维琦:首先,我从用户维度会发生的变化来讲:一是视频高清化,在多屏接入和多屏互动的时候,高清画质是标配;二是互动化,原来视频是单向信息传送,增加用户体验一定是增加互动化;三是沉浸式,原来的视频受制于技术和硬件条件,所以沉浸式的体验相对较弱,但我认为随着 VR、AR 等虚拟技术的发展,消费者会追求沉浸式体验带来的感受。
其次,从技术角度来说:第一,视频高清化带来的是技术的去中心化,由于视频流量越来越大,很多的视频处理和渲染一定要在边缘侧进行。因此,高清视频的引入会带来去中心化的网络架构;
第二,互动化本质上是技术上的变化,越来越多的业务渲染要在云端处理,因此需要方便进行互动的操作和体验。此外,互动的前提是要能够识别结果,并依此快速进行渲染和反馈,这就要求我们在云端或边缘侧有更大的算力能力,支撑我们在前端用户端互动化的体验;
第三,沉浸式本质上是对大算力的需求的体验。若想达到沉浸式的体验,传递给用户的数字元素会更多,因此,沉浸式背后的技术需求,也是对大算力和渲染的要求和对高清视频的处理要求。此外,我们也要兼顾成本,通过高清编码技术、边缘侧部署技术,以及一系列超分的技术来降低成本,否则这些好的体验是没办法全面推广的。
最后,从互动化的体验方面来说:第一,类似游戏的直播场景,可以很方便地进行主播与粉丝的配合,主播和粉丝可以方便互相移交控制权,甚至一起打游戏,这个已经比较成熟了;
第二,直播带货场景中,虽然直播界面比较稳定,但支持团队会手忙脚乱,甚至不小心翻车。但是如果这个事情通过数字化的方法解决,比如能够自动识别商品,并且把相关商品描述列出来,包括价格、比价情况等,可以免去助理团队的慌乱操作;
虽然现在技术还不完全成熟,但我认为成功一定是争取来的,我们需要快速从芯片技术、视频编解码技术,人工智能技术等方面做一些突破,让这些场景落地。即使如此,我们现在直播带货场景,已经有部分场景是可落地的,比如说动态换脸、美颜等。另外对物体的识别也有很多的创新,比如可以对物品进行描述、变换等。
击华为云“5G+X”联创营进入官网访问
评论