写点什么

2023 年数字人行业洞察:“数字人自由”即将到来,管线化生产加速提升应用效率

  • 2022-12-23
    北京
  • 本文字数:4315 字

    阅读完需:约 14 分钟

2023年数字人行业洞察:“数字人自由”即将到来,管线化生产加速提升应用效率

当数字人,从一项技术创新的产物,真正成为一个产业,走向大规模的落地应用,未来将如何转化为现实生产力,如何形成完整的商业模式,如何推动下一阶段的创新?技术路线还将发生哪些演进?全真互联的到来,将推动数字人出现在哪些全新的生产、生活场景?


12 月 20 日,由腾讯云智能、腾讯研究院、创业黑马联合主办的“数字人产业发展趋势解读”线上圆桌论坛中,腾讯云智能数智人产品总经理陈磊、创业黑马产业加速器总经理冯莎莎,北京理工大学光电学院研究员、博士生导师、数字栩生创始人兼 CTO 翁冬冬,南方都市报官微运营部总监申鹏,共同解析、探讨了数字人产业发展趋势。


AI 驱动数字人交互能力快速提升


技术进步是数字人发展的第一推动力。在 2022 腾讯全球数字生态大会上,腾讯研究院、腾讯云智能和创业黑马,共同发布了《数字人产业发展趋势报告[2023] 》(以下简称“报告”)。《报告》指出,数字人的核心技术主要包括计算机图形学、动作捕捉、图像渲染、AI 等,随着各项技术的不断迭代,正推动数字人制作效能和智能水平持续提升。

 

翁冬冬用四个关键词总结数字人的发展:第一,高逼真:从信息交流学、传播学角度来讲,只有通过表情、眼神、肢体才能精准地传递情感和信息,所以数字人具备高逼真的外观是精准传递信息的刚需;第二,实时化:数字人与人类的情感传递、互动是趋势,在这种情况下,技术支持需要满足数字人实时交互的需求;第三,智能化:在数字人生成和驱动中,AI 算法起到至关重要的作用;第四,虚实融合:目前人机交互方式通过屏幕和人进行交互,这种环境下数字人能够起到的作用非常局限,未来在 VR、AR 场景下,数字人作为一种新型人机交互窗口,具有不可替代的作用。


陈磊表示,数字人作为 AI 综合类的应用,本质上来说是承载全链条整合 AI 能力的“实体化”载体。例如,腾讯云智能数智人集合了腾讯内部多个团队的优势 AI 能力,在人像建模方面,通过优图实验室的相关 AI 技术,可以做到凭借几张照片就快速生成写实级的人脸;在动作绑定环节,例如将动作从 A 数智人迁移到 B 数智人,可以利用 IEG 的 NExT Studios 团队的动作和表情迁移工具,快速绑定,相比于传统的需要用动捕设备从零开始采集动作大大提升了生产效能;对话式 AI,由云智能语音 AI 技术支撑;多情感驱动能力,由 AI Lab 的相关支持等等。


与市面上流行的“数字虚拟人”、“AI 数字人”等概念不同,腾讯云智能对数字人的定位倾向于“数智人”,属于“交互智能入口级”相关的应用。陈磊表示,数智人的生产运营主要考虑两个维度,一是更加智能,从数字人的形象到驱动再到交互,每一个技术环节都需要 AI 去串联;二是更加落地,切实为行业带来服务体感的升级、效率提升。


翁冬冬提出,数字人真正的核心技术是 AI,这已经是行业目前比较清晰的一个认知,下一阶段大家需要突破的目标是“如何让数字人变得更像一个人”。这将取决于内外两个方向。“外在分为静态的像和动态的像,因为其实在真正交流的时候,情感传递更多是由动态的表情、姿态和动作来完成,这些呈现和交流内容密切相关,很难通过前期的预制动画完成,未来需要 AI 算法和更智能的“动作引擎”来指导数字人的反应。在内在层面,又分为语音交互和非语音交互两个部分,下一个突破点是让数字人不再局限于答录机,而是像人一样去思考。


陈磊也认为,未来在 AI 技术的辅助下,有望形成输入文本,或者通过语音、语义识别即可自动化生成情感、动作表达。“这也是多模态的一种手段。例如,不同的人说同一句话,不同的表述方式对应的情感表达是不一样的,驱动在表达上也有所区别,通过 AI 实现自动化,这些都是需要去重点深耕探索的方向。”


管线化生产将加速提升数字人应用效率


数字人的精细度和智能化水平不断提升,一大批数字人加速融入生产、生活。我国数字人商业化应用探索步伐持续加快,不同形式、不同领域的应用场景不断涌现,数字人逐渐成为数字经济发展的新亮点。


通过创业黑马对“数字人加速器”多家企业进行调研,冯莎莎发现数字人在营销方向应用最多,其次是文娱、文旅以及直播带货,这些领域在商业化变现方面都做的很成功。大家也能明显地感觉到数字人服务朝着脱虚向实的方向发展,在行业里面产生了实实在在的价值。


《报告》中也指出,受益于数字人生产工具和方案日渐完善,在企业服务、影视动画、文化传媒领域,数字人都得到了广泛应用。今年 10 月,腾讯与南都合作打造了虚拟主播“小 N”, 在经历真人采集建模、自然语音处理、图像处理、语音合成等人工智能技术加持下,虚拟主播“小 N”正式上岗。编辑只需要在后台输入文本,就可以实现声画同步的虚拟主播新闻视频输出,24 小时全天候无间断播出,大大提升了新闻生产效率和用户覆盖广度。


作为虚拟主播项目负责人,申鹏举例称,“小 N”在世界杯期间吸引了许多球迷和观众,整体点击率达几百万,单条视频最高峰点击率有几十万。


从媒体行业角度出发,申鹏对数字人提出的第一个关键词是“真实”,作为媒体信息的传递者,虚拟主播需要无限接近于真实主播,要能够体现人类情感从而打动观众;第二点是“便利”,未来数字人如果能与手机摄像头融合,数字人的呈现将不再局限于演播室,而是可以走入新闻现场;第三点,希望虚拟主播“小 N”可以变成一个内容 UI 界面,不仅能够播报内容,还可以和用户互动,成为一个高度拟人化的表达渠道。

根据 IDC 在《中国 AI 数字人市场现状与机会分析,2022》报告中预计,到 2026 年中国 AI 数字人市场规模将达到 102.4 亿元。


冯莎莎表示,未来的数字人是每一家企业的标配,也就是今天说的“数字员工赋能千行百业”,因此各行各业也对数字人的生产提出了更高的要求——成本和效率。


对此,翁冬冬也提出,行业更多思考的是如何通过降低成本推动数字人的普及。“现在是一个产线迭代的时代,数字人最初出现是为艺术服务,但到了工业化生产阶段,行业需要思考的是,如果将个性化的生产经验固化到 AI 算法,让数字人变得更容易制造,更容易使用。”


截至目前,腾讯云智能数智人已经覆盖了 10+行业领域以及 50+的应用场景。在这个过程中,陈磊观察到,数智人作为一个交互智能的新的入口,最大的挑战来自于如何通过一个强大的供给的能力,满足到快速覆盖落地于不同行业、不同场景里,这对数智人生产制作流程以及技术积累都提出了很高要求。


基于此,腾讯云智能在之前已经推出了数字人内容生产平台,交互数智人平台。在形象建模上,今年新推出的小样本 2D 数智人生产管线,通过上传 3—5 分钟左右的视频即可快速生成一个数字分身,生产周期缩短至小时级别。在企业服务领域,通过腾讯“神农 MShenNonG”,以一个很小的模型就能够解决客户垂直场景的应答需求。例如,疫情期间,在一汽大众云展厅案例中,数智导购 Ida 经过汽车语料的学习,可以为顾客提供各类购车信息。效果显示,相对于传统的现场营销服务,这种数字人服务推动整体留资率上升 13%,每个用户在云展厅逛展时间接近 10 分钟。陈磊表示,“只有达到足够低成本、足够高效率的生产,数字人才会有更强的行业覆盖性。”

 

“数字人自由”时代即将到来


目前,随着虚拟数字人产业链逐步走向成熟,已经形成了由上游制作、渲染工具,中游的虚拟人驱动及运营,下游的场景应用一起组成的完整虚拟数字人产业链生态图谱。产业链的成熟催生了低成本的数字人应用软件应运而生,很多对价格比较敏感的中小企业,甚至是个人,已经开始跃跃欲试,尝试给自己定制个“数字分身”。


在讨论中,圆桌嘉宾给出了平民化、易生成、易操作等关键词。陈磊认为,平民化的本质是生产数智人的周期、成本、运营能够大幅度降低,将有望推进“数字人自由”。他举例最近 2D 小样本的数智人迎来增长点,快速获得商机,背后的本质是平民化的使用门槛。


从应用层面,翁冬冬也提出了 3 个关键词。首先是“优雅”,他认为数字人应该特别易于使用,不需要调整太多参数就可以“优雅”地使用,预计数字人自由将在 2023 年到来;第二个关键词是“经济”,物美价廉的数字人在行业里才有更大的生存空间;第三个关键词是“无所不在”,未来,数字人将应用于千行百业,存在于社会的方方面面。

 

陈磊还对数字人未来展望提到 “场景化”关键词,目前数字人应用还处于行业早期,未来需要从场景出发,找到并解决客户在实际的落地过程中遇到的问题,真正提升客户企业运营效率才能获得长久发展。

 

利好政策加速数字人产业落地


今年以来,乘着利好政策的“东风”,数字人产业一脚踏进了快车道。例如,今年 7 月北京市发布《北京市促进数字人产业创新发展行动计划(2022-2025 年)》,成为国内出台的首个数字人产业专项支持政策。

报告显示,随着多个垂直行业陆续出台应用建设指南,将会更好地推动数字人的落地应用。


创业黑马产业加速器总经理冯莎莎表示,2023 年将会是数字人相关支持政策及指导意见频繁落地一年。目前,国内已有 30 多个地市出台相关支持政策,其中大部分为引导型,主要引导方向为技术自主化、打造数字人的自主产业链;产品工具化,培育一体化、自动化、批量化的数字人开发工具,以及鼓励企业探索产业应用。


“从统计数据来看,数字人应用里,数字员工型应用到明后年会快速增长。”冯莎莎也给出了企业自评的三个核心竞争力,分别为 AI 算法、数字人制作能力、商业化变现能力。“从市场的角度来看,AI 算法是排名第一的核心竞争力,企业只有具备核心技术和内容创新能力,才能保证自己在数字人赛道上的竞争力。”

除了蓬勃发展的市场需求,随着数字人从技术创新走向产业应用,越来越多的数字人开始“持证上岗”,也给数字人的制作、研发等后端工作带来很大的压力。


市场对数字人还有哪些期待?

 

翁冬冬表示, AI 数字人目前整体还处于起步阶段,距离市场成熟还有较长的距离,需要大量的技术积累。由于现在可选择的方向比较多,实现手段和技术多,更新速度快,导致行业还处在混乱无序的状态。他呼吁大家能走慢一点、走稳一点,只有更细致的打磨和挖掘,才能把这条路走的更长远。


陈磊认为,市场对数智人的期待,既要是敬业多才的员工,也要是吸粉明星代言人。“从最开始企业品牌 IP 数智化员工的打造,通过员工的打造慢慢下沉,在营销获客场景里面做获客增益,然后再与用户做日常运营、业务办理,提供全域全生命周期的服务打造。”


腾讯研究院高级研究员宋扬表示,面向未来,数字人正朝几个方向加速迭代,一方面,外貌更加精致、形象更加逼真、动作更加自然,这就是所谓的皮囊更加好看。另一方面,随着 AI 技术的不断完善,数字人多模态的感知和交互的能力会得到显著的提升,数字人未来可能会具备记忆力和判断力,更加的智能,在思想和行为上更加接近于人,拥有所谓有趣的灵魂。“相关技术快速发展,已经到了商业化大规模推广的临界点。未来,数字人将进入越来越多的产业提供服务,成为人机交互的新入口,带来更加智能、更加沉浸的‘在场’体验。”

2022-12-23 10:575715
用户头像
刘燕 InfoQ高级技术编辑

发布了 1112 篇内容, 共 532.3 次阅读, 收获喜欢 1976 次。

关注

评论

发布
暂无评论
发现更多内容

java开发哪家机构比较好?

小谷哥

手写一个react,看透react运行机制

flyzz177

React

react源码分析:深度理解React.Context

flyzz177

React

做7秒动画赢13W大奖?总奖池超80W、国内最火爆的3D渲染动画创作大赛开始报名!

Renderbus瑞云渲染农场

3D渲染动画大赛 3D动画制作 瑞云渲染CG竞赛

Zebec正在以流支付的方式,推动加密资产支付走上正轨

鳄鱼视界

大数据培训课程哪里比较好?

小谷哥

使用JMeter模拟设备通过MQTT发送数据

石云升

测试 Jmeter mqtt

react的useState源码分析

flyzz177

React

大数据开发培训机构该怎么选择?

小谷哥

2022-12-13:游戏玩法分析 I。写一条 SQL 查询语句获取每位玩家 第一次登陆平台的日期。 +-----------+-------------+ | player_id | first_l

福大大架构师每日一题

数据库 福大大

架构实战营 模块2作业

西山薄凉

「架构实战营」

深入React源码揭开渲染更新流程的面纱

flyzz177

React

react源码分析:组件的创建和更新

flyzz177

React

去哪儿是如何做到大规模故障演练的?

TakinTalks稳定性社区

自动化 混沌工程 故障演练

Python 缩进语法的起源:上世纪 60-70 年代的大胆创意!

Python猫

Python

【Alibaba微服务技术系列】「SpringCloud技术专题」基于SpringCloud-Alibaba的微服务2.0模式架构搭建实战指南(解析版本对应关系)

洛神灬殇

SpringCloud SpringCloud Alibaba 12 月 PK 榜 服务搭建

架构实战营模块二作业

张贺

架构训练营

在西安怎么选择java培训?

小谷哥

JavaScript刷LeetCode拿offer-栈相关题目

js2030code

JavaScript LeetCode

盘点新能源汽车常用的8种传感器

元器件秋姐

传感器 新能源汽车 智能传感器 新能源 IGBT

伙伴福利,100个项目彻底精通Java!【开源】

JavaPub

Java 源码 javaWeb

前端开发需不需要通过培训来学习

小谷哥

Verilog 过程赋值

梦笔生花

Verilog Verilog语法 Verilog过程赋值

容量保障落地四步走

老张

性能测试 服务治理 稳定性保障 容量测试 容量保障

工作中常用的设计模式--享元模式

lpe234

Java 设计模式 享元模式 spring-boot

易观千帆 | 10月手机银行APP用户体验GX评测

易观分析

手机银行 GX评测

JavaScript刷LeetCode拿offer-树的遍历

js2030code

JavaScript LeetCode

银行普惠金融可持续发展能力建设——风控科技应用

易观分析

金融 银行

详述TLS握手流程

穿过生命散发芬芳

TLS 12月月更

深度分析React源码中的合成事件

flyzz177

React

极客时间运维进阶训练营第八周作业

独钓寒江

2023年数字人行业洞察:“数字人自由”即将到来,管线化生产加速提升应用效率_AI&大模型_刘燕_InfoQ精选文章