速来报名!AICon北京站鸿蒙专场~ 了解详情
写点什么

百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景

  • 2024-10-24
    北京
  • 本文字数:722 字

    阅读完需:约 2 分钟

大小:354.10K时长:02:00
百度又放大招!视觉生成模型Hallo2或将落地数字人等场景

近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全球开发者免费使用和研究,预计将促进视频生成技术的广泛应用和发展。(项目地址:https://fudan-generative-vision.github.io/hallo2/#/



Hallo2 发布后,在海外引发了不小的震动。有人惊叹视频生成的长度和分辨率,也有老用户从 Hallo 第一代模型就被圈粉,还有对 Hallo2 开源模型和代码的认可。

Hallo2 备受关注,很重要一个原因是百度和复旦的研究团队解决了人像视频生成一个很大的痛点:如何提升视频生成的时长和质量。



一直以来,生成高质量的人物动画需要耗费大量的时间和人力成本。而百度与复旦联合发布的 Hallo2 的出现,有望彻底改变这一现状,为数字人、电影制作、虚拟助手、游戏开发等领域带来革命性的变化。




Hallo2 是能够实现长达一小时、4K 分辨率的音频驱动人像动画生成模型。通过创新的图像块丢弃、噪声增强和时间对齐等技术,Hallo2 解决了长时视频生成中的外观漂移和视觉不一致问题,支持灵活的语音与文本控制,生成质量达到业内领先水平。

Hallo2 继承了前代 Hallo 模型的创新框架,继续采用基于扩散的生成模型和分层音频驱动视觉合成模块,提高了音频与视觉输出之间的同步精度,并经过改进使得各部分的协同作用更加高效,增强了生成动画的质量和真实感。此外,Hallo2 不仅在图像和视频的质量方面有了显著提升,而且大幅增加了动作的丰富性和多样性。

有行业专家表示,Hallo2 的出现,标志着音频驱动的肖像图像动画技术迈入了新的发展阶段。百度基于长期的视觉技术积累,正在瞄准行业痛点进行针对性研究和场景落地,不仅为开发者提供了强大的工具,也为未来各种应用场景下的动画形象创作带来了新的可能性。



2024-10-24 17:368714

评论

发布
暂无评论
发现更多内容

语音识别技术在智能家居领域的创新应用与挑战

来自四九城儿

软件测试/测试开发丨利用ChatGPT自动生成架构图

测试人

人工智能 软件测试 ChatGPT

自动化混沌工程 ChaosMeta V0.6 版本发布

ChaosMeta

云原生 自动化 稳定性 混沌工程 攻防演练

2023年度openEuler领先商业实践遴选征集工作正式启动

彭飞

Python JSON 使用指南:解析和转换数据

小万哥

Python 程序员 软件 后端 开发

Rust中non_exhaustive的enum

胡译胡说

rust

外贸网站建设攻略:如何建设一个高效的外贸网站

九凌网络

为什么需要对特权账号进行管理

尚思卓越

运维 网络安全 信息安全

影视企业有哪些方式将视频文件快速海外跨国传输国内?

镭速

跨国文件传输

语音识别技术在医疗健康领域的应用与挑战

来自四九城儿

2023-11-01:用go语言,沿街有一排连续的房屋。每间房屋内都藏有一定的现金, 现在有一位小偷计划从这些房屋中窃取现金, 由于相邻的房屋装有相互连通的防盗系统,所以小偷 不会窃取相邻的房屋, 小

福大大架构师每日一题

福大大架构师每日一题

特权账号管理系统PAM的优势特点

尚思卓越

网络安全 数据安全 PAM

缺客户、缺钱、缺时间——实业经营的真挑战,中国企业分别突破

B Impact

陈奕迅全新专辑《CHIN UP!》上线华为音乐,五年后心血之作强势来袭

最新动态

IoT与鸿蒙、低代码、生成式AI,引爆技术浪潮——华为云开发者日南京站成功举办

华为云开发者联盟

人工智能 华为云 华为云开发者联盟 华为云开发者日

Evolving with AR9582: MFC900M - A Legacy of Connectivity and Adaptation

wallyslilly

AR9582

HarmonyOS数据管理与应用数据持久化(一)

HarmonyOS开发者

第22期 | GPTSecurity周报

云起无垠

客服发送一条消息背后的技术和思考

得物技术

体验 IM 客服

桌面云一体机什么品牌最好?

青椒云云电脑

桌面云 一体机 桌面云一体机

华为Mate 60必备,这几个保护隐私的设置太实用了

最新动态

在线涂鸦画板软件哪款好?这7款涂鸦神器值得推荐!

彭宏豪95

效率工具 画图软件 在线白板 涂鸦 绘画软件

陌生链接可能是诈骗网址,谁来保护我们的上网安全?

最新动态

手机是数字世界的另一个你,你的隐私还安全吗?

最新动态

低代码可视化逻辑编排工具

树上有只程序猿

低代码 可视化编排 JNPF

跨国文件传输为什么要用专业的大文件传输软件?

镭速

跨国文件传输

一座 “数智桥梁”,华为助力“天堑变通途”

脑极体

AI

Java while 和do while 循环

HoneyMoose

特权账号安全管理的难点

尚思卓越

网络安全 数据安全 特权账号管理

高能有料 | 第二届OpenHarmony技术大会议程速递

OpenHarmony开发者

Ping和ARP流程解析

王玉川

router Switch ping ICMP ARP

百度又放大招!视觉生成模型Hallo2或将落地数字人等场景_生成式 AI_华卫_InfoQ精选文章