飞天发布时刻:2024年 Forrester 公有云平台Wave™评估报告解读 了解详情
写点什么

百度又放大招!视觉生成模型 Hallo2 或将落地数字人等场景

  • 2024-10-24
    北京
  • 本文字数:722 字

    阅读完需:约 2 分钟

大小:354.10K时长:02:00
百度又放大招!视觉生成模型Hallo2或将落地数字人等场景

近日,百度联合复旦大学等发布 Hallo2,一个可以生成长达数小时且分辨率为 4K 的人物动画的视觉模型。Hallo2 目前已经在 GitHub 平台开源,供全球开发者免费使用和研究,预计将促进视频生成技术的广泛应用和发展。(项目地址:https://fudan-generative-vision.github.io/hallo2/#/



Hallo2 发布后,在海外引发了不小的震动。有人惊叹视频生成的长度和分辨率,也有老用户从 Hallo 第一代模型就被圈粉,还有对 Hallo2 开源模型和代码的认可。

Hallo2 备受关注,很重要一个原因是百度和复旦的研究团队解决了人像视频生成一个很大的痛点:如何提升视频生成的时长和质量。



一直以来,生成高质量的人物动画需要耗费大量的时间和人力成本。而百度与复旦联合发布的 Hallo2 的出现,有望彻底改变这一现状,为数字人、电影制作、虚拟助手、游戏开发等领域带来革命性的变化。




Hallo2 是能够实现长达一小时、4K 分辨率的音频驱动人像动画生成模型。通过创新的图像块丢弃、噪声增强和时间对齐等技术,Hallo2 解决了长时视频生成中的外观漂移和视觉不一致问题,支持灵活的语音与文本控制,生成质量达到业内领先水平。

Hallo2 继承了前代 Hallo 模型的创新框架,继续采用基于扩散的生成模型和分层音频驱动视觉合成模块,提高了音频与视觉输出之间的同步精度,并经过改进使得各部分的协同作用更加高效,增强了生成动画的质量和真实感。此外,Hallo2 不仅在图像和视频的质量方面有了显著提升,而且大幅增加了动作的丰富性和多样性。

有行业专家表示,Hallo2 的出现,标志着音频驱动的肖像图像动画技术迈入了新的发展阶段。百度基于长期的视觉技术积累,正在瞄准行业痛点进行针对性研究和场景落地,不仅为开发者提供了强大的工具,也为未来各种应用场景下的动画形象创作带来了新的可能性。



2024-10-24 17:368811

评论

发布
暂无评论
发现更多内容

Flink Forward Asia 2023 主会场精彩回顾

Apache Flink

大数据 flink 实时计算

IoTDB 企业版 v1.3.0 发布 | 新增内生机器学习框架 AINode、权限模块全面升级等内容

Apache IoTDB

开源大侠请留步!您有一份开源集市攻略!

开放原子开源基金会

Java 开源 程序员 开发者 算法

诚邀报名 | 技术创新,照见未来——共建OpenHarmony,共赴开源世界

开放原子开源基金会

Java 开源 程序员 开发者 算法

MacCleaner 3 Pro中文激活:Mac电脑强大的清理优化软件

胖墩儿不胖y

优化软件 Mac软件推荐 系统优化工具

【PHP】thinkPHP6中的MVC思想的小案例

Geek_Angel

php mvc thinkphp6

文心一言 VS 讯飞星火 VS chatgpt (157)-- 算法导论12.3 4题

福大大架构师每日一题

福大大架构师每日一题

流计算迎来代际变革:流式湖仓 Flink + Paimon 加速落地、Flink CDC 重磅升级

Apache Flink

大数据 flink 实时计算

2023年中国游戏产业年会:鸿蒙全链路赋能游戏产业可持续发展

新消费日报

3D渲染买显卡还是用云渲染?3D渲染卡慢

3DCAT实时渲染

云渲染 实时云渲染

图说技术:我的技术文章配图实践经验

Java 工程师蔡姬

技术人 21 天技术人写作行动营

软件开发

Geek_8da502

诚邀报名 | AI 向量、云原生、开源,今年的数据库热点技术都在这里

开放原子开源基金会

Java 开源 程序员 开发者 算法

多家高校设立“鸿蒙班”;ChatGPT 成为 Nature 年度十大人物丨 RTE 开发者日报 Vol.107

声网

有OpenHarmony技术问题,上Laval社区

Geek_2d6073

如何使用 NFTScan NFT API 在 Viction 网络上开发 Web3 应用

NFT Research

NFT NFT\ NFTScan

Cilium CNI深度指南

俞凡

Kubernetes 云原生 网络 通信

TikTok跨境直播:SD-WAN解决方案的优势解析

Ogcloud

网络 SD-WAN 组网 TikTok

福利「Flink Forward Asia 2023 」PPT 阅读合集!

Apache Flink

大数据 flink 实时计算

建立海外SD-WAN专线网络的成本分析

Ogcloud

网络 SD-WAN 组网

软件对于企业的关键价值点在哪里?

天津汇柏科技有限公司

软件

单口千兆以太网物理层芯片

芯动大师

一文详解 BRC20 衍生品协议 Bitcat,铭文市场长期发展的助推器

鳄鱼视界

Vue 2 即将停止更新

南城FE

JavaScript Vue 前端开发

OpenHarmony创新赛圆满收官:引领开源趋势,开启创新技术新纪元

新消费日报

SD-WAN实现MPLS成本降低

Ogcloud

网络 SD-WAN MPLS 专线网络

百度又放大招!视觉生成模型Hallo2或将落地数字人等场景_生成式 AI_华卫_InfoQ精选文章