腾讯混元3D生成大模型2.0开源发布：大幅升级，几何与纹理解耦，3D生成更逼真_腾讯_罗燕珊

AICon上海｜与字节、阿里、腾讯等企业共同探索Agent 时代的落地应用了解详情 



 写点什么

近日，腾讯混元正式宣布开源其 3D 生成大模型 2.0 版本，并推出业界首个一站式 3D 内容 AI 创作平台——“混元 3D AI 创作引擎”。该引擎集成了从文本/图像生成 3D，到 3D 动画、纹理生成、低面数模型生成、个性化 3D 人物定制以及 3D 小游戏创作等能力，为创作者和企业提供了可快速搭建 3D 创作管线的全流程解决方案。开发者可在 GitHub、Hugging Face 等社区获取最新的模型与代码，普通用户也可通过线上平台直接体验。

混元 3D AI 创作引擎 https://3d.hunyuan.tencent.com/
代码仓库： https://github.com/tencent/Hunyuan3D-2
模型权重：https://huggingface.co/tencent/Hunyuan3D-2

据腾讯混元方面介绍，相较于此前开源的 1.0 版本，新发布的 2.0 版本最大的技术突破在于实现了几何与纹理的解耦生成，生成效果更加精细。几何大模型由 Hunyuan3D-DiT 与 Hunyuan ShapeVAE 组成，能够生成高精度白模，几乎接近专业设计师手工建模的水准；纹理大模型 Hunyuan3D-Paint 则采用多视图扩散技术，为模型提供逼真的贴图与材质。

评测数据显示，在 In-the-wild 测试集上，2.0 版本在 CLIP Maximum Mean Discrepancy（CMMD）、Frechet Inception Distance（FID）以及 CLIP-score 等多项指标上均优于目前业界先进的开源或闭源模型。

整体模型比较

几何模型比较

纹理模型比较

值得注意的是，此次同步上线的“混元 3D AI 创作引擎”定位于“低门槛、一站式”。平台功能覆盖了 3D 建模生成、骨骼动画驱动、纹理生成与替换、草图生 3D、3D 人物生成、3D 小游戏创作等多个环节。例如：

文生 3D、图生 3D：输入提示词或上传图片，即可快速生成 3D 模型，可选择不同材质风格，并支持 PBR 贴图，让生成结果更具真实感；
端到端生成低多边形 low-poly 模型：可根据物体复杂度自适应生成数百至数千面的三角面，既保留模型细节，又方便在游戏引擎中渲染；
3D 动画生成：可为角色模型自动绑定骨骼，选择动作模板进行驱动；
草图生 3D：一张简笔画加几句文字描述，即可完成 3D 内容创作；
3D 人物生成：上传一张人像，选择不同主题模板即可生成个性化 3D 形象；
3D 小游戏创作：只需上传头像并选定角色模板，一键生成专属 IP 角色的小游戏动画视频。

此外，创作引擎还支持以“工作流”形式快速搭建 3D 生产管线。用户可以通过节点化搭建，批量生成、编辑 3D 内容，更好地适配游戏美术、动画制作等专业场景。

目前，3D AIGC 技术在游戏制作、社交、电商广告、工业制造、具身智能、自动驾驶、AR/VR 等多个领域已开始加速落地。例如，在游戏开发中，AIGC 工具可以大量生成高质量游戏角色、场景、道具等 3D 资产，以此提高开发效率、缩短制作周期；电商广告可用 3D 生成快速搭建创意商品模型；工业设计中也可借助 AI 大模型验证产品原型。

腾讯游戏在研项目研发制作人王智刚在受访中提到，在游戏制作管线中，特别是美术环节，传统手工方式往往耗时较长，比如一个高精度模型需要数周甚至更久。随着混元 3D 的引入，一些初级模型的制作成本已显著降低，很多时候只需进行少量人工修补即可投入使用。“我们并不指望一开始就让 AI 替代所有流程，这是渐进式的过程，AI 能帮忙解决很多问题，人工再修一下，减少我们的工作量，这是很好的事。”

尽管 3D 生成的应用前景被广泛看好，但腾讯混元 3D 负责人郭春超在受访时亦坦言，3D 视频生成的技术成熟度还未到发展的拐点，但它正快速迭代，视觉合格率仅用一年时间就从 20%提升到 60%的水平。他提到，3D AIGC 目前依然面临数据和技术方面的挑战。

一方面，相比于文本、图像和视频，3D 训练数据的规模相对有限，模型要在“几何+纹理”融合的复杂度上达到更高水平，还需要持续投入和更多场景数据；另一方面，3D 模型本身相对于别的模态约束比较少，与视频在时序上一帧一帧地演进不同，3D 模型可以在空间上任意“转动”“变形”，每一个视角、每一帧都可能是一个独立的全新图像，从技术特点本身而言，要解决的挑战也会更大。

当被问及混元 3D 未来发展方向时，郭春超表示，团队将继续在“纵向深挖”与“横向拓展”两方面发力。“纵向”指的是持续提升单体模型的精度和可控度，“横向”则是继续沿着 3D 内容制作管线的需求，将更多功能模块化、标准化，并与其他模态（如文本、视频）进行深度融合。

发布

暂无评论

创作场景

腾讯混元 3D 生成大模型 2.0 开源发布：大幅升级，几何与纹理解耦，3D 生成更逼真

评论

TiDB 社区专栏：让技术人员成为更好的读者/作家

关于我作为前端报名 TiDB Hackthon 2021 然后被毫无悬念地淘汰这档事

TiDB4PG 之兼容 Gitlab

关于TiDB数据脱敏的一些想法

使用 TiUP 安装部署 TiDB 集群实验流程

探索TiDB Lightning源码来解决发现的bug

TiDB架构浅析

5分钟搞定 MySQL 到 TiDB 的数据同步

伴鱼数据库之MongoDB数据在线迁移到TiDB

使用 KubeSphere 快速部署 Chaos Mesh

DM 分库分表 DDL “悲观协调” 模式介绍

专栏技术文章发布指南&奖励

分布式数据库TiDB在百融云创的探索与实践

Ti-Click：通过浏览器快速搭建 TiDB 在线实验室 | Ti-可立刻团队访谈

TiDB监控Prometheus磁盘内存问题

Dumpling 导出表内并发优化

x86和ARM混合部署下的两地三中心方案验证

回顾下Hackathon中的TiCheck

TiDB BR 备份至 MinIO S3 实战

前缀索引在特殊场景下的优化尝试

发生即看见，一切可回溯 | TiDB 故障诊断与性能排查探讨

大量 SET autocommit 导致的 TiDB Server CPU 高案例

DBA之伤-truncate/drop

有关 TiDB 升级的二三事——教你如何快乐升级

在TiDB中实现一个关键字——Parser篇

TiDB学习之路

TiDB如何修改alter-primary-key参数

带着问题读 TiDB 源码：Power BI Desktop 以 MySQL 驱动连接 TiDB 报错

PlacementRules in SQL 初试

备份的 “算子下推”：TiDB BR 简介

DM 分库分表 DDL “乐观协调”模式介绍

创作场景

腾讯混元 3D 生成大模型 2.0 开源发布：大幅升级，几何与纹理解耦，3D 生成更逼真

评论

更多内容推荐

推荐阅读

电子书

大厂实战PPT下载

推荐阅读