腾讯混元大模型语言大模型、文生图大模型、文生 3D 大模型以及文生视频大模型等多个模态模型均已开源。腾讯云副总裁,腾讯混元大模型负责人刘煜宏在 2024 开放原子开发者大会暨首届开源技术学术大会上表示,腾讯将开源协同作为公司的核心技术战略,积极推动内外部技术开源共享。未来,腾讯大模型各版本也将进一步开源,与社区开发者一起共同推动技术生态繁荣发展。
腾讯混元大模型的开源模型已经全面覆盖文生文、文生图、文生 3D 以及文生视频多个模态,是开源系列模型中较全的,其模型性能也得到了开源社区的高度认可,总 GitHub Star(星星)数量近 1.4 万颗,并且多次登顶趋势榜。
其中,腾讯混元文生图大模型在国内外衍生数量达 1600 多个,GitHub Star 超过 3700,凝聚了数千名核心开发者。腾讯混元 large 模型开源五天内在 HugginFace 百万模型中脱颖而出,登趋势榜榜首,GitHub Star 达 1300。腾讯混元 3D 模型 GitHub Star 数达到 2500,开源两周内成为 HuggingFace 下载增速最快的 3D 模型。
此外,腾讯混元文生视频大模型 GitHub Star 已超过 6300 ,发布后迅速登上开源趋势热榜,社区开发者还主动改进了多个衍生版本。加州大学圣地亚哥分校(UCSD)的 Hao AI 实验室研究员基于腾讯混元开源视频生成模型发布 FastHunyuan 版本,新模型仅用 1 分钟就能生成 5 秒长的视频,比之前提速 8 倍,步骤也从 50 步减少到了 6 步,有效降低了模型应用门槛。
2024 年 5 月,腾讯旗下的混元文生图大模型全面升级并率先对外开源,包含模型权重、推理代码、模型算法等完整模型,属业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解。 评测数据显示,腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,成为当时效果最好的开源文生图模型。
11 月,腾讯混元宣布最新的 MoE 模型“混元 Large“以及混元 3D 生成大模型“ Hunyuan3D-1.0”开源,支持企业及开发者精调、部署等不同场景的使用需求。腾讯混元 Large 是当时开源领域参数规模最大、效果最好的 MoE 模型,而腾讯混元 3D 生成大模型则是业界首个同时支持文字、图像生成 3D 的开源大模型。两个模型均属腾讯自研,在架构、算法、数据等方面有独特创新,填补了行业空白。
12 月,腾讯混元生成视频大模型宣布开源,参数量 130 亿,是当前最大的视频开源模型,开源内容包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,节约大量人力及算力。
腾讯方面表示,开源协同是公司的核心技术战略,腾讯通过代码的开源和协作,持续推动技术高效创新、开放共享。据悉,在腾讯内部,开源协同小组已经超过 150 个,覆盖人工智能、大数据、数据库等技术领域。对外,腾讯主导近 200 个对外开源项目,吸引超 50 万开发者关注。
评论