
本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。

截图源自 Hugging Face(截止 4 月 24 日)
它叫 HiDream-I1,由初创公司「智象未来」打造:
Hugging Face 文生图模型趋势榜第一;Artificial Analysis 榜单上第三(截止 4 月 24 日)
关键是,它是完全开源 + 可商用 + 支持部署的国产模型
据悉,HiDream.ai 智象未来团队规模仅 50 人左右,却已构建出业内领先的多模态版权语料库,并将模型训练 ROI 优化至业内平均水平的 1/5,可谓“小团队高 ROI”。
令人期待的是,交互式图像编辑大模型 HiDream-E1 也即将在近期开源。据官方介绍,它与 HiDream-I1 一起,真正实现“言出法随”。二者将图像的生成、理解和交互式编辑都融入到对话大模型中,让用户可以用对话聊天的形式来生成图片,并使用自然语言对图片内容进行相应的编辑,这是图像生成功能的又一次升级,进一步降低了使用 AIGC 工具进行创作的门槛。
InfoQ 非常荣幸地邀请到了智象未来技术总监潘滢炜,他将于 6 月 27-28 日在 AICon 北京站上带来精彩分享:
演讲主题:多模态内容生成:从技术突破到创新应用落地
看点抢先看👇
多模态内容生成技术的前沿动态
智象多模态大模型的关键技术升级
多模态生成如何赋能设计、营销、影视、文旅等应用场景
不做等风来的人:在多模态还没到 100 分之前,如何抓住“做应用”的黄金窗口,用技术打通内容创作的“最后一公里”

评论