写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

2023-01-05 11:436619
用户头像
李冬梅 加V:busulishang4668

发布了 1002 篇内容, 共 615.5 次阅读, 收获喜欢 1178 次。

关注

评论

发布
暂无评论
发现更多内容

巧用SQL拼接语句

Simon

MySQL sql

一个人的精益

escray

学习 面试

从雕像到肖像画,这位设计师用 GAN 和 PS 复原了他眼中的古罗马皇帝「群像」

程序员生活志

高频面试题——你真的搞懂物理内存与虚拟内存了吗

大柚子

操作系统 内存管理 虚拟内存 物理内存

ARTS 打卡第二周(200518-200524)

老胡爱分享

ARTS 打卡计划

ARTS挑战打卡第六周(200615-200621)

老胡爱分享

ARTS 打卡计划

当地铁站都比你更努力

escray

学习 面试

程序员不愿996,创建6个涉黄平台,涉案5000余万元!

程序员生活志

程序员

Redis追命连环问,你能回答到第几问?(上)Redis简介,数据类型及缓存雪崩缓存击穿缓存穿透

大柚子

Java redis 缓存 面试 后端

ARTS挑战打卡第八周(200629-200705)

老胡爱分享

ARTS 打卡计划

朱嘉明 算力革命背后是分配制度革命 没有算力就没有未来

CECBC

区块链 数字货币 数字经济

小米的护城河

石云升

小米 护城河

ARTS 打卡第四周(200601-200607)

老胡爱分享

ARTS 打卡计划

MySQL如何快速插入数据

Simon

MySQL 数据库

企业信息化到底重不重要?

代码制造者

低代码 零代码 信息化 编程开发 运营管理

马方业:区块链就是新未来 区块链就是新财富

CECBC

区块链 新未来 新财富

ARTS挑战打卡第五周(200608-200614)

老胡爱分享

ARTS 打卡计划

JeecgBoot手记

卧石漾溪

ARTS 挑战打卡第七周(200622-200628)

老胡爱分享

ARTS 打卡计划

Truncate用法详解

Simon

MySQL

非IT行业大企程序员讲述MIS系统开发案例

Philips

Java 企业信息化 .net core 计算机程序设计艺术 企业开发

定时任务最简单的3种实现方法(超实用)

王磊

Java 定时任务

一文讲透布隆过滤器

架构精进之路

布隆过滤器

Axure导出为PDF

波菠菜

浅谈备受开发者好评的.NET core敏捷开发工具,讲讲LEARUN工作流引擎

Learun

工作流 开发工具 计算机程序设计艺术 表单

深圳区块链支付系统开发,USDT支付系统服务商

13530558032

交易所合约跟单开发方,数字资产合约跟单系统搭建

13530558032

ARTS 打卡第三周(200525-200531)

老胡爱分享

ARTS 打卡计划

用科学的方法理解每日优鲜

石云升

新零售 每日优鲜 多快好省 科学分析

教你用SQL实现统计排名

Simon

MySQL

区块链交易所系统开发内容,数字货币交易所搭建

13530558032

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章