QCon北京「鸿蒙专场」火热来袭!即刻报名,与创新同行~ 了解详情
写点什么

谷歌推出文本到图像模型 Muse:生成图片质量更高、推理时间更短

  • 2023-01-05
    北京
  • 本文字数:654 字

    阅读完需:约 2 分钟

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如DALL-E-2Stable DiffusionMidjourney等)的诞生,人工智能研究的进展发生了革命性的变化。

 

近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。 

 

我们提出 Muse,一种文本到图像的 Transformer 模型,可实现先进的图像生成性能,同时比扩散或自回归模型更有效。

——谷歌 Muse AI 团队

 

据开发团队介绍,与 Imagen DALL-E 2 等像素空间扩散模型相比,Muse 由于使用离散标记并且需要更少的采样迭代,因此效率显着提高;与 Parti 和其他自回归模型不同,Muse 利用了并行解码。 为了生成高质量的图像并识别物体、它们的空间关系、姿态、基数等视觉概念,使用预训练的 LLM 可以实现细粒度的语言理解。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 的 900M 参数模型在 CC3M 上实现了新的 SOTA,FID 得分为 6.06。Muse 3B 参数模型在零样本 COCO 评估中实现了 7.88 的 FID,以及 0.32 的 CLIP 分数。Muse 还可以直接启用许多图像编辑应用程序,而无需微调或反转模型:修复、修复和无蒙版编辑。

 

Muse 模型能够根据文本提示快速生成高质量图像:在 TPUv4 上,512x512 分辨率为 1.3 秒,256x256 分辨率为 0.5 秒。

 

根据 MUSE 的基准测试可以看出,Muse 的推理时间明显低于竞争模型。

 


参考链接:

 

https://muse-model.github.io/

https://dataconomy.com/2023/01/google-muse-ai-explained-how-does-it-work/

2023-01-05 11:436674
用户头像
李冬梅 加V:busulishang4668

发布了 1044 篇内容, 共 657.6 次阅读, 收获喜欢 1209 次。

关注

评论

发布
暂无评论
发现更多内容

CPU 高负载故障演练

腾讯云混沌演练平台

混沌工程 cpu飙满

位列云数据库领导者象限!天翼云以科技赋能千行百业数字化转型!

编程猫

解读 Sobit v2:铭文资产跨链更注重安全、易用性

加密眼界

ChatGPT以“人”的身份被《自然》杂志社选为2023十大故事

B Impact

解读 Sobit v2:铭文资产跨链更注重安全、易用性

BlockChain先知

面朝欧洲,迈上“云桥”,走一条无忧丝路

脑极体

出海

左耳听风 - 中年危机「读书打卡 day 03」

Java 工程师蔡姬

读书笔记 程序员 读书 中年危机 左耳朵耗子

极狐GitLab x 智众医疗 | 成为3.5亿慢病患者的健康管家

极狐GitLab

解读 Sobit  v2:铭文资产跨链更注重安全、易用性

股市老人

解读 Sobit v2:铭文资产跨链更注重安全、易用性

石头财经

自带恒压恒流环路的降压型单片车充专用芯片

芯动大师

Google Adsense探索系列_第一弹

fkys

Google adsense ads.txt not found 未找到

【新手入门】软件工程师必备技能-代码review调试定位问题

极客罗杰

强大的iOS系统恢复:Fix My iPhone最新激活

胖墩儿不胖y

Mac软件 修复软件 iOS修复工具

系统存储架构升级分享

京东科技开发者

概念回顾:MQTT?

NGINX开源社区

nginx 物联网 HTTP TCP/IP mqtt

幸福是什么

Geek_35a87b

自我

张瑞敏新书《永恒的活火》:没有完美产品,只有向完美迭代的场景

B Impact

文心一言 VS 讯飞星火 VS chatgpt (175)-- 算法导论13.3 4题

福大大架构师每日一题

福大大架构师每日一题

万界星空科技家具制造业MES系统解决方案

万界星空科技

生产管理系统 mes 家居设计 万界星空科技mes 家具生产管理系统

数据采集才是MES系统中的核心功能

万界星空科技

数据采集 MES系统 mes 设备管理 万界星空科技mes

【分布式技术专题】「授权认证体系」深度解析OAuth2.0协议的原理和流程框架实现指南(授权流程和模式)

码界西柚

oauth2.0 分布式技术 2024年第七篇文章 授权认证协议

QCN9274: A new generation core force in wireless communications

wallysSK

内容分发策略与 SEO 优化指南

小万哥

程序人生 软件工程 后端开发 内容分发 技术写作

8.5亿美元年收入,Anthropic能搞定Notion、Quora,真行

B Impact

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短_文化 & 方法_李冬梅_InfoQ精选文章