写点什么

Meta 开源文本生成音乐 AI:AudioCraft 将文字转化为和声

  • 2023-10-04
    北京
  • 本文字数:900 字

    阅读完需:约 3 分钟

大小:470.08K时长:02:40
Meta 开源文本生成音乐AI:AudioCraft 将文字转化为和声

Meta开源了它的 Text-to-Music 生成式人工智能AudioCraft,供研究人员和从业者训练他们自己的模型,并帮助推动前沿技术的发展。

 

AudioCraft 包含三个不同的模型:MusicGen能够根据文本提示生成音乐;AudioGen能够产生环境声音;EnCodec是一个由 AI 驱动的编码器/量化器/解码器。


今天,我们很高兴地发布了我们的改进版 EnCodec 解码器,它可以用更少的伪像(artifacts)生成更高质量的音乐;这个预训练的 AudioGen 模型可以生成环境声音以及狗叫、汽车喇叭声或木地板上的脚步声等音效;我们将分享所有的 AudioCraft 模型权重和代码。

 

据 Meta 介绍,AudioCraft 能够使用自然界面生成高质量的音频。此外,他们还说,AudioCraft 利用一种新方法简化了音频生成领域最先进的设计。

 

具体来说,AudioCraft 使用 EnCodec 神经音频编解码器从原始信号中学习 Audio Token。这一步从音乐样本创建出了固定“词汇表”(Audio Token),并随后将其传递给自回归语言模型。这个模型训练了一个新的音频语言模型,利用 Token 的内部结构来捕捉它们的长程依赖关系,这对音乐生成至关重要。最后,这个新模型基于文本描述生成新的 Token,并将其反馈到编解码器的解码器以合成声音和音乐。


生成任何类型的高保真音频都需要在不同的尺度上对复杂的信号和模式进行建模。音乐可以说是最具挑战性的音频类型,因为它由局部和长程模式组成,从一组音符到使用多种乐器的整体音乐结构。

 

如前所述,AudioCraft 是开源的,Meta 希望能够帮助研究社区以它为基础做进一步地构建:


坚实的开源基础将有助于推动创新,丰富我们未来制作和收听音频和音乐的方式:想象一下,配有音效和史诗音乐的丰富多彩的睡前故事读物。借助更多的控制,我们认为 MusicGen 可以变成一种新型乐器——就像合成器刚出现时那样。

 

虽然 AudioCraft 的大部分是开源的,但是他们为模型权重选择了CC-BY-NC许可。Hacker News 上有用户指出,该许可限制较多,并不算完全开源

 

具体来说,非商业性使用条款违背了开源倡议对开源的定义中的第六点,这很可能是因为 Meta 使用了 Meta 拥有并特别授权的音乐来计算这些权重。其余组件将在MIT许可下发布。

 

原文链接:

https://www.infoq.com/news/2023/08/meta-text-to-music-generative-ai/

2023-10-04 08:006146

评论

发布
暂无评论
发现更多内容

a豆14 Pro高性能高颜笔记本,新潮配色助力打造a豆AIoT智能生态圈

科技热闻

华硕a豆召开智能生态发布会,软硬兼施解锁智能新生活

科技热闻

Go-Excelize API源码阅读(十二)——SetSheetVisible(sheet string, visible bool)

Regan Yue

Go 开源 源码刨析 8月日更 8月月更

【云原生】SpringCloud Alibaba 之 Nacos注册中心实战

Bug终结者

Java 分布式 SpringCloud 8月月更

docker下,极速搭建spark集群(含hdfs集群)

程序员欣宸

spark 8月月更

面试突击75:SpringBoot 有几种读取配置文件的方法?

王磊

Java 常见面试题

STM32入门开发:编写XPT2046电阻触摸屏驱动(模拟SPI)

DS小龙哥

8月月更

要相信自己可以解决问题

FunTester

都说MySQL单表不要超过2000W行,这是真的吗?

Java全栈架构师

Java MySQL 数据库 程序员 面试

面试突击:SpringBoot 有几种读取配置文件的方法?

Java编程日记

Java Spring Boot java程序员 java面试 面试突击

Web3 结算协议 Zebec Protocol 的商业模式与发展前景一览

BlockChain先知

Web3 结算协议 Zebec Protocol 的商业模式与发展前景一览

鳄鱼视界

加码企业服务,阿里云发布计算巢加速器

阿里云弹性计算

PaaS 企业服务 计算巢 ISV

App切换到后台后如何保持持续定位?

HarmonyOS SDK

Java基础之Java枚举

自然

Java core 8月月更

CAT认证敏捷团队教练工作坊 (Coaching Agile Teams) | 9月24日开课

ShineScrum

敏捷教练 专业教练 团队教练 GROW Model

Java性能优化的七个方向

小柴说Java

编程 JVM Java性能调优 Java性能优化

京东商品获取优惠券API接口-京东优惠券如何获取-京东联盟API接口

江苏京酷电子商务有限公司

json API 京东商城

不是吧,还有人不知道三目运算符的BUG

自然

基础 8月日更 8月月更

RocketMQ高可用设计之消息发送重试

急需上岸的小谢

8月月更

Redis分布式锁-觉悟吧,红锁!

知识浅谈

redis分布式锁 8月月更

计算机网络(一、概述)

计算机网络 8月月更

每日一R「08」类型系统(二)

Samson

8月月更 ​Rust

开源一夏 | 使用 Three.js 实现"雪糕"地球,让地球也凉爽一夏

战场小包

JavaScript 开源 前端 3D ThreeJS

小菜鸟河北联通上岗培训随笔二

乌龟哥哥

8月月更

再见MybatisPlus,阿里推出新ORM框架!

TimeFriends

8月月更

元宇宙系统源码——测试方案

开源直播系统源码

软件测试 软件开发 元宇宙

Java基础知识(一些需要注意的点)

自然

基础 8月月更

干货|语义网、Web3.0、Web3、元宇宙这些概念还傻傻分不清楚?(下)

Orillusion

WebGL 元宇宙 Metaverse webgpu #开源

[极致用户体验] 用户体验好的 Button,在手机上不应该有 Hover 态

HullQin

CSS JavaScript html 前端 8月月更

Meta 开源文本生成音乐AI:AudioCraft 将文字转化为和声_生成式 AI_Sergio De Simone_InfoQ精选文章