HarmonyOS开发者限时福利来啦!最高10w+现金激励等你拿~ 了解详情
写点什么

OpenAI 又搞新动作!新型神经网络模型 MuseNet 让所有人都能玩转音乐

  • 2019-04-27
  • 本文字数:1918 字

    阅读完需:约 6 分钟

OpenAI又搞新动作!新型神经网络模型MuseNet让所有人都能玩转音乐

今日,OpenAI——由诸多硅谷大亨联合建立的非营利性人工智能研究组织——对外发布了一款新型深度神经网络模型 MuseNet,该模型不但可调用 10 种不同乐器生成时长约 4 分钟的音乐作品,而且能够融合从乡村到莫扎特再到披头士等各种音乐风格。


据悉,MuseNet 并非基于我们对音乐的理解进行编曲,而是通过学习预测数十万 MIDI 文件中下一个音符,来找到和声、节奏和曲风的模式。与 GPT-2 相似,MuseNet 同样采用多功能无监督技术。GPT-2 是一种大规模 transformer 模型,经过训练即可预测音频以及文本序列中的下一个音符。

邀你试玩 MuseNet

打开 MuseNet,进入简单模式(显示为默认值),你将听到该模型预先随机生成的音乐样例。然后自行选定一个作曲家或风格,从一段名曲里选择一个起始位置,即可开始生成音乐,它允许用户探索该模型可以创建的各种音乐风格。进入高级模式,用户则可以与模型直接进行交互,当然这样一来,一首乐曲会耗费更多的创作时间,但最终却可以生成一部全新的作品。


MuseNet 所掌握的曲风众多,因此能让音乐玩家用新颖的方式将几代音乐人融合在一起。比如,我们在模型中选取肖邦夜曲的前 6 个音符,并输入命令,要求生成一个由钢琴、鼓、贝斯和吉他演奏出的流行音乐作品,MuseNet 最终就能将两种曲风完美交融,并让乐队在 30 秒左右插入。


OpenAI 方面介绍说,在现阶段,初版的 MuseNet 曲库只收录了部分作曲家,非常欢迎音乐家和普通玩家在 5 月 12 日之前进行免费体验,也期待看到大家如何用 MuseNet 玩转音乐,随后,OpenAI 将根据玩家的反馈对模型进行优化。

作曲家和器乐曲谱写 token 为音乐玩家赋能

为给用户赋能,让用户能够更加灵活地控制 MuseNet 生成的样例,研发团队还创建了作曲家与器乐曲谱写 token。在训练期间,这些作曲家与器乐曲谱写 token 会被预先添加到每个示例中,因此模型将学会使用这些信息来预测音符。在乐曲生成时,通过诸如“拉赫玛尼诺夫钢琴开头”这样的提示符,就可以开始训练模型根据所选风格来创建样例了。然后,可通过将 MuseNet 嵌套可视化,来深入了解该模式已经学会了什么。

初版 MuseNet 尚存两点局限性

但 OpenAI 也坦诚,目前这款音乐生成工具只是初具雏形,MuseNet 的局限性包括:


首先,用户需要明确一点,对 MuseNet 而言,他们在模型中所选择的乐器仅仅是建议,而非是一定被满足的要求。这是因为 MuseNet 生成的每一个音符都是通过对所有音符和乐器的组合概率进行计算方才确定。虽然该模型会尽力调整,以便使用户所做的乐器选择成为可能,但这并不能保证它不会做出别的选择。


另外,当用户选择的曲风和乐器组合起来比较古怪时,比如,选择贝斯和鼓来演绎肖邦,这可就给 MuseNet 出了难题。所以,选择与作曲家或乐队原始风格最接近的乐器,模型最后生成的作品才会更加自然。

历数 OpenAI 的那些研发成果

OpenAI 是一家非营利性人工智能研究组织,正式成立于 2015 年 12 月,总部位于旧金山。区别于以盈利为目的的传统企业,OpenAI 致力于将其研究的内容进行开源分享,立足于最大限度造福全人类的目的来发展人工智能。


回顾这些年,OpenAI 也确实言出必行,研发成果源源不断。


  • 2019 年 4 月,开发出一种深层神经网络 Sparse Transformer,能够预测序列中接下来将要出现的内容——包括文本、图像以及声音等。其利用 attention 机制的改进算法,能够在相当于以往最大周期的 30 倍的长序列当中提取模式。

  • 2019 年 3 月,发布大型强化深度学习模拟器 Neural MMO,一款”大型多角色”虚拟训练场景游戏,把 AI 代理放进一个类似于 RPG(角色扮演游戏)的模拟场景中,AI 们会互相竞争,通过战争来抢夺有限的资源,从而得到优化。

  • 2019 年 2 月,创建文本生成器 GPT-2,该自然语言模型经过 40 千兆字节互联网文本样本的训练,可预测下一个单词。

  • 2018 年 3 月,发布一种元学习算法 Reptile。该算法通过对任务进行重复采样并执行随机梯度下降,将初始参数更新为在该任务上学习到的最终参数。OpenAI 官博表示这种方法与 MAML(一种广泛适用的元学习算法 )一样好用,但执行起来更简单,计算效率更高。

  • 2016 年 5 月,发布开源人工智能研究工具集 OpenAI Gym 的公开测试版本,该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。


但随着 OpenAI 于上个月在官方博客宣布进入重组状态,成为一家“有限利润(capped-profit)”的公司,不少业内人士均表示担心,此举是否会造成 OpenAI 在未来不再继续 Open ?也许,只有保持研究成果的持续开源,才能逐步打消人们心中的顾虑。


而本文这款新型深度神经网络模型 MuseNet 的发布,以及邀请大众自由参与、免费体验的开放态度,无疑是继重组架构风波后,OpenAI“自证清白”的有力一步。


参考链接:


https://openai.com/blog/musenet/


2019-04-27 11:005007

评论

发布
暂无评论
发现更多内容

IT外包服务的未来发展趋势

Ogcloud

IT 外包公司 外包项目 IT 运维

掌握HarmonyOS框架的ArkTs如何管理和共享状态数据

华为云开发者联盟

开发 华为云 华为云开发者联盟 HarmonyOS框架

从零实现一个在线相亲APP(缓解相亲尴尬的神器)

音视频开发_AIZ

打工人福音:未来每周只需工作3天?比尔盖茨这样评价AI...

代码生成器研究

Open AI 砸了所有人的饭碗吗?

代码生成器研究

直播预告丨大模型如何在健康医疗中挖出大大的花?

京东科技开发者

人工智能 大模型

编程那么难,为什么不弄个大众一学就会的计算机

代码生成器研究

获取体育比分、赛事直播源的途径,以及数据API接口的应用

软件开发-梦幻运营部

Rust std fs 比 Python 慢!真的吗!?

Databend

MySQL数据库,RDBMS术语,使用说明和报错解决的详细讲解?

百度搜索:蓝易云

MySQL 云计算 运维 RDBMS 云服务器

ubuntu20.4服务器安装mysql社区版并开放3306端口

百度搜索:蓝易云

MySQL 云计算 Linux ubuntu 云服务器

KubeBlocks与OceanBase完成产品兼容互认,可以使用KubeBlocks管理你的OceanBase集群啦!

小猿姐

滴滴遭遇重击:12小时内损失千万订单量与超4亿成交额,背后有何启示?

EquatorCoco

滴滴 崩溃分析 滴滴出行

为什么越来越多的企业选择IT外包服务?

Ogcloud

外包 IT 外包公司 外包项目 IT 运维

面向对象编程的弊端是什么?

代码生成器研究

WPF应用开发之附件管理

快乐非自愿限量之名

开发者 微服务附件 开源WPF项目

如何解决在使用虾皮Shopee店铺详情API接口时遇到的问题?

技术冰糖葫芦

API 文档

飞书深诺接口自动化测试落地实战

飞书深诺技术团队

质量 AIGC #人工智能

整车级虚拟标定:降本增效

DevOps和数字孪生

汽车产业 虚拟汽车

要做职业规划么?我的三个机遇以及一个坚持

非晓为骁

个人成长 职业规划 坚持 目标 工作思考

2023~2024第三届瑞云渲染3d创造大赛报名方法

Renderbus瑞云渲染农场

云渲染 渲染农场 云渲染平台 3d渲染比赛

C# 泛型编译特性对性能的影响

快乐非自愿限量之名

c 编程语言 编译

虾皮Shopee店铺详情API接口返回的数据包括哪些信息?

技术冰糖葫芦

API 开发

全球79%的程序员都在考虑跳槽,你呢?

秃头小帅oi

程序员 低代码 开发

如何绕过某讯手游保护系统并从内存中获取Unity3D引擎的Dll文件

雪奈椰子

人工智能的技术研究与安全问题的深入讨论

不在线第一只蜗牛

人工智能 安全 信息安全

亚马逊云科技:探索未来云计算之窗

快乐非自愿限量之名

云计算 云原生 亚马逊云

低代码可以减少程序员哪些工作?

代码生成器研究

OpenAI又搞新动作!新型神经网络模型MuseNet让所有人都能玩转音乐_AI&大模型_Christine Payne_InfoQ精选文章