写点什么

AI 复活的那些“失落艺术”

  • 2019-12-19
  • 本文字数:2440 字

    阅读完需:约 8 分钟

AI复活的那些“失落艺术”

这世上总是避免不了遗憾,但终归有些美好会在“不经意间”补全。AI 技术的存在,为这种补全,提供了新的选项。


喜欢古典音乐的朋友,想必对贝多芬都有着一些了解,然而令人遗憾的是,这位扼住命运喉咙的男人,终归是在其完成《第十交响曲》的前夕,溘然长逝。不过,近期的一则消息或许让这一遗憾出现新的转机:《第十交响曲》将由人工智能完成,而这项实验的结果也将由一支完整的交响乐团在 2020 年 4 月 28 日在德国贝多芬的出生地波恩公开奏演。


你会去听 AI 续写的《第十交响曲》吗?

时值贝多芬诞辰 250 周年之际,为纪念这位伟大作曲家为人类音乐艺术留下的宝贵财富,一个国际化的团队将利用 AI 技术续写贝多芬生前未完成的《第十交响曲》。


为了还原或者说是创作经典,一群音乐学家和程序员聚在一起,通过贝多芬未完成的《第十交响曲》和《英雄》等作品的片段来训练人工智能,然后由 AI 即兴创造出《第十交响曲》剩余的部分。


Herbert von Karajan 研究所所长、项目负责人 Matthias Roeder 对《法兰克福周日新闻》说:长久以来,机器从来没完成过这样的任务,这是史无前例的一次尝试。


Roeder 还表示,该 AI 算法正在取得积极进展,它无时无刻不在变化,就像一个懵懂的小孩子在探索贝多芬的世界。但令人遗憾的是,我们并没有找到该算法的具体细节。


贝多芬谱写了著名的《第九交响曲》,家喻户晓的《欢乐颂》就是《第九交响曲》其中的一部分。有证据表明,他生前仍然还在创作《第十交响曲》。但遗憾的是,当这位德国作曲家于 1827 年去世时只留下了部分草稿和笔记。

技术角度的 AI 作曲

所谓 AI 编曲和作曲,本质上是运行一个复杂的 AI 模型,来对不同的音乐、乐器、节奏、乐理等规则进行学习和反向输出。而且 AI 作曲也并非独一无二的技术,在今年 2 月份,华为就凭借迁移到 Mate20Pro 上的 AI 模型,续写了舒伯特的《d小调第8号交响曲》,并在伦敦的一场音乐会上进行了公演。


华为工作人员阿尔内·赫克尔曼表示,利用 AI 作曲,就像教孩子学习一门语言,开始的时候,他们会犯错误,纠正后还会犯新的错误,所以需要不断地纠正、不断地重复。

OpenAI 的 MuseNet 模型

今年 4 月,OpenAI 也对外发布了一款新型深度神经网络模型 MuseNet,该模型不但可调用 10 种不同乐器生成时长约 4 分钟的音乐作品,而且能够融合从乡村到莫扎特再到披头士等各种音乐风格。


据悉,MuseNet 并非基于人们对音乐的理解进行编曲,而是通过学习预测数十万 MIDI 文件中下一个音符,来找到和声、节奏和曲风的模式。与 GPT-2 相似,MuseNet 同样采用多功能无监督技术。GPT-2 是一种大规模 transformer 模型,经过训练即可预测音频以及文本序列中的下一个音符。


相关 Github 地址:https://github.com/MrCheeze/musenet-midi

微软小冰

小冰的起步较早,在去年 KDD 2018 大会上,微软小冰团队的论文《XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music》(《小冰乐队:流行音乐的旋律与编曲框架》 )就获得了 Research Track 最佳学生论文。


论文中提到,微软团队设计了一种基于和弦的节奏和旋律交叉生成模型(CRMCG),可以生成带有和弦进行的旋律。而且还提出一种基于多任务学习的多乐器协同编曲模型(Multi-Instrument Co-Arrangement Model,MICA)。


另外,微软小冰的 AI 音乐才华出众,目前已发布数十首接近人类演唱水平的单曲,演唱模型迭代至第五个版本。全新的演唱模型,包括跨越多种演唱技巧的多个声音模型,并提升人工智能歌曲演绎的更高技巧和多风格化,实现了在不同的演唱技巧之间自然过渡。


相关 Github 地址:https://github.com/BennyThink/realXiaoice

AI 在行动

除了续写音乐残篇,AI 还可以从另一个方面发挥作用,比如修补名画、修复老旧照片等。

名画修补


《根特祭坛画》


著名的艺术珍品《根特祭坛画》,自完成之后便历经磨难,但在 AI 技术的加成下,名画修补成为了一件轻松的事。


在根特祭坛画的修复中, 利用 X 射线图像扫描技术进行成像是常见的修复技术,但如何将混合了双面板的 X 射线图像,分离成相应单面 X 射线图像是一个巨大的挑战。为此,伦敦大学和杜克大学的研究者们,提出了一种基于卷积神经网络(CNN)的自监督框架,


这种自我监督的神经网络,可以学习如何将 RGB 图像转换为 X 射线图像,然后作为单面板的虚拟图像“重建”,然后通过最小化重建 X 射线图像的误差,比较与原始混合的 X 射线图像之间的差异,进而让模型实现这种分离。


具体细节上,他们构建了七层的 CNN ,每个卷积层之间含有批量归一化和整流线性单元(ReLU)激活层。网络的结构受到了 pix2pix 结构启发(pix2pix 使用条件对抗网络进行图像到图像转换)。



将 RGB 图像转换为 X 射线图像的神经网络结构

增强与修复照片

日前,一组林青霞的照片引起了不小的讨论,而“AI 老照片修复”也逐渐进入到大众的视野。事实上,相对于名画修补,老旧照片的修复可能相对而言较为简单。


InfoQ 在《一键高清还原老照片:全方位解读美图影像实验室 MTlab 人像画质修复技术》一文中对相关技术进行了揭秘,总结来讲,美图的相关修复技术主要是借鉴了深度学习技术,如降噪、增强、超分、强化学习等,在自研生成网络结构 BeautyGAN 的基础上,结合对抗式生成网络的前沿技术,使 BeautyGAN 具备良好的人像修复能力。


另外,美图影像实验室 MTlab 已经对外正式发布了“美图 AI 开放平台”( ai.meitu.com ),而且据美图技术人员透露,目前的美图 AI 开放平台开放了人脸技术、人体技术、图像识别、图像处理、图像生成等几大类核心 AI 技术。这些技术可通过云端 API/ 移动端 SDK/ 定制解决方案等多种方式对外提供经过市场验证的专业 AI 算法服务。


写在后面

AI 技术的快速发展是好事,对经典、艺术的再加工亦可以实现更多的美好。但是,AI 技术本身就是一把“双刃剑”,在一切美好背后也会隐藏着“作恶之心”,Deepfake的滥用就是一个很显而易见的例子。至于如何让这把“剑”利已不伤人,在“弥补遗憾”的同时不去“作恶”,这将是未来很长一段时间我们需要思考和解决的问题。


2019-12-19 08:10963
用户头像
张之栋 前InfoQ编辑

发布了 91 篇内容, 共 42.8 次阅读, 收获喜欢 157 次。

关注

评论

发布
暂无评论
发现更多内容

不懂 ZooKeeper?没关系,这一篇给你讲的明明白白

大头星

Mysql学习笔记:分库分表(sharding)

马迪奥

MySQL Sharding

区块链合约层是一种自动执行的数字协议

CECBC

区块链 智能合约

USDT跑分承兑系统开发,区块链支付平台搭建

我写了一个TypeScript虚拟机。

渔子长

Java typescript 大前端 deno Node

音乐创作者必备软件,轻松玩转原创

奈奈的杂社

音乐制作 编曲 电音 作曲 乐团

云图说 | 华为云GPU共享型AI容器,让你用得起,用得好,用的放心

华为云开发者联盟

gpu caffe

用Go-Guardian写一个Golang的可扩展的身份认证

朱亚光

微服务 身份认证 Go 语言

设计模式只是一把锤子

博文视点Broadview

读书笔记 编程 面向对象 设计模式

所见即所得的用户增长技术背后是如何实现的

代立冬

大数据 用户增长 用户增长技术 ad-hoc技术

拥抱K8S系列-07-部署K8S集群(Rancher)

张无忌

Kubernetes rancher

Mysql学习笔记:InnoDB索引结构浅析

马迪奥

MySQL 索引结构 innodb

如何让知识图谱告诉你“故障根因”

华为云开发者联盟

华为云 知识图谱 图谱

彻底理解JavaScript执行上下文

Walker

Java 大前端 this指针 函数执行

LeetCode题解:206. 反转链表,双指针,JavaScript,详细注释

Lee Chen

大前端 LeetCode

在Ubuntu 20.04 搭建 Django 开发环境 以及 快速构建一个简单的 Blog

Matrix Chan

Python django 后端 Ubuntu20.04

解Bug之路-记一次JVM堆外内存泄露Bug的查找

无毁的湖光

Linux JVM heap memory GC Linux Kenel

SpringBoot写后端接口,看这一篇就够了!

华为云开发者联盟

后端 swagger pringboot

架构师期末作业

傻傻的帅

知识点总结

Acker飏

两年Java工作经验涨到23K,这究竟是怎么做到的?

Java架构师迁哥

如何正确设置Java.home

谷鱼

区块链技术最重要价值所在

CECBC

区块链 数字经济 互联网革命

区块链交易系统开发,期货合约平台搭建

@所有人 Flink Forward Asia 2020 向您发出议题征集邀请!

Apache Flink

flink

我敢说,这个版本的斗地主你肯定没玩过?

华为云开发者联盟

命令行 游戏 斗地主

区块链技术与我们的生活将并存

CECBC

区块链 数字经济

端-边-云全面协同创新 英特尔携手百度共推产业智能化升级

新闻科技资讯

开源决策树工具xDecision简介

赫杰辉

决策树 可视化 简化代码

滴滴基于 Flink 的实时数仓建设实践

Apache Flink

flink

Netty之旅三:Netty服务端启动源码分析,一梭子带走!

一枝花算不算浪漫

Netty

AI复活的那些“失落艺术”_AI_张之栋_InfoQ精选文章