当音乐赶上人工智能 -- 歌手们都在「云竞演」，做曲家就不想试试「云谱曲」？

时间 2020-06-21 标签音乐赶上人工智能歌手都在不想试试谱曲

今年年初电视上不少唱歌类节目采用了一种「云竞演」的方式。其实说白了，这就是利用视频会议让你们分别在本身家里参加节目录制，只不过为了便于不懂技术的人理解，使用了「云竞演」这样的称呼。算法

不过本文咱们要谈的「云谱曲」可没那么简单！并非做曲家在本身家里经过访问某些云服务来谱写优美音乐，而是让任何人，哪怕没有接受过相关训练的普通人，在云服务的帮助下，本身写出好听的旋律来！segmentfault

你从小就有玩音乐的梦？那么来吧，Amazon Web Services (AWS) 挺你，帮你圆梦！网络

寓教于乐，AI 起始并没那么难入门

在2019 AWS re:Invent 技术大会上，AWS 发布了 AWS DeepComposer，这是世界上第一个结合了人工智能生成服务的音乐键盘。本文将介绍该服务，告诉你如何使用预训练的模型快速生成本身的第一个音乐做品。同时你将了解到 DeepComposer 背后的人工智能技术基础知识：生成对抗网络（GAN），并了解如何使用生成对抗网络训练本身的模型。composer

说到这个 DeepComposer，它的背后起始还有一些有趣的故事。人工智能和机器机器学习是近年来的热门话题，但从事有关工做须要了解和掌握模型和算法、代码编写等一系列计算机学科的知识，不少有志于从事该行业的人员所以不得不望而却步。框架

为了帮助更多人学习实用的机器学习知识并从中得到乐趣，AWS 在过去三年里，每一年都发布了一个基于机器学习的设备。机器学习

2017年推出的世界上第一台支持深度学习的摄像头 AWS DeepLens，能够帮助开发人员了解用于机器视觉的机器学习。2018年推出的 AWS DeepRacer，是一种经过强化学习驱动的全自动1/18比例赛车。而2019年发布的此系列第三个做品 AWS DeepComposer，是一种能够配合人工智能生成服务使用的音乐键盘。函数

AWS DeepComposer，谱写华美乐章

AWS DeepComposer 是一款32键，两个八度的 MIDI 音乐键盘。借此，开发人员可使用预训练模型或自建的基于人工智能生成服务的模型为音乐做曲、编排和演奏。性能

除了直接购买硬件形态的 AWS DeepComposer 键盘，任何用户也可使用AWS控制台里的虚拟键盘实现相同玩法。学习

使用 AWS DeepComposer 的主要步骤以下：人工智能

登陆到 AWS 控制台并启动 DeepComposer 服务；
使用音乐键盘弹奏录制简短的音乐旋律，或使用预先录制的音乐旋律；
根据喜欢的音乐类型选择一个预训练或本身经过 SageMaker 产生的生成模型；
使用此模型生成新的由不一样乐器产生的复音成分；
在控制台中播放和录制生成的乐曲；
导出做品为 MIDI 或 MP3格式，随后便可在 SoundCloud 音乐云上共享。

使用预置的模型

下面首先看看如何使用预置模型快速生成咱们的第一个音乐做品。

在美东区打开控制台并开启 DeepComposer 服务，随后跳转 Music Studio。
在这里能够选择预先录制的乐曲，也能够本身使用音乐键盘录制一段旋律。
本例中咱们为你们录制了一段德沃夏克的《新世界》交响曲主旋律，而后能够选择预先训练好的不一样音乐风格模型：古典，爵士，摇滚或流行。
这些模型已经针对大量音乐数据集进行了相应类型的训练，可供咱们直接使用。让咱们试一试给这首旋律换换曲风，选择“爵士”并生成音乐。
几秒钟后，能够看到模型产生的音乐伴奏。随后能够给它们分配不一样乐器：架子鼓，吉他，贝斯低音吉他，并加点弦乐。

接下来，听听成果吧。

这曲子如何？一样，咱们也能够将其改成古典、摇滚或流行的风格。最后，还能够将乐曲导出为 MIDI 或 MP3文件，并在 SoundCloud 账户上分享。

生成对抗网络概览

GAN（Generative adversarial network，生成对抗网络）最先由 Ian Goodfellow 等人于2014年提出，以其优越的性能迅速成为人工智能一大研究热点。

生成对抗网络由两个网络组成的，一个生成器网络（Generator）和一个判别器网络（Discriminator）。在对抗网络框架中，生成器网络模型与判别器网络模型相对立。生成器无权访问数据集，而是使用随机数据，力图生成一个真实数据集的样本。判别模型学习肯定样本是来自模型分布仍是来自数据分布。

生成模型能够被认为相似于一组伪造者，试图生产假冒物品并在未经检测的状况下使用它，而判别模型相似于鉴别人员，试图对物品的真伪作出判断。这两个网络神经网络经过竞争试图超越对方并完成本身的任务。通过数千次迭代后，两个网络同时获得训练变得更好。

生成对抗网络有普遍的使用场景，例如图像生成、艺术品生成、音乐生成和视频生成等等。固然在 DeepComposer 里预置的模型就是这样训练产生的，供咱们使用编曲配器生成特定风格的音乐做品。

以前咱们曾发布过一篇文章，介绍如何利用生成对抗网络合成几乎能够以假乱真的「人类手写笔迹」，感兴趣的童鞋能够点击这里阅读。

训练本身的模型

接下来一块儿看看如何使用生成对抗网络，根据喜欢的音乐数据集训定制模型。咱们须要选择：

生成器和鉴别器的体系结构参数
训练过程当中的损失函数，用于测量算法输出与指望值之间的差别
超参数

在模型训练期间，我能够监控质量指标，收听生成的样本。对模型进行全面训练后，就能够像预先训练的模型同样生成定制的模型，并用它来生成具备独特风格的音乐了。

AWS DeepComposer 这款服务也许将开启您的做曲生涯。请访问这里了解更多相关信息，并注册预览该服务。注册者将在音乐键盘上市时获得电子邮件通知。