Python 提取音乐频谱并可视化

你有没有常常好奇一些音乐软件的频谱特效是怎么作的,为何作的这么好看?有没有想试试本身提取音乐频谱并可视化展示出来?今天,咱就结合上次的音乐剪辑操做:python

Python 剪辑音乐就是这么简单编程

来可视化下面这首歌曲的频谱!编辑器

1.准备工做

开始以前,你要确保Python和pip已经成功安装在电脑上,若是没有,请访问这篇文章:超详细Python安装指南 进行安装。spa

Windows环境下打开Cmd(开始—运行—CMD),苹果系统环境下请打开Terminal(command+空格输入Terminal),准备开始输入命令安装依赖。code

固然,我更推荐你们用VSCode编辑器,把本文代码Copy下来,在编辑器下方的终端装依赖模块,多舒服的一件事啊:Python 编程的最好搭档—VSCode 详细指南教程

输入如下命令安装本文所须要的依赖模块:事件

pip install pydub
pip install librosa

看到 Successfully installed xxx 则说明安装成功。ip

2.频谱展现

使用librosa和matplot,咱们能够用10行代码完整地展现整个频谱:rem

import matplotlib.pyplot as plt
import librosa.display

# 音乐文件载入
audio_path = 'Fenn.mp3'
music, sr = librosa.load(audio_path)

# 宽高比为14:5的图
plt.figure(figsize=(14, 5))
librosa.display.waveplot(music, sr=sr)

# 显示图
plt.show()

不过,这样的频谱是整段音乐的,看起来很是难看,接下来咱们使用 pydub 切割频谱,以得到更佳的效果。咱们细分到0到1秒的区段来查看频谱:get

import matplotlib.pyplot as plt
import librosa.display
import numpy as np
from pydub import AudioSegment

# 1秒=1000毫秒
SECOND = 1000
# 音乐文件
AUDIO_PATH = 'Fenn.mp3'

def split_music(begin, end, filepath):
    # 导入音乐
    song = AudioSegment.from_mp3(filepath)
    
    # 取begin秒到end秒间的片断
    song = song[begin*SECOND: end*SECOND]
    
    # 存储为临时文件作备份
    temp_path = 'backup/'+filepath
    song.export(temp_path)

    return temp_path

music, sr = librosa.load(split_music(0, 1, AUDIO_PATH))

# 宽高比为14:5的图
plt.figure(figsize=(14, 5))
librosa.display.waveplot(music, sr=sr)
plt.show()

这下细是细了,可是仍是太复杂了,其实咱们作频谱的展现,只须要正值便可:

而后咱们还能够进一步放大,好比说0.9秒到1秒之间的频谱:

放大

n0 = 9000
n1 = 10000

music = np.array([mic for mic in music if mic > 0])
plt.figure(figsize=(14, 5))
plt.plot(music[n0:n1])
plt.grid()

显示图

plt.show()

这样好看许多,不过若是要达成QQ音乐那种效果,仍是须要进行大量改造。

好比用精美的图像元素来填充替代、而后零值如何处理?如何让频谱更加平稳?此外,咱们是静态的图像,还须要根据事件动态地延续波段。

用于生产的代码确定比咱们这简易的代码更加复杂,并且也不该该是暴力去除负值绘制图像。这些有兴趣的读者能够自行研究啦。

咱们的文章到此就结束啦,若是你但愿咱们今天的Python 实战教程,请持续关注咱们,若是对你有帮助,麻烦在下面点一个赞/在看哦,有任何问题均可以在下方留言区留言,咱们都会耐心解答的!


Python实用宝典
不仅是一个宝典
欢迎关注公众号:Python实用宝典

原文来自Python实用宝典:Python 提取音乐频谱并可视化

Python实用宝典