< python音频库:Windows下pydub安装配置、过程出现的问题及经常使用API >

< python音频库:Windows下pydub安装配置、过程出现的问题及经常使用API >

背景

  • 刚从B站上看过倒放挑战以后也想体验下,心血来潮一个晚上完成了基本的实现。其中倒放与播放部分使用了pydub这个音频库,十分快捷方便,可是它完整一套的配置让我仍是踩了几个坑。特将其配置过程记录于此,方便你们。python

  • Windows10系统git

  • < Pydub in Github >github

安装Pydub

  • Anaconda:打开Anaconda promptactivate切换至工做环境下,键入pip install pydubwindows

  • Pycharmsettingproject,将pydub安装进pip环境api

安装FFmpeg(或选择libav

  1. 下载FFmpeg
    • < FFmpeg官网 > :找到对应的系统版本下载。app

    • 将压缩包解压到任意目录。3d

    • 将安装安装目录下的bin文件夹添加到系统的Path环境变量中。code

    • 若是添加环境变量成功后,打开cmd,键入ffmpeg -version,就能够看到版本信息。orm

  2. 下载FFmpeg
    • 除了按完成以上下载以外,还须要在python中导入FFmpegip

    • 同上Pydub包导入 - pip install FFmpeg

安装Pyaudio

  • 能够仅使用纯Pydub打开或保存WAV文件。为了打开或保存非WAV文件——好比MP3——你须要ffmepg或是libav。而若是须要播放音频,则须要安装如下包:
    • simpleaudio

    • pyaudio

    • ffplay (一般随ffmpeg安装)

    • avplay ((一般随libav安装)

  • 官网是强烈推荐安装simpleaudio,而我选择的是pyaudio,由于以后程序的其余部分还须要用到,因此就直接选择了pyaudio

  • 包安装同上Pydub - pip install pyaudio

  • 至此安装配置工做完成,可试验如下代码看是否能运行。
from pydub import AudioSegment
from pydub.playback import play

sound = AudioSegment.from_file("0.mp3", "mp3")
play(sound)

问题:[Errno 13] Permission denied

  • 安装了pydubffmpeg,可是缺乏播放音频的包,安装后再也不显示。

问题 [WinError 2] 系统找不到指定的文件

  • 安装了ffmpeg其中的一项,还缺乏另一项,安装后再也不显示。

经常使用API

打开一个XXX类型文件:

mp4_version = AudioSegment.from_file("never_gonna_give_you_up.mp3", "mp3")
wma_version = AudioSegment.from_file("never_gonna_give_you_up.wav", "wav")
aac_version = AudioSegment.from_file("never_gonna_give_you_up.mp4", "mp4")

对音频段切片

# pydub作任何操做的时间尺度都是毫秒
ten_seconds = 10 * 1000

first_10_seconds = song[:ten_seconds]
last_5_seconds = song[-5000:]

链接音频段

without_the_middle = beginning + end

让开头更响和让结束更弱

# 声音增益6dB
beginning = first_10_seconds + 6

# 声音减弱3dB
end = last_5_seconds - 3

重复

# 将片断重复两遍
do_it_over = with_style * 2

倒放

# 读取想要倒放的音频文件
ted = AudioSegment.from_file("ted.mp3")
# 将音频倒放赋给变量 backwards
backwards = ted.reverse()

保存结果 / 音频格式转换

awesome.export("mashup.mp3", format="mp3")

批量处理音频

from pydub import AudioSegment

# i 从 0 到 9 取值
for i in range(10):
    # 按顺序读取 00i.m4a 文件
    temp = AudioSegment.from_file(f"00{i}.m4a")
    # 将 00i.m4a 转换为 答案00i.mp3
    temp.export(f"答案00{i}.mp3")
    # 将音频倒放
    backplay = temp.reverse()
    # 将倒放音频存为 音谜00i.mp3
    backplay.export(f"音谜00{i}.mp3")
# 打印个 done 提示完成
print("done")

举个例子:

from glob import glob
from pydub import AudioSegment

playlist_songs = [AudioSegment.from_mp3(mp3_file) for mp3_file in glob("*.mp3")]

first_song = playlist_songs.pop(0)

# 让咱们只包含第一首歌的前30秒 (切片以毫秒为单位)
beginning_of_song = first_song[:30*1000]

playlist = beginning_of_song
for song in playlist_songs:
    # 咱们不想让结尾听起来像是忽然中止,因此咱们给它加上10秒的淡化
    playlist = playlist.append(song, crossfade=(10 * 1000))

# 让咱们给最后一首歌的结尾加上淡出
playlist = playlist.fade_out(30)

# 唔……我还想知道它有多长( len(audio_segment)返回值一样是以毫秒计的 )
playlist_length = len(playlist) / (1000*60)

# 如今保存下来!
out_f = open("%s_minute_playlist.mp3" % playlist_length, 'wb')

playlist.export(out_f, format='mp3')
相关文章
相关标签/搜索