基于Matconvnet深度学习框架的方言分类（1）

时间 2020-12-20

原文原文链接

背景本文是基于Matconvnet深度学习框架对方言音频文件进行分类，介绍如下：预处理数据声谱图预处理数据都是对音频文件进行处理，我们都知道 CNN 主要是针对二维数据做分类等，因此我们第一步需要做的是将一维的音频信号，通过调用specgram函数将音频文件转换成声谱图，我在实验中的采用过两种参数，分别如下： [b,f,t] = specgram(x,512,fs,512,256); [b

>>阅读原文<<