基于Matconvnet深度学习框架的方言分类(1)

背景 本文是基于Matconvnet深度学习框架对方言音频文件进行分类,介绍如下: 预处理数据 声谱图 预处理数据都是对音频文件进行处理,我们都知道 CNN 主要是针对二维数据做分类等,因此我们第一步需要做的是将一维的音频信号,通过调用specgram函数将音频文件转换成声谱图,我在实验中的采用过两种参数,分别如下: [b,f,t] = specgram(x,512,fs,512,256); [b
相关文章
相关标签/搜索