MFCC梅尔倒谱系数

MFCC梅尔倒谱系数 阅读数:7386 MFCC梅尔倒谱系数是说话人识别、语音识别中最为常用的特征。我曾经对这个特征困惑了很久,包括为什么步骤中要取对数,为什么要最后一步要做DCT等等,以下将把我的理解记录下来,我找到的参考文献中最有价值的要数【1】了。是CUM一个教授做的PPT。 整个流程如下: 时域的波形图如下 图1. 时域波形图 第一步 获得语谱图,语谱图是一个非常有力的工具,因为人耳就是进
相关文章
相关标签/搜索