语音特征提取技术——MFCC

时间 2020-12-23

原文原文链接

语音识别和说话人识别中，常用的语音特征是基于Mel频率的倒谱系数（即MFCC）。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。人的发声由很多部位共同影响的结果，如嘴形、牙齿等因素，这种形状可以决定声音的输出。如果我们可以精确的确定形状，那么我们就可以对发出的因素进行科学的表示。 MFCC倒谱系数计算过程如下; ① 将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换并得到其频