语音特征提取技术——MFCC

语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。 人的发声由很多部位共同影响的结果,如嘴形、牙齿等因素,这种形状可以决定声音的输出。如果我们可以精确的确定形状,那么我们就可以对发出的因素进行科学的表示。 MFCC倒谱系数计算过程如下; ① 将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频
相关文章
相关标签/搜索