语音中的关于语音识别的一些知识

以下内容都是抄的,哈哈哈 1.mel频率: 是模拟人耳对不同频率语音的感知。 人类对不同频率语音有不同的感知能力:对1kHz以下,与频率成线性关系,对1kHz以上,与频率成对数关系。频率越高,感知能力就越差了。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。 在Mel频域内,人对音调的感知能力为线性关系,如果两段语音的Mel频率差两倍,则人在感知上也差两倍。 转换公式:B(f)=112
相关文章
相关标签/搜索