解码器之特征提取

特征提取(fbank) 目的: 1.把每一帧波形变成一个包含声音信息的多维向量; 2. 能够符合或类似人耳的听觉感知特性 3. 在一定程度上能够增强语音信号、抑制非语音信号 fbank fbank的总体流程可以由下图表示,去掉(DCT)。 1.语音采样率: 语音采样率顾名思义就是在一秒长的音频上采样多少个幅值点。根据采样定理采样率要大于采样信号的两倍,才能还原原始信号信息。人声信号人声一般在300
相关文章
相关标签/搜索