语音识别框架

时间 2021-07-10

原文原文链接

一、语音识别框架传统理论重点研究声学模型，发音字典不用关心，语言模型一般用n-gram 预处理：1. 首尾端的静音切除，降低对后续步骤造成的干扰，静音切除的操作一般称为VAD。 2. 声音分帧，也就是把声音切开成一小段一小段，每小段称为一帧，使用移动窗函数来实现，不是简单的切开，各帧之间一般是有交叠的。特征提取：主要算法有线性预测倒谱系数（LPCC）和Mel 倒谱系数（MFCC），目的是把每

>>阅读原文<<