基于HMM的语音识别（二）

时间 2021-01-08

标签 HMM 语音识别繁體版

原文原文链接

今天进入特征提取部分，原文的2.1部分，进入正题。特征提取阶段试图提供语音波形的紧凑形式（这里我理解不是很好，往下看）。这种形式最大限度的减少单词间的区分信息的丢失，并且与声学模型的分布假设进行良好的匹配。比如，如果对角协方差高斯分布用于状态输出分布，那么这些特征应该被设计为高斯并且是不相关的。通常使用约25ms的重叠分析窗每10ms计算一次特征向量。其中最简单也是最常用的编码方式是梅尔倒谱系

>>阅读原文<<