语音识别GMM-HMM

整体结构是 : 状态组成音素, 音素组成单词, 单词构成句子。算法

其中前面把帧识别成状态(难点),能够当作gmm作的,也可用用其余算法模型。第二步,把状态组合成音素。第三步,把音素组合成单词。后面都是hmm作的       函数

经过句子,而后分词,而后分红每一个音素,在隐马尔科夫(HMM)模型中通常用3-5个上述的单元表示一个音素。简单的理解就是咱们每一个音素的均值和方差矩阵知道,经过咱们的句子咱们也知道每一个音素间的转移几率矩阵。固然,这些是HMM里的事情。提取特征后的第一步就完成了,简单的说就是为了拟合多维高斯函数。模型

能够当作gmm作的

相关文章
相关标签/搜索