MMI在ASR中的应用

介绍 ASR中DNN声学模型训练通常使用CE准则作为损失函数进行训练,CE准则是最小化帧错误率,但在基于帧识别的ASR中我们一般直接使用WER(自错误率)来评价语音识别准确率,更关心的是序列的准确性,会导致损失函数和训练目标不一致。 DT在识别序列上定义误差,更接近语音识别的最终目标。 常用DT目标函数有MMI,BMMI,MPE,MBR。 使用CE准则时,又可能帧的正确率提高了但是最终解码WER没
相关文章
相关标签/搜索