从零开始语音识别（5）--- 端到端的语音识别系统

时间 2021-01-05

原文原文链接

为什么需要端到端的系统传统语音识别系统非常复杂，需要分别训练声学模型、语言模型、发音模型需要领域特殊的专业知识通过端到端的模型可以直接将输入的声学特征转变为文本端到端语音识别系统介绍 Seq2Seq 此模型长用于机器翻译、语音识别。其优点是输入输出不需要等长，而且两者长度不固定。此模型包含两个RNN结构，分别用于编码与解码。Decoder网络直到解码的序列是END才停止，因此可以实现变长

>>阅读原文<<