从零开始语音识别(5)--- 端到端的语音识别系统

为什么需要端到端的系统 传统语音识别系统非常复杂,需要分别训练声学模型、语言模型、发音模型 需要领域特殊的专业知识 通过端到端的模型可以直接将输入的声学特征转变为文本 端到端语音识别系统介绍 Seq2Seq 此模型长用于机器翻译、语音识别。其优点是输入输出不需要等长,而且两者长度不固定。 此模型包含两个RNN结构,分别用于编码与解码。Decoder网络直到解码的序列是END才停止,因此可以实现变长
相关文章
相关标签/搜索