关于Seq2Seq model: Connectionist Temporal classification一些理解（1）

时间 2021-01-12

标签 ctc seq2seq 语音识别繁體版

原文原文链接

首先，我们回顾下seq2seq想要解决的问题这样一类问题：比如说，在语音识别的任务中，我们是输入一段语音然后输出一段文字，而在机器翻译中，假设中英翻译，那我们就是输入一段中文的文字序列然后输出一段英文序列，在这个过程中通常N！=M. 以语音识别任务为例来详细展开讲述一下CTC：上图是通常语音识别的预处理过程，首先将常见的音频文件（mp3，wmv等格式）解压成wa

>>阅读原文<<