关于Seq2Seq model: Connectionist Temporal classification一些理解(1)

    首先,我们回顾下seq2seq想要解决的问题这样一类问题:     比如说,在语音识别的任务中,我们是输入一段语音然后输出一段文字,而在机器翻译中,假设中英翻译,那我们就是输入一段中文的文字序列然后输出一段英文序列,在这个过程中通常N!=M.     以语音识别任务为例来详细展开讲述一下CTC:     上图是通常语音识别的预处理过程,首先将常见的音频文件(mp3,wmv等格式)解压成wa
相关文章
相关标签/搜索