基于深度学习的语音识别研究-CTC理论推导(四)

  有时候学习真的得循序渐进,并没有速成的方法,本小白在经历了大约一个月终于把CTC的从头到尾大致看完了,下面讲一下我的理解,欢迎各位朋友批评指正。   首先,我们得知道为什么要引入CTC,前面博客讲到,之前在做语音的声学模型的时候,我们的数据形式是帧与标签的分别对齐,以Thchs30为例,训练集大约25小时的数据集,经过kaldi的GMM-HMM对齐之后,大约分为917w多帧的语音数据,标签经过
相关文章
相关标签/搜索