论文笔记:Connectionist Temporal Classification: Labelling Unsegmented Sequence

感想 这篇文章不是好懂,需要有机器学习基础,特别是要了解HMM的前向后向算法,如果有人不知道这个算法的思想,可以参考周志华《机器学习》一书,上面对这个算法有一个详细的讲解,这篇文章最大的贡献就是提出了CTC的loss function,把神经网络输出后,把输出和语音文稿的映射变成了一个解码,我们只需要找到一条最佳路径,从而得到这段语音的转录文本,但是寻找所有路径求概率和是不可能了,因此有了前缀搜索
相关文章
相关标签/搜索