Deep Speech 2 : End-to-End Speech Recognition in English and Mandarin论文笔记

感想 这篇文章的署名作者尤其的多,做了很多工作,从模型设计到产品不熟,还实现了一个GPU版本的CTC,CTC可以说是这篇文章的核心部分,没有它,就没有端到端的训练,作者还用到了双向神经网络,对GPU并行都做了相应的定制化优化,涉及的很全,算法比较实验也很全,大多都是很人类水平比较。 介绍 数十年的手工工程领域知识已经融入到了最新的自动语音识别(automatic speech recognitio
相关文章
相关标签/搜索