Deep Speech 2 : End-to-End Speech Recognition in English and Mandarin论文笔记

时间 2021-01-02

原文原文链接

感想这篇文章的署名作者尤其的多，做了很多工作，从模型设计到产品不熟，还实现了一个GPU版本的CTC，CTC可以说是这篇文章的核心部分，没有它，就没有端到端的训练，作者还用到了双向神经网络，对GPU并行都做了相应的定制化优化，涉及的很全，算法比较实验也很全，大多都是很人类水平比较。介绍数十年的手工工程领域知识已经融入到了最新的自动语音识别（automatic speech recognitio

>>阅读原文<<