斯坦福CS224n NLP课程【十二】——语音处理的端对端模型

时间 2020-12-23

标签斯坦福CS224n NLP 机器学习人工智能深度学习神经网络 nlp 繁體版

原文原文链接

Automatic Speech Recognition ASR ASR就是将声学信号转化为文本的系统语音是一种自然的用户接口：传统ASR:传统做法的主体是生成式语言模型，建模声学信号与文本的发音特征的联合概率，但pipeline的不同部分掺杂了不同的机器学习模型现代ASR：神经网络兴起之后，人们发现传统pipeline中的每个模型都可以被一种对应的神经网络所替代，并且取得更好的效果：

>>阅读原文<<