斯坦福CS224n NLP课程【十二】——语音处理的端对端模型

Automatic Speech Recognition ASR ASR就是将声学信号转化为文本的系统  语音是一种自然的用户接口: 传统ASR:传统做法的主体是生成式语言模型,建模声学信号与文本的发音特征的联合概率,但pipeline的不同部分掺杂了不同的机器学习模型   现代ASR:神经网络兴起之后,人们发现传统pipeline中的每个模型都可以被一种对应的神经网络所替代,并且取得更好的效果:
相关文章
相关标签/搜索