Listen, Attend and Spell阅读笔记

摘要         作者展示了一种语音识别神经网络Listen, Attend and Spell。listen为一个金字塔形的RNN encoder网络,将声音信号的filter bank特征作为输入,speller为一个基于attention机制的RNN decoder网络,将文字字符作为输出。本网络不包含发音字典或者语言模型,在Google 语音搜索人物志,获得了14.1%的WER,使用语
相关文章
相关标签/搜索