【论文翻译】Tacotron:端到端语音合成

Tacotron是谷歌于2017年提出的端到端语音合成系统,该模型可接收字符的输入,输出相应的原始频谱图, 然后将其提供给 Griffin-Lim 重建算法直接生成语音。 原论文链接: Tacotron: Towards End-to-End Speech Synthesis 最近开始研究端到端语音合成。相关的论文原本准备自己翻译,看到网上已经有翻译的比较好的版本, 故转载于此,仅作重新排版和细节
相关文章
相关标签/搜索