Tacotron2 论文阅读

时间 2021-01-18

标签深度学习繁體版

原文原文链接

论文下载 ABSTRACT 这篇论文描述了Tacotron 2，一个直接从文本合成语音的神经网络架构。系统由两部分构成，一个循环seq2seq结构的特征预测网络，把字符向量映射为梅尔声谱图，后面再接一个WaveNet模型的修订版，把梅尔声谱图合成为时域波形。我们的模型得到了4.53的平均意见得分（MOS），专业录制语音的MOS得分是4.58。为了验证模型设计，我们对系统的关键组件作了剥离实验研究

>>阅读原文<<

1. Tacotron2论文阅读笔记
2. 【论文阅读】Triple GANs论文阅读
3. 论文阅读
4. [论文阅读]
5. cvpr2018论文阅读
6. 论文阅读: RetinaNet
7. 《Learning_object_interactions_and_descriptions_for_sematic_image》论文阅读
8. 论文阅读: Xception
9. 论文阅读: ResNet
10. SSD论文阅读
更多相关文章...
• RSS 阅读器 - RSS 教程
• C# 文本文件的读写 - C#教程
• JDK13 GA发布：5大特性解读
• Scala 中文乱码解决