Tacotron-2:通过调节 WaveNet 对 Mel 频谱预测的自然 TTS 合成

根据论文:https://arxiv.org/abs/1712.05884 首先第一部分为论文主体的翻译: 摘要 这篇文章描述了一个直接从文本合成语音的神经网络架构,Tacotron-2。该系统由两部分组成,首先是把字符向量(character embeddings)映射到梅尔声谱(mel-scale spectrograms)的循环序列到序列(seq2seq)结构的特征预测网络,之后连接一个改良
相关文章
相关标签/搜索