百度语音合成模型Deep Voice3

INTRODUCTION Deep Voice3是由百度提出的一个全新的全卷积TTS架构。百度的主要工作分为如下五个方面: 提出了一个全卷积的 character-to-spectrogram 架构,它能并行计算,并且比使用循环单元的架构快 Deep Voice3训练非常快,并且可以扩展到LibriSpeech语音数据集,该数据集包含来自2484个说话人的820小时音频数据 可以产生单调的注意力行
相关文章
相关标签/搜索