【论文翻译】使用少量样本的神经语音克隆

这篇论文探讨了解决语音克隆问题的两种基本方法:说话人自适应(speaker adaptation)和说话人编码(speaker encoding)。适用于带有说话人嵌入的多说话人语音生成模型,不会降低音频质量。 原论文链接: Neural Voice Cloning with a Few Samples 摘要   语音克隆是个性化语音接口的一项备受期待的能力。基于神经网络的语音合成已经显示能为大量
相关文章
相关标签/搜索