深入浅出讲解语音合成二:tacotron2及其改进方向

传统的语音合成方案如Merlin、HTS等,依赖于fulllabel和匹配问题集的生成,导致前端的处理工作是非常繁琐的。近年来,为了减少前端的数据准备工作,诞生了tacotron等优秀的端到端语音合成方案。本文着重讲解一下在业界广受好评的tacotron2,其结合了seq2seq(序列到序列)、位置敏感注意力机制及其端到端的语音合成方法,非常值得学习。 1.序列到序列 序列到序列最早应用于机器翻译
相关文章
相关标签/搜索