Many-to-many Cross-lingual Voice Conversion with a Jointly Trained Speaker Embedding Network

会议:2019 APSIPA 作者:ZHOUYI Li Haizhou 单位:新加坡国立 abstract average modeling approach用一个低维度的speaker embedding和vc网络联合训练,可以达到many-to-many cross-lingual的效果。 base-model: vc+i-vector作为speaker embedding表示。 introd
相关文章
相关标签/搜索