Many-to-many Cross-lingual Voice Conversion with a Jointly Trained Speaker Embedding Network

时间 2021-01-11

原文原文链接

会议：2019 APSIPA 作者：ZHOUYI Li Haizhou 单位：新加坡国立 abstract average modeling approach用一个低维度的speaker embedding和vc网络联合训练，可以达到many-to-many cross-lingual的效果。 base-model: vc+i-vector作为speaker embedding表示。 introd