基于声纹识别的语音分离 VOICE FILTER: TARGETED VOICE SEPARATION (BY SPEAKER-CONDITIONED SPECTROGRAM MASKING)

原文连接:https://arxiv.org/pdf/1810.04826.pdf 结果连接: https://google.github.io/speaker-id/publications/VoiceFilter 摘要     在这篇文章中,我们提出了一个通过参考音频实现音频分离的系统。我们通过两个独立的网络来实现这个目的。(1)声纹识别网络用于生成离散的发音者特征。(2)谱掩码网络:通过输入
相关文章
相关标签/搜索