Speech Separation,Deep Clustering,PIT

首先呢,我们来看看什么是Speech Separation问题。 人们可以在一个嘈杂的环境中识别出一个特定声音的来源,这个叫做鸡尾酒会效应。 这种应用到机器学习领域,我们要做的就是语音增强:语音-非语音分离(降噪)。 而Speech Separation就是做不同种类声音的分离的识别工作。 那么我们首先规定一下,本文主要讨论两种声音,单一麦克风以及独立的演讲者(即培训和测试演讲者完全不同)的识别工
相关文章
相关标签/搜索