从鸡尾酒会问题入门语音分离

前言 谷歌这篇文章《Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation》,宣称“攻克”了鸡尾酒会问题。从提供的视频演示来看,可以通过滑动控制只听某一个人说话,非常神奇。 这篇文章本身大概讲了这么一个事: 提出一个视觉-听觉联合模型,通过视觉信息
相关文章
相关标签/搜索