逆天!MIT新“像素发声”系统,完美分离声与画(附视频)

Adobe Audition的音频剪辑霸主地位可能不保了。 最近,MIT的计算机科学与人工智能实验室(CSAIL)研发出一种名为Pixel Player系统,能够通过大量无标签的视频来学习声音定位,更强大的是,Pixel Player能够把声音与声源的像素点进行分离,并完美做到视觉与声音的同步,“想听哪里点哪里”。 同时,利用Pixel Player系统,用户能够对图像中不同的声音分别进行音量调节
相关文章
相关标签/搜索