多重信号辅助音频分离，让你在嘈杂环境也能指哪听哪儿

时间 2021-01-09

原文原文链接

在刚刚结束的 I/O 大会的主题演讲中，Google CEO Sundar 提出了机器学习在无障碍（Accessibility）方面的用例：有听觉障碍的人在观看视频时往往需要配合字幕来完成辅助理解，但是如果你遇到了多个人同时在说话，自动生成的字幕反倒会扰乱听障人士的思维，使得他们更不知其所云。有了我们称之为 Looking to Listen 的机器学习技术之后，我们通过对视频信号的处理和分析，