多重信号辅助音频分离,让你在嘈杂环境也能指哪听哪儿

在刚刚结束的 I/O 大会的主题演讲中,Google CEO Sundar 提出了机器学习在无障碍(Accessibility)方面的用例:有听觉障碍的人在观看视频时往往需要配合字幕来完成辅助理解,但是如果你遇到了多个人同时在说话,自动生成的字幕反倒会扰乱听障人士的思维,使得他们更不知其所云。 有了我们称之为 Looking to Listen 的机器学习技术之后,我们通过对视频信号的处理和分析,
相关文章
相关标签/搜索