语音识别数据增强方法（google2019年7月论文）

时间 2021-01-20

原文原文链接

论文：https://arxiv.org/pdf/1904.08779.pdf 要点：我们构建了一个直接作用于对数梅尔频谱图的增强策略，以帮助网络学习有用的功能。出于以下目的的动机：这些功能应对时间方向的变形，频率信息的部分丢失以及小部分语音片段具有较强的鲁棒性，因此，我们选择了以下变形来制定策略： 1.使用tensorflow的sparse_image_warp函数进行时间扭曲。给定具有τ个

>>阅读原文<<