语音识别数据增强方法(google2019年7月论文)

论文:https://arxiv.org/pdf/1904.08779.pdf 要点: 我们构建了一个直接作用于对数梅尔频谱图的增强策略,以帮助网络学习有用的功能。 出于以下目的的动机:这些功能应对时间方向的变形,频率信息的部分丢失以及小部分语音片段具有较强的鲁棒性,因此,我们选择了以下变形来制定策略: 1.使用tensorflow的sparse_image_warp函数进行时间扭曲。给定具有τ个
相关文章
相关标签/搜索