语音识别数据加强方法(google2019年7月论文)

论文:https://arxiv.org/pdf/1904.08779.pdfweb 要点: 咱们构建了一个直接做用于对数梅尔频谱图的加强策略,以帮助网络学习有用的功能。 出于如下目的的动机:这些功能应对时间方向的变形,频率信息的部分丢失以及小部分语音片断具备较强的鲁棒性,所以,咱们选择了如下变形来制定策略: 1.使用tensorflow的sparse_image_warp函数进行时间扭曲。给定具
相关文章
相关标签/搜索