Thchs30数据处理

  经过两周的努力,终于将kaldi中thchs语料(train、dev、test)处理成txt格式,其中语料是已经经过分帧的数据,采用mfcc经过一阶、二阶差分所得,下面详细讲解数据的处理过程。   第一步我们得知道数据的内容,由一张表来展示: 下面附上处理数据的脚本: (1)得到训练标签的脚本程序,即是将训练集的标签提取的程序: #-*- coding:utf-8 -*- #author :
相关文章
相关标签/搜索