kaldi google 论坛 问题搬运(一):tdnn-chain 训练出错

    最近实验室一我的在搞语音关键词检测项目,常常遇到各类各样的问题,开始都是在博客和百度上搜索,对于简单的问题,基本上都能搜到相应的解决方案,但关于kaldi的中文资料确实很少。后来发现发现google论坛上有不少关于kaldi的问题以及kaldi开发者dan的回答,在上面找到了不少有用的解答,因而决定作一作搬运工,记录一些有用的问题。shell

    问题:显卡设备老旧,想跑tdnn-chain模型,如何修改相应参数而不影响最终的模型结果。尝试了改小local/chain/run_tdnn.sh中的--trainer.optimization.nums-jobs-initial 、--trainer.optimization.num-jobs-final和--trainer.num-chunk-per-minibatch 。
google

    dan解答:若是只有单个gpu ,须要将num-jobs-initial和num-jobs-final都设为1,这个效果将比把num-chunk-per-minibatch改成很小值效果更好。这些参数的改变均可能会影响结果,若是将num-jobs-initial和num-jobs-final都设为1,建议将epochs改成原来的2/3。开发

    我以前跑aishell的chain模型一直报错,根据dan的回答进行了参数改变,再也不报错。
博客