阿里巴巴语音识别模型 DFSMN 的使用指南


阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提升至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具有训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。git

本场 Chat 的主要内容包括:算法

    1. 语音识别流程简介;
    2. Kaldi 的部署使用;
    3. 如何训练基于中文的 DFSMN 声学模型;
    4. 语音特征提取 MFCC 算法源码解读;
    5. 语音识别工具对比。


https://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b工具