阿里巴巴开源语音识别声学建模技术

时间 2021-01-14

原文原文链接

编者按：本文作者阿里巴巴机器智能技术实验室高级算法工程师张仕良。文章介绍了阿里巴巴的语音识别声学建模新技术: 前馈序列记忆神经网络（DFSMN），目前基于DFSMN的语音识别系统已经在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。本次，我们开源了基于Kaldi语音识别工具实现的DFSMN代码，同时开源了相关训练脚本。通过开源的代码和训练流程，我们在公开的英文

>>阅读原文<<