基于端到端深度学习方法的语音唤醒模型和论文

时间 2020-12-30

原文原文链接

语音唤醒，即关键词检索（keyword spotting, KWS）。用语音唤醒设备，让设备由休眠状态切换至工作状态。下面主要对基于端到端的深度学习方法的语音唤醒模型总结。模型输入为语音，输出为各唤醒词的概率，一个模型解决，不需要再进行解码。通常包括三个部分：第一步是特征的提取，第二步是一个神经网络，它的输入是语音特征，输出是各个关键词和非关键词即Filler这样一个后验概率。由于第二步的网

>>阅读原文<<