基于端到端深度学习方法的语音唤醒模型和论文

语音唤醒,即关键词检索(keyword spotting, KWS)。用语音唤醒设备,让设备由休眠状态切换至工作状态。 下面主要对基于端到端的深度学习方法的语音唤醒模型总结。 模型输入为语音,输出为各唤醒词的概率,一个模型解决,不需要再进行解码。 通常包括三个部分:第一步是特征的提取,第二步是一个神经网络,它的输入是语音特征,输出是各个关键词和非关键词即Filler这样一个后验概率。由于第二步的网
相关文章
相关标签/搜索