语音识别(二)——基本框架, Microphone Array, 声源定位

基本框架 语音识别系统主要有四部分组成:信号处理和特征提取、声学模型、语言模型(Language Model, LM)和解码器(Decoder)。 信号处理和特征提取部分以音频信号为输入,通过消除噪音、信道失真等对语音进行增强,将语音信号从时域转化到频域,并为后面的声学模型提取合适的特征。 声学模型将声学和发音学的知识进行整合,以特征提取模块提取的特征为输入,生成声学模型得分。 语言模型估计通过重
相关文章
相关标签/搜索