麦克风阵列语音识别——(make machine understand us)

基于麦克风阵列加强的语音识别html

基于麦克风阵列加强的语音识别,与单通道语音识别相比麦克风阵列能够利用多通道的语音信息,经过波束造成算法来加强语音信号的质量,这样提取的特征参数能更好的反应语音的特征,从而提升语音识别的效果。算法

麦克风阵列可接收到多路的语音信息,能够经过对多路语音信息以某种准则加以筛选整合,获得对识别更有利的通道的语音信息,从而达到提升识别率的目的。通道选择的方法有不少种,好比基于 SNR 的方法,基于特征补偿的方法,基于互相关系数法,基于最近邻法。数组

语音识别的基础理论知识 .net


语音识别过程本质上是一种模式识别过程,首先麦克风将接收到语音信号转换成电信号,通过预处理和端点检测后对其进行特征参数提取。而后根据语音特色选择合适的语音模型,经过提取的特征参数创建起语音识别的参考模型。最后,对待识别的语音进行预处理、端点检测和特征参数提取,将待识别语音的特征参数与训练过程创建语音模型进行匹配,进而经过判决规则得出识别结果。htm

(http://blog.csdn.net/ziyuzhao123/article/details/8932336)blog

梅尔倒谱系数数学

语音特征参数能够是基音周期、短时能量、共振峰等。目前在语音识别系统中,经常使用的特征参数是和线性预测倒谱系数。基础

HMM 模型的基础知识gc

隐马尔科夫模型是语音信号的一种统计模型,在语音处理各个领域普遍应用。它具备双重随机过程的特色,系统由多个状态组成,观察序列随着时间的变化转移到不一样的状态上;每一个状态又含有不一样的输出几率模型,根据输出几率模型获得观察序列的输出几率。一段语音的特征参数就是随着时间的变化而变化的,隐马尔科夫模型很好的模仿了这一过程,因此其成为公认的相对有效地语音识别模型。方法

根据状态输出观察值的几率连续与否可将 HMM分为离散 HMM、连续 HMM、半连续 HMM。

HMM 模型的基本算法 

前向后向算法

前向后向算法是在已知一个观察序列和一个 HMM 模型的基础上,计算出经过HMM 模型产生观察序列的几率。前向算法是按照观察序列的时间顺序,从前日后递推计算出输出几率。

http://blog.csdn.net/joey_su/article/details/17270639

http://blog.csdn.net/joey_su/article/details/17270613

HMM 模型在应用中存在的问题及解决方法 

HMM 模型的基元选取和状态数肯定 

基元即语音识别的最小识别单位,对于汉语来讲,能够是一个词,也能够是声韵母。通常中小词汇量的系统选择以词为基元,大词汇量的系统通常以声韵母做为基元。

当识别系统词汇量比较大时,若是每一词都有一个 HMM,那么整个系统所须要训练的参数会大大增长,其所存储的空间也会增长,这两不利于系统的实用化。因此能够选择一组包含全部声韵母的训练语音,便可训练出各个声母韵母的 HMM 模型,这样既节省了存储空间,又提升了训练时间。

经过查阅文献可知,通常汉语语音识别,以词为基元的,状态数宜为 6 到 8。以声韵母做为基元的,声母状态数为 2,韵母状态数为 4。

http://www.cs.ubc.ca/~murphyk/Software/HMM/hmm.html?spm=5176.100239.blogcont.16.PXoxr2

https://yq.aliyun.com/articles/50423

关于麦克风阵列延迟滤波求和

多个通道采集语音信号时,因为到达各个通道的各路信号是通过不一样的传播延迟后得到,所以可对各通道信号进行时间校订以补偿信号在传输时所产生的时延,实现各个通道的指望信号无相位差叠加,而噪声则为存在相位差的叠加,进而提升输出信号中的信号与噪声的比值。这个过程用数学公式可表达为

FBFout=sum(x)/M;

而当麦克风阵列接收的各路语音信号在求和以前经过一个滤波器,此时权值系数再也不是单一的数值,而是由一系列滤波器系数组成,那么便可以由延时求和波束造成的方法推广到滤波求和波束造成的方法。

相关文章
相关标签/搜索