麦克风阵列技术-beaforming开源算法源码分析

时间 2021-02-27

标签 html 前端算法 3d orm htm blog 文档 get 产品栏目 HTML 繁體版

原文原文链接

在音频前端处理算法中，beamforming算法是一个没法绕过的存在，随着AI技术的普遍发展，前端语音技术的需求也在呈现个性化的动态范围。做为一个深耕音频算法多年的老兵，发现站在巨人的肩膀上，才能作出对得起客户的产品。今天就分析一下一个开源的beamforming算法。html

步骤一：预处理前端

预处理内容：算法

A 加窗:为傅里叶变换作准备，防止频谱泄露。
B 傅里叶变换：经过傅里叶变换，获取每路麦克风的频域值大小.
C 求权重因子：获取每路麦克风的权重因子.3d

步骤二：beamforming流程orm

beamforming算法流程htm

A 加载加权过的频谱数据
B 计算不一样麦克风之间的互相关系数
C 寻找音频方向源头: 计算每一个麦克风的最大能量
D 复位最大值相关的延时系数.
E 计算人声可能范围的几率系数blog

步骤三：跟踪人声声源文档

跟踪算法效果：get

A 滤波器滤波：预测滤波器先进行滤波.
B 计算每一个麦克风的先验几率.
C 根据当前值计算几率
D 计算几率系数f的值.
E 计算并更新每一个粒度的因子
F 添加或删除跟踪源
G 确认是否中止跟踪某个源
H 计算每一个源的位置
L 对每一个源进行重采样产品

步骤四：人声分离

降噪处理流程：

A 加载分离后的源
B 噪声统计
C 计算噪声泄露
D 计算拉姆达因子
E 噪声叠加
F 计算噪声总量
G 提取人声
H 增益因子应用

步骤四：后置滤波器

人声提取流程：

A 加载跟踪源
B 计算矩阵信息
C 计算每一个帧信息
D 导出帧信息.

总的来讲，该算法仍是比较新的，各项指标比较完善，而且代码水平写的比较高。笔者分析完成以后，真是受益很大。