[0006] 针对以上问题,本发明提供了一种基于十字形声阵列宽带波束形成的声识别方法。
[0007] 为了实现上述目的,本发明采用的技术方案包括如下步骤:
[0008] 步骤1、将十字形声阵列对准所需方向采集4通道声音信号;
[0009] 步骤2、对采集到的4通道声音信号进行预处理,包括分帧、加窗;
[0010] 步骤3、对预处理后的每一帧数据进行离散傅里叶变换,离散傅里叶变换后的4通道声音信号根据需要的频带进行频带提取;
[0011] 步骤4、提取的各频带分别在所需方向上进行LSMI-MVDR波束形成;
[0012] 步骤5、将波束形成后的频域信号进行逆离散傅里叶变换;
[0013] 步骤6、对应分帧时的原则进行帧重叠合成,输出信号;
[0014] 步骤7、对输出信号进行特征提取和分类学习、识别。
[0015] 所述的步骤1:将十字形声阵列的其中一个通道对准声源方向,作为LSMI-MVDR宽带波束形成的方向,采集4通道声音信号,采样频率记为fs。
[0016] 所述的步骤2:预处理包括数据的分帧、加窗,对声音信号进行分帧,声音信号每帧选取1024个采样点,帧移为512个采样点;然后采用汉明窗对声音信号进行加窗;
[0017] 所述的步骤3:通过FFT来实现信号的离散傅里叶变换,其中,每一帧信号经过FFT后频率分辨率为 第p个通道的第m帧信号经过FFT后的结果为:
[0018]
[0019] 其中,L=1024为每一帧的长度, 为第p个通道第m帧的信号,k为是各个频带的编号,其对应的中心频率为:
[0020]
[0021] 然后,根据声音信号的频率特性,选取相应的频率带,比如信号所在的频率带为[f1,f2],则我们提取FFT后的k所在的区间为
[0022] 所述的步骤4:设第k个频带的中心频率为fk,则对于十字形阵列,首先将十字形阵列建立在直角坐标系下,则十字形阵列接收到的第m帧信号在时域内表示为:
[0023]
[0024] 其中,S(t)为声源信号,它的方位角为θ; 为方向矢量; 是噪声向量;ω为S(t)的中心角频率,τp(θ)(p=1,2,3,4)是第p个阵元相
对于参考点即坐标原点的延时,对于十字形声阵列,其值为:
[0025]
[0026] c是声音在空气中的传播速度,r是十字形声阵列的半径。
[0027] 将(1)式进行离散傅里叶变换得到在频域下表示方式为
[0028]
[0029] 其中,k=0,1,...,L-1;a(θ,fk)是中心频率为fk的第k个频带所对应的方向矢量,即
[0030]
[0031] 对于MVDR波束形成原理,表述为在保证期望方向θde的信号功率不变的情况下,使得阵列输出的功率最小,即
[0032]
[0033] 其中,R=E[X(k)XH(k)]是接收信号在频域下的自相关矩阵。在实际应用中,用估计值 来替代R,估计值 的计算如下:
[0034]
[0035] 其中NF表示声音信号的帧数。
[0036] 因此,MVDR波束形成的最佳权矢量wopt为:
[0037]
[0038] 是一个比例系数。
[0039] 为了提高MVDR波束形成的稳健性,我们使用基于对角加载的改进MVDR波束形成算法,其原理是在自相关矩阵的对角线上增加一个加载量,即
[0040]
[0041] 从而,改进的最佳权矢量wLSMI变为
[0042]
[0043] 波束形成后的第m帧频域信号Y(m)(k)为:
[0044]
[0045] 所述的步骤5:将第m帧频域信号Y(m)(k)通过逆离散傅里叶变换转换到时域,其中逆离散傅里叶变换通过IFFT来实现,其中第m帧时域信号y(m)(i)为:
[0046]
[0047] 所述的步骤6:将经过逆离散傅里叶变换的各帧声音信号按照分帧时的原则进行重叠,然后再输出信号;其中:第一帧信号不变,后面每一帧信号去掉前面的512个点,只保留后512点,然后再添加到前一帧信 号后面。
[0048] 所述的步骤7:将输出信号作为原始信号,进行特征提取和分类学习、识别。其中,声音的特征提取算法主要有线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)或者梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)等,而分类学习识别算法主要有支持向量机(Support Vector Machine,SVM)或者极限学习机(Extreme Learning Machine,ELM)等。
[0049] 本发明有益效果如下:
[0050] 本发明使用4通道十字形声阵列采集声音信号数据进行LSMI-MVDR宽带波束形成,能够提高期望方向接收信号的信噪比并且抑制其他方向的干扰信号,达到空间滤波和噪声抑制的效果,提高的接收信号的信干噪比,非常有效的解决了上述的提到的缺陷,将其用于声音识别系统的信号处理阶段,可以有效的提高识别系统对识别对象的识别率和可靠性。