[0006] 本发明通过一系列信号处理方法得到五种电梯人员被困典型异常声音的RMS、SC和MFCC特征并组合成典型异常声音特征样本库,分别将五类声音特征样本输入到基于多层ELM‑AE的最大相关熵ELM单分类器。分别构建电梯内异常声音检测算法模型,便于对电梯内人员被困的相关紧急情况提前预警和及时联动报警。为电梯的安全高效运行,险情的及时处理,挽回生命财产损失提供了保证,并降低了人力成本。
[0007] 本发明主要包括如下步骤:
[0008] 步骤1、分别对五种典型异常声音信号提取RMS特征
[0009] 1‑1、分别对采集的五种电梯内异常声音信号建立目标声音样本库,假设某一种原始异常声音信号为sl(n),其中0≤l≤5,l为典型异常声音种类数。
[0010] 1‑2、将原始异常声音信号sl(n)经过预处理得到每帧时域信号xl(n)。
[0011] 1‑3、对每帧时域信号求所有点的平方和的平均值,再开方得到每帧时域信号的[0012] 步骤2、分别对五种典型异常声音信号提取波谱质心Spectral Centroid特征;
[0013] 2‑1、将经过预处理得到的每帧声音信号xl(n)经过快速傅里叶变化转为频域,并得到的每帧信号能量El(n);
[0014] 2‑2、根据得到的每帧信号能量,求第l类典型异常声音信号的谱质心特征:
[0015]
[0016] 式中:fl(n)为信号频率;El(n)为对应频率的谱能量。
[0017] 步骤3、分别对五种典型异常声音信号提取MFCC特征;
[0018] 3‑1、将得到的每帧信号能量El(n)通过Mel三角滤波器组得到Mel频率的能量谱。
[0019] 3‑2、对输出后的Mel频谱取对数运算,得到对数频谱,进行离散余弦变换得到12维的MFCC系数特征。
[0020] 3‑3、将得到的电梯内第l类异常声音的每帧信号的RMS、SC、MFCC特征数据组合在一起,标类号,建立典型异常声音特征样本库。
[0021] 步骤4、将输入训练样本进行特征提取;
[0022] 4‑1、分别取典型异常声音特征样本库中目标类的RMS+SC+MFCC特征数据,其训练样本为 进行特征归一化,训练集只包含目标样本,N1为训练样本数量。
[0023] 4‑2、归一化后的训练样本 即ELM‑AE的输入和输出矩阵。
[0024] 其中:由于ELM‑AE自编码器通过简单地学习将输入复制到输出,所以输入和输出均为XA。
[0025] 4‑3、随机生成隐层输入权值矩阵 和正交化偏置向量矩阵T
将输入对训练样本XA映射到相同或者不同的数据维度空间:hk=g(wkxα+bk),(wk) wk=I,T
(bk) bk=1,其中:g()表示激活函数,k=1,2,...,K,k为ELM‑AE个数。I是单位向量。
[0026] 4‑4、求解ELM‑AE的输出权值矩阵
[0027] 假设ELM‑AE个数为K,输入输出层神经元数量为d,隐含层神经元数量为 以及每个隐含层的正则化参数 若 或 即对于稀疏及压缩的特征表达,若 即对于等维度的特征映射,
[0028] 其中: 表示ELM‑AE的第k个隐含层输出矩阵。
[0029] 步骤5、计算分类学习的输出权重β
[0030] 5‑1、得到初始化输出权重
[0031] 经过K‑1层ELM‑AE得到输出矩阵Ⅰ: 采用最大相关熵准则来优化0
目标函数。给定高斯核宽度σ,最大容忍误差ε和最大迭代次数J,并初始化输出权重β=0,初始误差 并将初始误差转化为对角矩阵:
[0032]
[0033] 5‑2、优化输出权重
[0034] 计算输出权重为 其中C是常数,计算误差为 转化为对角矩阵为:
[0035]
[0036] 5‑3、计算成本函数:
[0037] 计算成本函数J(βj)和J(βj‑1),j=1,...,J,当|J(βj)‑J(βj‑1)|≥ε或者j<J时,则重复步骤3‑2进行迭代更新,直到满足条件得到最终的输出权值β。
[0038] 所述的成本函数为:
[0039] 5‑4、得到实际输出
[0040] 步骤6、计算单分类器阈值θ
[0041] 6‑1、计算实际输出Yα与样本标签T的误差距离,
[0042]
[0043] 其中,hK(x′i)为HK第i个样本即第i列数据。
[0044] 6‑2、将得到的误差距离进行从大到小排序, 得到其中 和 分别表示最大和最小的误差距离。
[0045] 6‑3、设置阈值参数μ,得到阈值为θ=εα[floor(μ·N1)]。
[0046] 其中:floor为取不大于μ·N1的整数,那么θ取排εα中第该整数个误差作为阈值。
[0047] 步骤7、输入测试数据进行测试
[0048] 7‑1、给定一系列测试样本 其中 表示第i个样本, 表示其为目标样本(异常声音数据), 表示其为非目标样本(正常声音数据),P为总共的测试样本数量。
[0049] 7‑2、输入到多层ELM‑AE得到每层输出 令最后一层ELM‑AE输出为
[0050] 7‑3、输入到ELM分类层得到Yβ=β·Y',计算实际输出与样本标签T的误差距离[0051] 7‑4、将得到的误差距离 与单分类器阈值θ比较:
[0052]
[0053] 7‑5、若识别为某类异常声音,则立刻联动报警,通知相关人员处置险情。
[0054] 本发明有益效果如下:
[0055] 本发明拟对电梯运行过程中人员被困典型声音信号建立声音样本库作为目标类数据,由于人员被困产生的呼救、拍门、尖叫、敲击和哭泣声响明显区别于环境噪声,为基于声音识别的电梯监控异常情况的报警系统奠定了研究方向和基础。本发明对电梯人员被困五种典型异常声音分别建立单分类算法模型,识别效果更好。
[0056] 本发明基于RMS能量计算提取不同典型异常声音信号的RMS特征,这是一种较为普遍的分析异常声音的方法。另外采用MFCC这种模拟人耳听觉机理的特征提取方法来提取声音特征,这种特征参数比基于声道模型的LPCC相比具有更好的鲁邦性,更符合人耳的听觉特性。由于波谱质心的简单和有用特性,是基于声音的“刺耳”、“活泼”提出的。频谱中心的值越小,表明越多的频谱能量集中在低频范围内,在这里提取得到SC特征,并组合三种特征得到典型声音特征样本库,比单纯的一种声音特征更有效。
[0057] 本发明采用对于异常以及不均衡数据识别检测性能较好的基于最大相关熵的深度神经网络单分类器进行识别分类,采用多层叠加的ELM‑AE自编码器进行异常数据的特征提取比普通自编码器(AE)更为高效。将提取得到的特征输入到基于最大相关熵的ELM单分类器进行检测识别,极大增强了单分类器处理非高斯噪声和噪点的能力,具有较强的鲁棒性。而且结合ELM保留了其快速的学习性能和良好的泛化性能,并与自动报警系统联动,能够实现对电梯异常声音监控准确及时报警的要求。