[0018] 如图1所示,利用电子鼻采集不同品种的食醋样本,电子鼻的传感器数量有a个:在室温20℃、湿度40%的环境下,将电子鼻通电,其传感器预热10分钟后,向烧杯中倒入10ml食醋并将其放入箱体中,迅速盖上箱盖;静置一段时间后,分别在60分钟、65分钟、70分钟的三个时间点进行数据采集,取三次采集结果的平均值作为一个食醋样本。完成一次食醋样本采集后,打开箱盖使得各传感器恢复初始状态,然后重复采集食醋样本过程,得到总样本。将总样本分为训练样本和测试样本,每个样本为1×10的向量,训练样本用来模式训练,测试样本用来检验模式识别正确率。
[0019] 从电子鼻的a个传感器里随机选择其中的几个传感器且不作排序,针对所选择的这几个传感器,从训练样本中提取对应于这几个传感器所采集的数据作为新训练样本n,新训练样本n的类别数为c。采用常规的均值方法计算出第i类新训练样本类均值 和新训练样本总均值 新训练样本总均值 n表示新训练样本总数,1≤i≤c,xj表示第j个新训练样本,1≤j≤n。
[0020] 根据新训练样本类均值 和新训练样本总均值 计算出新训练样本的类间离散度矩阵SB和类内离散度矩阵SW以及计算出类间离散度矩阵的迹trace(SB)和类内离散度矩阵的迹trace(SW):
[0021]
[0022]
[0023]
[0024]
[0025] li为第i类的新训练样本数,xij代表第i类的第j个新训练样本,上标T代表矩阵转置运算。
[0026] 然后根据类间离散度矩阵的迹trace(SB)和类内离散度矩阵的迹trace(SW)计算出最优值J:
[0027]
[0028] 当J达到最大的时候表示数据可分性最好,分类的准确度也最高。因此最优值J最大时所选择的传感器对应的新训练样本作为最优训练样本,将对应的新测试样本作为最优测试样本。
[0029] 对最优训练样本数据进行预处理,提取特征值。具体如下:
[0030] 先对最优训练样本进行标准归一化(SNV)处理,然后通过进行主成分分析(PCA)处理,计算得到主成分分析的前6个特征值。
[0031] 分别计算最优训练样本的模糊隶属度的值uik和类中心的值vi:
[0032]
[0033]
[0034] 式中,xk为第k个最优训练样本, 和 分别为第i类样本均值和第j类的样本均值,uik是样本xk隶属于类别i的模糊隶属度,vi是第i类的类中心值,c为类别数,n为样本数,m为权重指数,且m>1。
[0035] 再计算模糊类间离散度矩阵SfB和模糊总体离散度矩阵SfT:
[0036]
[0037]
[0038] 式中, 为第k个样本xk隶属于第i类的模糊隶属度的权重值,mf为权重系数,取mf=1.5;c为类别数,n为样本数, 为样本的总均值, vi是第i类的类中心值,上标T代表矩阵的转置运算。
[0039] 根据下式求特征值λ和特征向量ψ:
[0040]
[0041] 其中, 为模糊总体离散度矩阵的逆矩阵,SfB为模糊类间离散度矩阵,ψ和λ分别代表式中所求的特征向量和对应特征值λ,从而得到最大特征值λ1和对应的特征向量ψ1。
[0042] 计算得到最大特征值λ1和与之相对应的特征向量ψ1,将最大特征值对应的特征向量ψ1作为最优鉴别向量集的第一个向量。
[0043] 计算最优鉴别向量集:
[0044]
[0045] 式中, Ψ=[ψ1,ψ2,...,ψr]T,ψr+1和β分别为上式所求特征向量和所对应的特征值,I为单位矩阵,ψ1,ψ2,...,ψr即为一组最优鉴别向量集。
[0046] 根据前r个最优鉴别向量ψ1,ψ2,...,ψr(r≥1)计算得到第(r+1)个最优鉴别向量ψr+1。经过以上计算,可以获得p个最优鉴别向量组成最优鉴别向量集{ψ1,ψ2,...,ψp}。
[0047] 根据式Y=[ψ1,ψ2,...,ψp]TX进行食醋测试样本的线性转换,其中,[ψ1,ψ2,...,ψp]T表示最优鉴别向量集的转置矩阵,X为测试样本集,Y为测试样本集投影到最优鉴别向量集上得到的投影样本集。完成了测试样本从实数空间 到 的线性转换。将测试样本集Y利用K近邻分类器进行分类,即完成食醋品种的鉴别。
[0048] 以下提供本发明的一个实施例:
[0049] 实施例
[0050] 步骤一、利用电子鼻采集不同品种食醋样本:
[0051] 将电子鼻通电,对5类食醋各进行51次采集,共采集255次,得到255个样本,将实验采集数据结果保存。总样本为255×10的数据矩阵,将总样本分为训练样本和测试样本:将每类食醋的51个样本中前25个作为训练样本,后26个作为测试样本。训练样本数为125个,每个样本为1×10的向量,得到125×10的数据矩阵;测试样本为130个,每个样本为1×10的向量,得到130×10的数据矩阵。
[0052] 步骤二、对食醋样本数据进行优选:
[0053] 1、从a个传感器里随机选择b个且不作排序,共有 种情况。本例中a取10,b取8,共有45种情况,一次选取其中一种情况。
[0054] 2、将所取的8个传感器,从步骤一的训练样本(125×10矩阵)中提取对应数据作为新训练样本(125×8矩阵),计算新训练样本类均值 新训练样本总均值 n表示新训练样本总数,xj表示第j个样本。
[0055] 3、按照下式计算新训练样本的类间离散度矩阵SB和类内离散度矩阵SW、类间离散度矩阵的迹trace(SB)和类内离散度矩阵的迹trace(SW):
[0056]
[0057]
[0058]
[0059]
[0060] 式中,是第i类的样本均值, 是样本的总均值,c为类别数,li为第i类的样本数,xij代表第i类的第j个样本,上标T代表矩阵转置运算。
[0061] 4、按如下规律计算最优值J:
[0062]
[0063] 根据45种不同的组合情况计算得到45个最优值J,当J达到最大的时候表示数据可分性最好,分类的准确度也最高。
[0064] 新训练样本的部分最优值J如下表1所示:
[0065] 表1新训练样本的部分最优值
[0066]
[0067] 所得J的最大值为4231.5,根据此时的J值推算出选取八个传感器编号分别为1,2,4,6,7,8,9,10,并将编号记录在编号索引中;对应传感器型号分别为TGS2610、TGS2620、TGS2600、MQ135、MQ3、TGS2602、TGS813、TGS2611,同时表明这8个传感器型号对应的新训练样本数据可分性最好,并将此新训练样本作为最优训练样本(125×8矩阵),数据显示如图2所示。将这8个传感器型号对应的新测试样本作为最优测试样本。
[0068] 步骤三、提取最优训练样本的鉴别信息:
[0069] 1、对最优训练样本数据进行预处理,提取特征值:
[0070] 先对步骤二所得的最优训练样本(125×8矩阵)进行标准归一化(SNV)处理,结果为如图3所示的125×8归一化矩阵。然后通过进行PCA处理,计算得到PCA前6个特征值:31.02,22.55,2.86,0.25,0.19,0.01;PCA前6个特征向量为125×6的数据矩阵,如下表2所示。
[0071] 表2 PCA前6个特征向量
[0072]
[0073] 2、使用优化模糊鉴别向量提取方法提取最优训练样本的鉴别信息:
[0074] 对表2中得到的结果(125×6的数据矩阵)进行特征提取,具体步骤如下:
[0075] (1)分别计算模糊隶属度的值uik和类中心的值vi:
[0076]
[0077]
[0078] 式中,xk为第k个样本, 和 分别为第i类样本均值和第j类的样本均值,uik是样本xk隶属于类别i的模糊隶属度,vi是第i类的类中心值,c为类别数,n为样本数,m为权重指数,且m>1。
[0079] 选取c=5、n=125、m=2,经过计算可得到5个类中心值,每个类中心值均为一个6维的向量。最优训练样本的模糊隶属度如图4所示。
[0080] (2)计算模糊类间离散度矩阵和模糊总体离散度矩阵:
[0081]
[0082]
[0083] 式中, 为第k个样本xk隶属于第i类的模糊隶属度的权重值,mf为权重系数,取mf=1.5;c为类别数,n为样本数, 为样本的总均值, vi是第i类的类中心值,上标T代表矩阵的转置运算。
[0084] (3)根据下式求最大特征值和特征向量:
[0085]
[0086] 其中, 为模糊总体离散度矩阵的逆矩阵,SfB为模糊类间离散度矩阵,ψ和λ分别代表上面方程所求的特征向量和对应特征值。计算得到最大特征值λ1和与之相对应的特征向量ψ1,将ψ1作为最优鉴别向量集的第一个向量。
[0087] (4)计算最优鉴别向量集:
[0088]
[0089] 式中, Ψ=[ψ1,ψ2,...,ψr]T,ψr+1和β分别为上式所求特征向量和所对应的特征值,I为单位矩阵,ψ1,ψ2,...,ψr即为一组最优鉴别向量集。
[0090] 根据前r个最优鉴别向量ψ1,ψ2,...,ψr(r≥1)计算得到第(r+1)个最优鉴别向量ψr+1。经过计算,可以获得p(p=4)个最优鉴别向量组成最优鉴别向量集{ψ1,ψ2,...,ψp}。
[0091] 步骤四、对最优鉴别向量集{ψ1,ψ2,...,ψp}进行线性转换:
[0092] Y=[ψ1,ψ2,...,ψp]TX,[ψ1,ψ2,...,ψp]T表示最优鉴别向量集的转置矩阵,X为测试样本集,Y为测试样本投影到最优鉴别向量集上得到的投影样本集。完成测试样本从实数空间 到 线性转换。
[0093] 步骤五、将步骤四所得到的投影样本集Y数据利用K近邻分类器进行分类,设置参数K的值为3,分类准确率可达90%。