[0056] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0057] 本发明提供的一种稀疏模型中字典的表示方法,参照图1所示,具体包括以下流程:
[0058] 101、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
[0059] 其中,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
[0060] 102、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
[0061] 这里电子设备通过采用最小绝对收缩选择算子Lasso(Least Absolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得 并任意选择K个样本作为初始化字典D,并通过固定字典D,将
[0062] 变换为 再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN}。
[0063] 本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
[0064] 103、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
[0065] 其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
[0066] 这里 通 过固 定稀 疏编 码A ={ a1 ,a 2 ,…… ,a N} ,将A 迭代回得到求解离散字典的转换式 其中{d1,d2,...,dk}∈X。通过将字典基元di更新至第K个,并固定其他字典基元,将转换式中的代换为E再次转换得到
[0067] 具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
[0068] 104、电子设备输出通过统计样本子集得到的新的信号。
[0069] 本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0070] 具体的,以下结合具体的实施例进行说明。
[0071] 可以在图1所示的实施例的基础上,参照图2所示,本发明的实施例提供了一种稀疏模型中字典的表示方法,主要包括:电子设备通过计算稀疏模型得到稀疏编码,再根据稀疏编码迭代回稀疏模型表达式计算得到离散字典;参照图2所示,为电子设备通过计算得到稀疏编码,再通过迭代根据计算该稀疏编码得到离散字典的过程,具体步骤如下:
[0072] 201、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
[0073] 其中,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
[0074] 202、电子设备设定循环总数为T,最大误差值为eta。
[0075] 其中,该循环总数T为稀疏模型循环迭代计算的循环次数,该最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件。
[0076] 这里预先设定循环总数和最大误差值,用于判定在迭代计算离散字典时,多次为离散字典选取样本提供判定标准,当循环迭代的次数达到T次时,计算结束;或者,当选取的样本的误差值小于最大误差值eta时,计算结束。
[0077] 203、电子设备将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典。
[0078] 其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为 样本个数K为该样本集中任意选择的样本个数。
[0079] 这里本发明实施例计算离散字典采用先固定一离散字典再计算出稀疏编码,再由稀疏编码迭代回原式进行变换计算得到离散字典。故步骤203在进行计算稀疏编码前首先确定初始化字典,使得通过固定初始化字典这一变量计算稀疏编码。
[0080] 204、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
[0081] 这里电子设备通过采用最小绝对收缩选择算子Lasso(Least Absolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得 并任意选择K个样本作为初始化字典D,并通过设定字典D为已知条件,将 变换为 再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN},其中,N个样本的稀疏编码为该稀疏编码的对应多个样本的编码个数,。
[0082] 本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
[0083] 在求解过程中,设定的λ值越大,稀疏编码中的非零项越少,重构误差也越大。故在本发明实施例提供设定的系数λ为0.1~0.25范围内的任一值用于限定该稀疏编码的稀疏程度,其中,当系数λ为0.15时,稀疏模型的分类能力达到峰值,具体的,系数λ波动通常在0.15正负误差在0.05之间计算得到峰值,这里稀疏程度为该稀疏编码中的非零元个数。这里不仅可以得到合适的稀疏编码还能够减小重构误差,具体的当使用Lasso-LARS算法计算稀疏编码时,会为该字典基元分配系数,该系数通常较小,使得重构后的样本误差位于该字典基元与其他字典基元的等分线上,循环分配过程,知道选择足够的字典基元来重构样本。
[0084] 当稀疏编码的非零元个数远远小于字典基元的个数时,Lasso算法是稳定且收敛的,此时通过控制λ的值大于等于0.01则可以保证稀疏编码的稀疏程度。
[0085] 205、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
[0086] 其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
[0087] 这里通过设定稀疏编码A={a1,a2,……,aN}为已知条件,将A迭代回得到求解离散字典的转换式,当{d1,d2,...,dk}∈X时,其中, 为稀疏编码设定为已知条件后
代入稀疏模型表达式用于求解所述离散字典的范式,X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合。通过将字典基元di更新至第K个,并设定其他字典基元为已知条件,将转换式中的 代换为E再次转换得到
并计算离散字典,其中X为已知的样
本集合,A为稀疏编码,di为字典基元,E-dkA用于通过筛选样本计算得到离散字典,以便构成新的输出信号, 为X-DA在字典基元di依次代入后扩展得到。
[0088] 具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
[0089] 进一步的,当样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,包括:
[0090] 205a、电子设备根据稀疏编码选取引用第K个字典基元的样本子集。
[0091] 其中,该样本子集为
[0092] 205b、电子设备将样本子集中每个样本代入计算离散字典的表达式的转换式计算该样本在转换式中的误差值,并将该误差值与当前误差值进行比较。
[0093] 其中,该当前误差值表示为‖E-dkA||2。
[0094] 205c、若误差值大于当前误差值,则舍弃误差值,并在样本子集中除去误差值对应的样本。
[0095] 或者,
[0096] 205d、若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在样本子集中除去误差值对应的样本,循环将该样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
[0097] 具体的,本发明实施例提供的通过使用Lasso算法计算离散字典是通过循环迭代实现的,即当步骤204根据固定的离散字典计算稀疏编码后,进一步的通过步骤205固定稀疏编码计算离散字典得到组成字典的字典基元,然后再进行步骤204固定新的离散字典求解稀疏编码进而通过步骤205得到新的字典基元如此循环,直至得到能够对应已知样本集合X的离散字典。
[0098] 206、电子设备输出通过统计样本子集得到的新的信号。
[0099] 这里本发明实施例提供计算离散字典的方法中,由于离散字典中的字典基元来自样本集合X,故在样本选取的时候总会存在与字典基元dk相同的样本xj。根据Lasso算法,样本集合X中的xj会选择dk,故在更新dk时,如果存在其它样本不能减少e的样本,则xj会被选为字典基元,且e不变;相反的,如果存在其他样本能够减少e的样本,则新样本被保存,e减小。其中,在字典更新的过程中,重构误差会保持不变或减少。
[0100] 其中,本发明实施例提供的稀疏模型中字典的表示方法还可以通过正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)算法实现,由于OMP算法更适合正交基元字典,且本发明实施例提供实现稀疏模型中字典的表示方法的处理对象是过完备字典,故使用Lasso算法使得到的过完备字典更稳定更准确。
[0101] 本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0102] 具体的,本发明实施例提供的稀疏模型中字典的表示方法具体参照图3所示,以三维样本为例,从100个三维数据集合中学习得到一个3×10的离散字典,左图为样本集空间部分,右图为离散字典的字典基元分布(为右图所示的叉点),其中,该离散字典中的基元为样本子集。
[0103] 这里通过计算稀疏模型中的离散字典保留了样本集空间的数据分布特征,即在处理接收到的信号后在显示该信号时能够保证原有信号的特征。
[0104] 本发明实施例提供的稀疏模型中字典的表示方法,通过对离散字典的分析发现通过学习离散字典可以保留信号样本的数据分布特征,并由于离散字典中没有混淆的字典基元,使得在离散字典上能够得到的稀疏编码有明确的类别信息。
[0105] 本发明实施例提供一种电子设备3,该电子设备具体为信号处理系统中任一种电子设备,如计算机、笔记本电脑等在信号处理系统中任一能够实现稀疏模型中字典的表示方法的设备,以可以实现本发明的实施例所提供的上述任一稀疏模型中字典的表示方法为准,参照图4所示,包括:
[0106] 采集单元31,用于根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型;
[0107] 计算单元32,用于根据采集单元采集的信号样本通过计算稀疏模型得到该信号的稀疏编码;
[0108] 计算单元32,还用于将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号;
[0109] 发送单元33,用于输出通过统计样本子集得到的新的信号。
[0110] 本发明实施例提供的电子设备,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0111] 进一步的,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,x为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,其中,该稀疏程度为稀疏编码中的非零元个数。
[0112] 可选的,参照图5所示,电子设备3还包括:
[0113] 设置单元34,用于在根据信号样本通过计算稀疏模型得到信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,该循环总数T为稀疏模型循环迭代计算的循环次数,最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件;
[0114] 选取单元35,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为 该样本个数K为样本集中任意选择的样本个数。
[0115] 可选的,参照图6所示,计算单元32包括:
[0116] 计算子单元321,用于设定离散字典为已知条件,并将离散字典带入稀疏模型的表达式
[0117] 计算子单元321,还用于根据表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,N个样本的稀疏编码为稀疏编码的对应多个样本的编码个数,稀疏编码为{a1,a2,……,aN}。
[0118] 进一步的,参照图6所示,计算单元32,还包括:
[0119] 转换子单元322,用于设定稀疏编码为已知条件,并将稀疏编码代入稀疏模型的表达式中得到计算离散字典的表达式,计算离散字典的表达式为当{d1,d2,...,dk}∈X时,稀疏编码 为A= {a1 ,a 2 ,… …,aN} ,其中 ,为稀疏编码设定为已知条件后代入稀疏模型表达式用于求解离散字
典的范式,X为已知的样本集合,D为离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
[0120] 转换子单元322,还用于当该样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算离散字典的表达式中的代换为E,使得该计算离散字典的表达式转换为并计算离散字典,其中X为已知的样本集合,A为稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号, 为X-DA在字
典基元di依次代入后扩展得到。
[0121] 进一步的,计算单元32,具体用于根据稀疏编码选取引用第K个字典基元的样本子集,样本子集为
[0122] 将样本子集中每个样本代入计算离散字典的表达式的转换式计算样本在转换式中的误差值,并将误差值与当前误差值进行比较,该当前误差值为||E-dkA||2;
[0123] 若误差值大于当前误差值,则舍弃该误差值,并在样本子集中除去该误差值对应的样本;
[0124] 或者,
[0125] 若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在该样本子集中除去误差值对应的样本,循环将样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
[0126] 本发明实施例提供的电子设备,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0127] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。