首页 > 专利 > 华为技术有限公司 > 一种稀疏模型中字典的表示方法和设备专利详情

一种稀疏模型中字典的表示方法和设备   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2013-04-03
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2014-11-12
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2017-09-12
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2033-04-03
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201310115751.3 申请日 2013-04-03
公开/公告号 CN104103060B 公开/公告日 2017-09-12
授权日 2017-09-12 预估到期日 2033-04-03
申请年 2013年 公开/公告年 2017年
缴费截止日
分类号 G06K9/62 主分类号 G06K9/62
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 7
权利要求数量 8 非专利引证数量 1
引用专利数量 2 被引证专利数量 0
非专利引证 1、王春光.基于稀疏分解的心电信号特征波检测及心电数据压缩《.中国博士学位论文全文数据库 医药卫生科技辑》.2010,第2010年卷(第10期),向馗等.主元分析中的稀疏性《.电子学报》.2012,第40卷(第12期),顾莹.基于压缩感知的分布式视频编码及其图像超分辨率重建研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2012,第2012年卷(第04期),王春光.基于稀疏分解的心电信号特征波检测及心电数据压缩《.中国博士学位论文全文数据库 医药卫生科技辑》.2010,第2010年卷(第10期),;
引用专利 CN102708576A、CN102354395A 被引证专利
专利权维持 7 专利申请国编码 CN
专利事件 转让 事务标签 公开、实质审查、授权、权利转移
申请人信息
申请人 第一申请人
专利权人 华为技术有限公司 当前专利权人 铜陵汇恒电子科技有限公司
发明人 王宇、张宇、王栋、唐胜 第一发明人 王宇
地址 广东省深圳市龙岗区坂田华为总部办公楼 邮编 518129
申请人数量 1 发明人数量 4
申请人所在省 广东省 申请人所在市 广东省深圳市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
北京中博世达专利商标代理有限公司 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
申健
摘要
本发明实施例提供的一种稀疏模型中字典的表示方法和设备,涉及信号处理领域,通过利用离散字典的求解过程降低重构误差,并通过求解过程得到明确的样本类别信息。该方法包括:根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;输出通过统计所述样本子集得到的所述新的信号。本发明的实施例应用于数字信号处理和图像处理技术。
  • 摘要附图
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图1
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图2
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图3
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图4
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图5
    一种稀疏模型中字典的表示方法和设备
  • 说明书附图:图6
    一种稀疏模型中字典的表示方法和设备
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2020-11-20 专利权的转移 登记生效日: 2020.11.10 专利权人由重庆凯拓科技发展有限公司变更为铜陵汇恒电子科技有限公司 地址由401120 重庆市渝北区龙溪街道红锦大道498号佳乐紫光1幢5-商业变更为244000 安徽省铜陵市大学生创业园内ZC030号
2 2017-09-12 授权
3 2014-11-12 实质审查的生效 IPC(主分类): G06T 7/00 专利申请号: 201310115751.3 申请日: 2013.04.03
4 2014-10-15 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种稀疏模型中字典的表示方法,其特征在于,包括:
根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个所述信号样本的样本子集进行统计组成新的信号;
输出所述新的信号;
其中,所述稀疏模型具体表现为: 当{d1,d2,...,dk}
∈X时,其中ai为稀疏编码, 中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数;
在所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,所述方法还包括:
设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为 所述样本个数K为所述样本集中任意选择的样本个数。

2.根据权利要求1所述的方法,其特征在于,所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码,包括:
设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。

3.根据权利要求1~2任一所述的方法,其特征在于,所述将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,包括:
设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,
为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求
解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代 换 为 E ,使 得 所 述 计 算 离 散 字 典 的 表 达 式 转 换 为并计算离散字典,其中X为已知的样
本集合,A为所述稀疏编码,di为已知字典基元,所述E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号,所述 为X-DA在字典基元di依次代入后扩展得到。

4.根据权利要求3所述的方法,其特征在于,所述当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,包括:
根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为||E-dkA||2;
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。

5.一种电子设备,其特征在于,包括:
采集单元,用于根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
计算单元,用于根据所述采集单元采集的所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
所述计算单元,还用于将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个所述信号样本的样本子集进行统计组成新的信号;
发送单元,用于输出所述新的信号;
其中,所述稀疏模型具体表现为: 当{d1,d2,...,dk}
∈X时,其中ai为稀疏编码, 中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数;
所述设备还包括:
设置单元,用于在根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
选取单元,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为 所述样本个数K为所述样本集中任意选择的样本个数。

6.根据权利要求5所述的设备,其特征在于,所述计算单元包括:
计算子单元,用于设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式
所述计算子单元,还用于根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。

7.根据权利要求5-6任一所述的设备,其特征在于,所述计算单元,还包括:
转换子单元,用于设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时, 所述稀疏编码为A={a1,a2,……,aN},其中,
为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求
解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
所述转换子单元,还用于当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的 代换为E,使得所述计算离散字典的表达式转换为
并计算离散字典,其中X为已知的样
本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号, 为X-DA在字典基元di依次代入后扩展得到。

8.根据权利要求7所述的设备,其特征在于,所述计算单元,具体用于根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为
将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为||E-dkA||2;
若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
或者,
若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
说明书

技术领域

[0001] 本发明涉及信号处理领域,尤其涉及一种稀疏模型中字典的表示方法和设备。

背景技术

[0002] 在信号技术发展中,传统信号处理方法面临着大量的数据储存和数据传输的问题,对于处理大量数据存储和数据传输的问题,随着压缩感知理论的提出以远低于传统奈奎斯特采样率的方式对信号进行处理,其中,压缩感知是在一个合适的过完备基元集上获取和重构信号的理论。这里输入信号只需若干个基元就可以被准确重构,所以重构信号在过完备基元集上可以求得稀疏编码,通过求得稀疏编码,由信号集合生成过完备字典的过程为稀疏建模。所述稀疏模型包括所述稀疏编码和所述由信号集合生成的过完备字典。
[0003] 由于稀疏模型中重构信号出现的重构误差大,为了减小重构误差,在字典学习上现有技术大体分为两大类:第一,人工选择样本集合作为冗余的大字典,其中,人工选择大量高质量的信号样本作为字典,从而保证稀疏编码具有较好的分类能力,但是由于人工选择的方式不能保证减少重构误差,而且过大的字典会导致过高的计算复杂度和存储负担,并且由于无法选择有效的样本子集从而选择大量的样本作为字典,进而增加计算和存储的负担;
[0004] 第二,采用连续的方法求解相对紧凑的字典,其中,连续方法的目标是降低重构误差,通过求解得到误差矩阵,然后采用矩阵分解方法求解特征向量作为字典基元来减少误差,进而将重构误差作为目标函数中的一项,采用随机梯度下降等方法,求解可以降低误差的字典基元。但是,由于连续字典中的基元不属于样本集合,所以可解释性差也不具有语义;在连续字典上得到的稀疏编码不具有明确的类别信息。

发明内容

[0005] 本发明的实施例提供一种稀疏模型中字典的表示方法和设备,通过利用离散字典的求解过程降低重构误差,并通过求解过程得到明确的样本类别信息。
[0006] 为达到上述目的,本发明的实施例采用如下技术方案:
[0007] 第一方面,提供一种稀疏模型中字典的表示方法,包括:
[0008] 根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
[0009] 根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
[0010] 将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
[0011] 输出通过统计所述样本子集得到的所述新的信号。
[0012] 在第一种可能的实现方式中,结合第一方面具体包括,所述稀疏模型具体表现为:当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为
稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
[0013] 在第二种可能的实现方式中,结合第一方面或第一方面中的第一种可能的实现方式具体包括,在所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,所述方法还包括:
[0014] 设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为循环迭代计算结束的判断条件;
[0015] 将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为 所述样本个数K为所述样本集中任意选择的样本个数。
[0016] 在第三种可能的实现方式中,结合第一方面或第一方面包含的任一种可能的实现方式具体包括,所述根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码,包括:
[0017] 设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式[0018] 根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
[0019] 在第四种可能的实现方式中,结合第一方面或第一方面包含的任一种可能的实现方式具体包括,所述将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,包括:
[0020] 设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时,所述稀疏编码为A={a1,a2,……,aN},其中,为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于求
解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
[0021] 当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的代换为E,使得所述计算离散字典的表达式转换为并计算离散字典,其中X为已知的样本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号, 为X-DA
在字典基元di依次代入后扩展得到。
[0022] 在第五种可能的实现方式中,结合第四种可能的实现方式具体包括,所述当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,包括:
[0023] 根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为[0024] 将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为
[0025] 若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
[0026] 或者,
[0027] 若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
[0028] 第二方面,提供一种电子设备,包括:
[0029] 采集单元,用于根据接收的信号采集信号样本,并通过所述信号样本的数据分布特征建立稀疏模型;
[0030] 计算单元,用于根据所述采集单元采集的所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码;
[0031] 所述计算单元,还用于将所述稀疏编码迭代入所述稀疏模型计算得到离散字典,通过循环迭代所述离散字典处理得到至少一个所述信号样本的样本子集,直至满足预定的判断条件时终止所述循环迭代,并将所述至少一个信号样本进行统计组成新的信号;
[0032] 发送单元,用于输出通过统计所述样本子集得到的所述新的信号。
[0033] 在第一种可能的实现方式中,结合第二方面具体包括,所述稀疏模型具体表现为:当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为
稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为所述样本子集中的样本,xi为组成所述样本集合X的单个样本,N为样本个数,系数λ用于限定所述稀疏编码的稀疏程度,其中,所述稀疏程度为所述稀疏编码中的非零元个数。
[0034] 在第二种可能的实现方式中,结合第二方面或第一种可能的实现方式具体包括,所述设备还包括:
[0035] 设置单元,用于在根据所述信号样本通过计算所述稀疏模型得到所述信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,所述循环总数T为所述稀疏模型循环迭代计算的循环次数,所述最大误差值eta为通过所述稀疏模型计算重构误差时设定的误差值的阈值,其中,所述循环总数或所述最大误差值为计算循环迭代结束的判断条件;
[0036] 选取单元,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,所述样本集归一化为将所述样本集中的样本通过平方求和化为常量1,所述样本集{x1,x2,……,xN}归一化表示为 所述样本个数K为所述样本集中任意选择的样本个数。
[0037] 在第三种可能的实现方式中,结合第二方面或第二方面包含的任一种可能的实现方式具体包括,所述计算单元包括:
[0038] 计算子单元,用于设定所述离散字典为已知条件,并将所述离散字典带入所述稀疏模型的表达式
[0039] 所述计算子单元,还用于根据所述表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,所述N个样本的稀疏编码为所述稀疏编码的对应多个样本的编码个数,所述稀疏编码为{a1,a2,……,aN}。
[0040] 在第四种可能的实现方式中,结合第二方面或第二方面包含的任一种可能的实现方式具体包括,所述计算单元,还包括:
[0041] 转换子单元,用于设定所述稀疏编码为已知条件,并将所述稀疏编码代入所述稀疏模型的表达式中得到计算离散字典的表达式,所述计算离散字典的表达式为当{d1,d2,...,dk}∈X时, 所述稀疏编码为A={a1,a2,……,aN},其中, 为所述稀疏编码设定为已知条件后代入所述稀疏模型表达式用于
求解所述离散字典的范式,所述X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
[0042] 所述转换子单元,还用于当所述样本子集中的字典基元di依次代入所述计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算所述离散字典的表达式中的 代换为E,使得所述计算离散字典的表达式转换为并计算离散字典,其中X为已知的样
本集合,A为所述稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号, 为X-DA在字典基元di依次代入后扩展得
到。
[0043] 在第五种可能的实现方式中,结合第四种可能的实现方式具体包括,所述计算单元,具体用于根据所述稀疏编码选取引用所述第K个字典基元的样本子集,所述样本子集为[0044] 将所述样本子集中每个样本代入所述计算离散字典的表达式的转换式计算所述样本在所述转换式中的误差值,并将所述误差值与当前误差值进行比较,所述当前误差值为
[0045] 若所述误差值大于所述当前误差值,则舍弃所述误差值,并在所述样本子集中除去所述误差值对应的样本;
[0046] 或者,
[0047] 若所述误差值小于所述当前误差值,则保留所述样本对应的误差值,并更新为第一当前误差值,且在所述样本子集中除去所述误差值对应的样本,循环将所述样本子集中的样本带入所述转换式中计算误差值,直至所述样本子集为空集。
[0048] 本发明实施例提供的稀疏模型中字典的表示方法和设备,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。

实施方案

[0056] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0057] 本发明提供的一种稀疏模型中字典的表示方法,参照图1所示,具体包括以下流程:
[0058] 101、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
[0059] 其中,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
[0060] 102、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
[0061] 这里电子设备通过采用最小绝对收缩选择算子Lasso(Least Absolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得 并任意选择K个样本作为初始化字典D,并通过固定字典D,将
[0062] 变换为 再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN}。
[0063] 本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
[0064] 103、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
[0065] 其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
[0066] 这里 通 过固 定稀 疏编 码A ={ a1 ,a 2 ,…… ,a N} ,将A 迭代回得到求解离散字典的转换式 其中{d1,d2,...,dk}∈X。通过将字典基元di更新至第K个,并固定其他字典基元,将转换式中的代换为E再次转换得到
[0067] 具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
[0068] 104、电子设备输出通过统计样本子集得到的新的信号。
[0069] 本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0070] 具体的,以下结合具体的实施例进行说明。
[0071] 可以在图1所示的实施例的基础上,参照图2所示,本发明的实施例提供了一种稀疏模型中字典的表示方法,主要包括:电子设备通过计算稀疏模型得到稀疏编码,再根据稀疏编码迭代回稀疏模型表达式计算得到离散字典;参照图2所示,为电子设备通过计算得到稀疏编码,再通过迭代根据计算该稀疏编码得到离散字典的过程,具体步骤如下:
[0072] 201、电子设备根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型。
[0073] 其中,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,为稀疏编码的j次方,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,xi为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,这里稀疏程度为稀疏编码中的非零元个数。
[0074] 202、电子设备设定循环总数为T,最大误差值为eta。
[0075] 其中,该循环总数T为稀疏模型循环迭代计算的循环次数,该最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件。
[0076] 这里预先设定循环总数和最大误差值,用于判定在迭代计算离散字典时,多次为离散字典选取样本提供判定标准,当循环迭代的次数达到T次时,计算结束;或者,当选取的样本的误差值小于最大误差值eta时,计算结束。
[0077] 203、电子设备将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典。
[0078] 其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为 样本个数K为该样本集中任意选择的样本个数。
[0079] 这里本发明实施例计算离散字典采用先固定一离散字典再计算出稀疏编码,再由稀疏编码迭代回原式进行变换计算得到离散字典。故步骤203在进行计算稀疏编码前首先确定初始化字典,使得通过固定初始化字典这一变量计算稀疏编码。
[0080] 204、电子设备根据该信号样本通过计算稀疏模型得到信号的稀疏编码。
[0081] 这里电子设备通过采用最小绝对收缩选择算子Lasso(Least Absolute Shrinkage and Selection Operator)算法求解稀疏编码,首先归一化样本集{x1,x2,……,xN},使得 并任意选择K个样本作为初始化字典D,并通过设定字典D为已知条件,将 变换为 再由最小角回归Lasso-LARS算法(Least Angle Regression)求解变换式,分别得到N个样本的稀疏编码{a1,a2,……,aN},其中,N个样本的稀疏编码为该稀疏编码的对应多个样本的编码个数,。
[0082] 本发明实施例提供的稀疏模型的表达式中的||·||为范式,本发明实施例提到的范式为一范式与二范式。
[0083] 在求解过程中,设定的λ值越大,稀疏编码中的非零项越少,重构误差也越大。故在本发明实施例提供设定的系数λ为0.1~0.25范围内的任一值用于限定该稀疏编码的稀疏程度,其中,当系数λ为0.15时,稀疏模型的分类能力达到峰值,具体的,系数λ波动通常在0.15正负误差在0.05之间计算得到峰值,这里稀疏程度为该稀疏编码中的非零元个数。这里不仅可以得到合适的稀疏编码还能够减小重构误差,具体的当使用Lasso-LARS算法计算稀疏编码时,会为该字典基元分配系数,该系数通常较小,使得重构后的样本误差位于该字典基元与其他字典基元的等分线上,循环分配过程,知道选择足够的字典基元来重构样本。
[0084] 当稀疏编码的非零元个数远远小于字典基元的个数时,Lasso算法是稳定且收敛的,此时通过控制λ的值大于等于0.01则可以保证稀疏编码的稀疏程度。
[0085] 205、电子设备将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号。
[0086] 其中,该离散字典为样本集合X中的样本子集D,这里样本子集D为字典基元dj组成的。
[0087] 这里通过设定稀疏编码A={a1,a2,……,aN}为已知条件,将A迭代回得到求解离散字典的转换式,当{d1,d2,...,dk}∈X时,其中, 为稀疏编码设定为已知条件后
代入稀疏模型表达式用于求解所述离散字典的范式,X为已知的样本集合,D为所述离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合。通过将字典基元di更新至第K个,并设定其他字典基元为已知条件,将转换式中的 代换为E再次转换得到
并计算离散字典,其中X为已知的样
本集合,A为稀疏编码,di为字典基元,E-dkA用于通过筛选样本计算得到离散字典,以便构成新的输出信号, 为X-DA在字典基元di依次代入后扩展得到。
[0088] 具体的,E中A为固定的稀疏编码矩阵,字典基元di也是固定值,X是已知样本集合,故E可以通过计算得知,这里通过更新字典基元di至字典基元dk解得离散字典,即通过字典基元对应样本子集筛选求解的离散字典中的字典基元,使得求解得出的离散字典能够保留样本的数据分布特征,且能够得到稀疏编码并具有明确的类别信息。
[0089] 进一步的,当样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,包括:
[0090] 205a、电子设备根据稀疏编码选取引用第K个字典基元的样本子集。
[0091] 其中,该样本子集为
[0092] 205b、电子设备将样本子集中每个样本代入计算离散字典的表达式的转换式计算该样本在转换式中的误差值,并将该误差值与当前误差值进行比较。
[0093] 其中,该当前误差值表示为‖E-dkA||2。
[0094] 205c、若误差值大于当前误差值,则舍弃误差值,并在样本子集中除去误差值对应的样本。
[0095] 或者,
[0096] 205d、若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在样本子集中除去误差值对应的样本,循环将该样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
[0097] 具体的,本发明实施例提供的通过使用Lasso算法计算离散字典是通过循环迭代实现的,即当步骤204根据固定的离散字典计算稀疏编码后,进一步的通过步骤205固定稀疏编码计算离散字典得到组成字典的字典基元,然后再进行步骤204固定新的离散字典求解稀疏编码进而通过步骤205得到新的字典基元如此循环,直至得到能够对应已知样本集合X的离散字典。
[0098] 206、电子设备输出通过统计样本子集得到的新的信号。
[0099] 这里本发明实施例提供计算离散字典的方法中,由于离散字典中的字典基元来自样本集合X,故在样本选取的时候总会存在与字典基元dk相同的样本xj。根据Lasso算法,样本集合X中的xj会选择dk,故在更新dk时,如果存在其它样本不能减少e的样本,则xj会被选为字典基元,且e不变;相反的,如果存在其他样本能够减少e的样本,则新样本被保存,e减小。其中,在字典更新的过程中,重构误差会保持不变或减少。
[0100] 其中,本发明实施例提供的稀疏模型中字典的表示方法还可以通过正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)算法实现,由于OMP算法更适合正交基元字典,且本发明实施例提供实现稀疏模型中字典的表示方法的处理对象是过完备字典,故使用Lasso算法使得到的过完备字典更稳定更准确。
[0101] 本发明实施例提供的稀疏模型中字典的表示方法,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0102] 具体的,本发明实施例提供的稀疏模型中字典的表示方法具体参照图3所示,以三维样本为例,从100个三维数据集合中学习得到一个3×10的离散字典,左图为样本集空间部分,右图为离散字典的字典基元分布(为右图所示的叉点),其中,该离散字典中的基元为样本子集。
[0103] 这里通过计算稀疏模型中的离散字典保留了样本集空间的数据分布特征,即在处理接收到的信号后在显示该信号时能够保证原有信号的特征。
[0104] 本发明实施例提供的稀疏模型中字典的表示方法,通过对离散字典的分析发现通过学习离散字典可以保留信号样本的数据分布特征,并由于离散字典中没有混淆的字典基元,使得在离散字典上能够得到的稀疏编码有明确的类别信息。
[0105] 本发明实施例提供一种电子设备3,该电子设备具体为信号处理系统中任一种电子设备,如计算机、笔记本电脑等在信号处理系统中任一能够实现稀疏模型中字典的表示方法的设备,以可以实现本发明的实施例所提供的上述任一稀疏模型中字典的表示方法为准,参照图4所示,包括:
[0106] 采集单元31,用于根据接收的信号采集信号样本,并通过该信号样本的数据分布特征建立稀疏模型;
[0107] 计算单元32,用于根据采集单元采集的信号样本通过计算稀疏模型得到该信号的稀疏编码;
[0108] 计算单元32,还用于将该稀疏编码迭代入稀疏模型计算得到离散字典,通过循环迭代离散字典处理得到至少一个信号样本的样本子集,直至满足预定的判断条件时终止循环迭代,并将至少一个信号样本进行统计组成新的信号;
[0109] 发送单元33,用于输出通过统计样本子集得到的新的信号。
[0110] 本发明实施例提供的电子设备,通过计算稀疏模型得到稀疏编码,然后通过迭代计算根据该稀疏编码得到离散字典,其中通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过学习离散字典进而解决了重构误差大的问题,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0111] 进一步的,稀疏模型具体表现为: 当{d1,d2,...,dk}∈X时,其中ai为稀疏编码,中的j为稀疏编码的ai的序号,{d1,d2,...,dk}为样本集合X的样本子集,dj为样本子集中的样本,x为组成样本集合X的单个样本,N为样本个数,系数λ用于限定稀疏编码的稀疏程度,其中,该稀疏程度为稀疏编码中的非零元个数。
[0112] 可选的,参照图5所示,电子设备3还包括:
[0113] 设置单元34,用于在根据信号样本通过计算稀疏模型得到信号的稀疏编码之前,设定循环总数为T,最大误差值为eta,该循环总数T为稀疏模型循环迭代计算的循环次数,最大误差值eta为通过稀疏模型计算重构误差时设定的误差值的阈值,其中,循环总数或最大误差值为计算结束的判定条件;
[0114] 选取单元35,用于将样本集{x1,x2,……,xN}归一化,并任意选择K个样本作为离散字典,其中,该样本集归一化为将样本集中的样本通过平方求和化为常量1,该样本集{x1,x2,……,xN}归一化表示为 该样本个数K为样本集中任意选择的样本个数。
[0115] 可选的,参照图6所示,计算单元32包括:
[0116] 计算子单元321,用于设定离散字典为已知条件,并将离散字典带入稀疏模型的表达式
[0117] 计算子单元321,还用于根据表达式通过最小角回归Lasso-LARS算法得到N个样本的稀疏编码,其中,N个样本的稀疏编码为稀疏编码的对应多个样本的编码个数,稀疏编码为{a1,a2,……,aN}。
[0118] 进一步的,参照图6所示,计算单元32,还包括:
[0119] 转换子单元322,用于设定稀疏编码为已知条件,并将稀疏编码代入稀疏模型的表达式中得到计算离散字典的表达式,计算离散字典的表达式为当{d1,d2,...,dk}∈X时,稀疏编码 为A= {a1 ,a 2 ,… …,aN} ,其中 ,为稀疏编码设定为已知条件后代入稀疏模型表达式用于求解离散字
典的范式,X为已知的样本集合,D为离散字典,{d1,d2,...,dk}∈D为离散字典中的样本集合;
[0120] 转换子单元322,还用于当该样本子集中的字典基元di依次代入计算离散字典的表达式,并更新至第K个字典基元时,设定其他字典基元为已知条件,将计算离散字典的表达式中的代换为E,使得该计算离散字典的表达式转换为并计算离散字典,其中X为已知的样本集合,A为稀疏编码,di为已知字典基元,E-dkA用于通过筛选样本计算得到所述离散字典,以便构成新的输出信号, 为X-DA在字
典基元di依次代入后扩展得到。
[0121] 进一步的,计算单元32,具体用于根据稀疏编码选取引用第K个字典基元的样本子集,样本子集为
[0122] 将样本子集中每个样本代入计算离散字典的表达式的转换式计算样本在转换式中的误差值,并将误差值与当前误差值进行比较,该当前误差值为||E-dkA||2;
[0123] 若误差值大于当前误差值,则舍弃该误差值,并在样本子集中除去该误差值对应的样本;
[0124] 或者,
[0125] 若误差值小于当前误差值,则保留样本对应的误差值,并更新为第一当前误差值,且在该样本子集中除去误差值对应的样本,循环将样本子集中的样本带入转换式中计算误差值,直至样本子集为空集。
[0126] 本发明实施例提供的电子设备,通过计算稀疏模型字典得到稀疏编码,并通过限定系数λ的取值范围控制稀疏编码的稀疏程度,通过迭代计算根据该稀疏编码得到离散字典,且在计算离散字典部分通过对样本的选取使得重构误差保持不变或者减少,从而整体的减小了重构误差,且通过求解离散字典减小了计算量并通过求解离散字典得到样本明确的类别信息。
[0127] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

附图说明

[0049] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0050] 图1为本发明实施例提供的一种稀疏模型中字典的表示方法的流程示意图;
[0051] 图2为本发明实施例提供的另一种稀疏模型中字典的表示方法的流程示意图;
[0052] 图3为本发明实施例提供的一种稀疏模型中字典的表示方法的技术效果示意图;
[0053] 图4为本发明实施例提供的一种电子设备的结构示意图;
[0054] 图5为本发明实施例提供的另一种电子设备的结构示意图;
[0055] 图6为本发明实施例提供的又一种电子设备的结构示意图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号