首页 > 专利 > 杭州电子科技大学 > 一种支持向量数据描述的胸部影像异常检测方法专利详情

一种支持向量数据描述的胸部影像异常检测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2020-01-06

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2020-06-30

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2022-03-18

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2040-01-06

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202010011696.3	申请日	2020-01-06
公开/公告号	CN111242906B	公开/公告日	2022-03-18
授权日	2022-03-18	预估到期日	2040-01-06
申请年	2020年	公开/公告年	2022年
缴费截止日
分类号	G06T7/00 、G06V10/764 、G06V10/774 、G06V10/82 、G06K9/62 、G06N3/04 、G16H50/20	主分类号	G06T7/00
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	3
权利要求数量	4	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2018.05.24杨州等.基于多尺度特征融合的遥感图像场景分类《.光学精密工程》.2018,第26卷(第12期),第3099-3107页. Abdalbassir Abou-Elailah等.Fusion ofglobal and local side information usingSupport Vector Machine in transform-domain DVC《.IEEE》.2012,第574-578页.;
引用专利	US2018144466A	被引证专利
专利权维持	3	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	陈华华、陈哲、郭春生、应娜、叶学义	第一发明人	陈华华
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	5
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

杨舟涛

摘要

本发明公开了一种支持向量数据描述的胸部影像异常检测方法。本发明方法包括训练阶段和测试阶段。在训练阶段，构建并训练深度稀疏变分自编码器，获得训练数据集的隐藏层特征的均值，然后在稀疏变分自编码器基础上构建并训练深度支持向量数据描述网络，将均值作为超球体中心；在测试阶段，将测试数据集输入到训练好的深度支持向量数据描述网络中，计算得到异常分数和对应的ROC曲线并以此得到最佳阈值，当异常分数小于等于阈值则判为正常，否则判为异常。本发明方法采用了变分稀疏自编码器来进行特征学习，通过深度支持向量数据描述网络分离特征数据，具有较高的特征提取能力和较高的检测准确性。

摘要附图
说明书附图：为输入图像数据;
说明书附图：[0020]
说明书附图：为输入图像数据;-1

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2022-03-18	授权
2	2020-06-30	实质审查的生效	IPC(主分类): G06T 7/00 专利申请号: 202010011696.3 申请日: 2020.01.06
3	2020-06-05	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种支持向量数据描述的胸部影像异常检测方法，包括训练阶段和测试阶段，其特征在于：
所述的训练阶段具体方法是：
步骤(1).获取训练数据集；
所述的训练数据集由正常胸部影像数据构成，对训练数据集进行尺度规范化，并进行灰度归一化处理，将数据灰度值缩小到0到1；
步骤(2).构建和训练深度稀疏变分自编码器；
所述的深度稀疏变分自编码器包括编码网络和解码网络；编码网络对输入数据进行特征提取，并重采样形成新特征；解码网络对编码网络生成的新特征进行解码，解码网络输出的数据和编码网络输入的数据相同；
所述的编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成；
卷积模块层由三个卷积模块构成，每个卷积模块依次为多个大小是3×3的卷积核，池化层为核大小是2×2的最大池化层，池化层后接激活层；第一卷积模块卷积核数量为32，第二卷积模块卷积核数量为64，第三卷积模块卷积核数量为128；所有卷积核滑动步长为2，零边缘填充为1，激活层均使用Relu函数作为激活函数；
卷积模块层后连接一个全连接层，全连接层输入维数为2048，输出维数为1024；
采样模块层包括三个并联的采样层，分别用于生成隐藏层隐变量z的均值μ、对数方差
2
σ、对数峰值概率γ，
隐藏层用于生成隐变量z，采用两个辅助噪声参数ε和η对采样模块层输出进行重新采样得到z：z＝(ε⊙σ+μ)⊙(Sigmoid(apex×(η‑1+γ)))；其中，用于从平板分布中采样；用于尖峰概率γ的采样；apex表示峰值，为10～100的整数，⊙表示矢量之间的对位相乘；
解码网络依次由四个反卷积层和一个激活层构成；
第一反卷积层包含128个大小是3×3的卷积核，第二反卷积层包含64个大小是3×3的卷积核，第三反卷积层包含32个大小是3×3的卷积核，该三个反卷积层卷积核滑动步长均为4；第四反卷积层包含1个大小是3×3的卷积核，卷积核滑动步长为1；
激活层函数使用Sigmoid函数，用于复原输入数据；
使用钉板分布作为先验模拟zi所在空间的稀疏性，钉板分布定义在两个变量上：二元尖峰变量和连续平板变量；连续平板变量为高斯分布；尖峰变量取值为1或0，分别具有定义的概率α和1‑α；训练的目标函数如下：
为输入图像数据；为Xi的编码网络的输出隐变量；α为zi中每一
维非零的概率；J为zi所在空间的维度，J＝1024；L为样本的数量，σ[j]、μ[j]、γ[j]为矢量的第j个元素；训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代N_1次后结束，批大小为B_1；
训练结束时获得训练数据集的隐藏层特征的均值c，
步骤(3).构建和训练深度支持向量数据描述网络；
在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络；深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成；将训练数据输入到深度支持向量数据描述网络，以训练阶段结束时得到的均值c作为超球体中心，该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离；训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代M_1次结束，批大小为B_2；
测试阶段具体方法是：
步骤(Ⅰ).对测试图像进行尺度规范化，并进行灰度归一化处理，将数据灰度值缩小到0到1，得到测试数据XTi，
步骤(Ⅱ).将测试数据XTi输入到训练好的深度支持向量数据描述网络中，得到输出zti，由异常分数计算公式计算得到对应的异常分数sti，以及对应的ROC曲线，
2
sti＝||zti‑c|| ；将ROC曲线上距离坐标图左上方的点(0,1)处最近的点对应的异常分数作为最佳阈值th：若sti≤th，判定为正常；若sti＞th，判定为异常。

2.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法，其特征在于：
‑k
所述的函数Sigmoid(k)＝1/(1+e )。

3.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法，其特征在于：
600≤N_1≤1200，10≤B_1≤20。

4.如权利要求1所述的一种支持向量数据描述的胸部影像异常检测方法，其特征在于：
80≤M_1≤120，10≤B_2≤20。

说明书

技术领域

[0001] 本发明属于医疗影像处理技术领域，具体涉及一种支持向量数据描述的胸部影像异常检测方法。

背景技术

[0002] 伴随着社会的进步，医疗行业有了极大的发展，人们对于医疗的需求也越来越大。然而，目前影像科医生的培养周期长速度慢，跟不上医疗需求的发展速度，因此现在的医学影像自动化判断至关重要。医疗影像的异常检测，如骨骼X光片的异常检测，胸部CT影像的异常检测，肿瘤CT影像的异常检测，腹部彩超影像的异常检测等具有重要的临床应用价值。
异常检测模型可以用于降低影像科医生的工作量，提高诊断的效率，通过检测到的异常达到一个预诊断的效果，帮助临床医生给出更好的诊断方向和建议。

[0003] 传统的计算机辅助诊断通过手工提取的Haar‑like和HoG特征以及使用灰度共生矩阵计算得到纹理特征等并结合SVM分类器判断是否存在异常。但是，由于传统方法往往只能提取初级特征，随着样本数量的增大以及样本多样性增强，传统的方法存在表示能力有限、学习能力不强等问题。随着计算机技术的发展，目前提出了基于深度卷积神经网络的分类模型，通过传入标记后的数据进行有监督地学习，并根据学习到的特征进行分类判断。但是这个方法也存在一定不足：胸部影像数据集属于异常数据和正常数据在数量上差别很大的不平衡数据集，因此传统的有监督学习对数据的特征提取能力不够，会丢失一部分特征信息，进而影响识别的准确率。因此，如何在数据集中获得表征能力强，泛化性能好，识别率高的异常检测模型是一个关键问题。

发明内容

[0004] 本发明的目的就是针对现有胸部CT影像异常检测算法中存在的问题，提供一种支持向量数据描述的胸部影像异常检测方法，能够自动地提取图像深层次抽象特征，提高特征识别能力，以提高对异常数据的检测率。

[0005] 本发明方法包括训练阶段和测试阶段。

[0006] 训练阶段具体方法是：

[0007] 步骤(1).获取训练数据集；训练数据集由正常胸部影像数据构成，对训练数据集进行尺度规范化，并进行灰度归一化处理，将数据灰度值缩小到0到1。

[0008] 步骤(2).构建和训练深度稀疏变分自编码器。

[0009] 深度稀疏变分自编码器包括编码网络和解码网络；编码网络对输入数据进行特征提取，并重采样形成新特征；解码网络对编码网络生成的新特征进行解码，解码网络输出的数据和编码网络输入的数据相同。

[0010] 编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成。

[0011] 卷积模块层由三个卷积模块构成，每个卷积模块依次为多个大小是3×3的卷积核，池化层为核大小是2×2的最大池化层，池化层后接激活层。第一卷积模块卷积核数量为32，第二卷积模块卷积核数量为64，第三卷积模块卷积核数量为128。所有卷积核滑动步长为2，零边缘填充为1，激活层均使用Relu函数作为激活函数。

[0012] 卷积模块层后连接一个全连接层，全连接层输入维数为2048，输出维数为1024。

[0013] 采样模块层包括三个并联的采样层，分别用于生成隐藏层隐变量z的均值μ、对数2
方差σ、对数峰值概率γ，

[0014] 隐藏层用于生成隐变量z，采用两个辅助噪声参数ε和η对采样模块层输出进行重新采样得到z：z＝(ε⊙σ+μ)⊙(Sigmoid(apex×(η‑1+γ)))；其中，用于从平板分布中采样；用于尖峰概率γ的采样；apex表示峰值，为10～100的整数，‑k⊙表示矢量之间的对位相乘，函数运算Sigmoid(k)＝1/(1+e )。

[0015] 解码网络依次由四个反卷积层和一个激活层构成。

[0016] 第一反卷积层包含128个大小是3×3的卷积核，第二反卷积层包含64个大小是3×3的卷积核，第三反卷积层包含32个大小是3×3的卷积核，该三个反卷积层卷积核滑动步长均为4；第四反卷积层包含1个大小是3×3的卷积核，卷积核滑动步长为1。

[0017] 激活层函数使用Sigmoid函数，用于复原输入数据。

[0018] 使用钉板分布作为先验模拟zi所在空间的稀疏性。钉板分布定义在两个变量上：二元尖峰变量和连续平板变量。连续平板变量为高斯分布。尖峰变量取值为1或0，分别具有定义的概率α和1‑α。训练的目标函数如下：

[0019]

[0020] 为输入图像数据；为Xi的编码网络的输出隐变量；α为zi中每一维非零的概率；J为zi所在空间的维度，J＝1024；L为样本的数量，σ[j]、μ[j]、γ[j]为矢量的第j个元素。训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代N_1次后结束，批大小为B_1，600≤N_1≤1200，10≤B_1≤20。

[0021] 训练结束时获得训练数据集的隐藏层特征的均值c，

[0022] 步骤(3).构建和训练深度支持向量数据描述网络。

[0023] 在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络。深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成。将训练数据输入到深度支持向量数据描述网络，以训练阶段结束时得到的均值c作为超球体中心，该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离。训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代M_1次结束，批大小为B_2,80≤M_1≤120，[0024] 10≤B_2≤20。

[0025] 测试阶段具体方法是：

[0026] 步骤(Ⅰ).对测试图像进行尺度规范化，并进行灰度归一化处理，将数据灰度值缩小到0到1，得到测试数据XTi，

[0027] 步骤(Ⅱ).将测试数据XTi输入到训练好的深度支持向量数据描述网络中，得到输出zti，由异常分数计算公式计算得到对应的异常分数sti，以及对应的ROC曲2
线(Receiver Operating Characteristic)，sti＝||zti‑c||。将ROC曲线上距离坐标图左上方的点(0,1)处最近的点对应的异常分数作为最佳阈值th：若sti≤th，判定为正常；若sti＞th，判定为异常。

[0028] 本发明含有一种高效实用的自编码方法，在特征提取方面，采用了变分稀疏自编码器来进行特征学习，为了增加特征的稀疏性，采用了钉板分布作为先验来模拟潜在空间的稀疏性，得到稀疏特征可以更好地学到输入数据内在的结构和特征，具有较高的特征提取能力和较强的鲁棒性，同时具有较高的检测准确性。本发明使用超球体来分离数据，通过最小化所有数据到中心的平均距离，惩罚所有数据点，将数据点紧密的映射到超球体的中心，进而达到更快的训练速度和效果。

实施方案

[0029] 下面结合实例对本发明加以详细说明。需要特别提醒注意的是，在以下的描述中，当已知的功能和设计的详细描述也许会淡化本发明的主要内容时，这些描述在这里将被忽略。

[0030] 一种支持向量数据描述的胸部影像异常检测方法，该方法包括训练阶段和测试阶段。

[0031] 训练阶段具体方法是：

[0032] 步骤(1).获取训练数据集。训练数据集由正常胸部影像数据构成，对训练数据集进行尺度规范化，并进行灰度归一化处理，将数据灰度值从0到255等比例缩小到0到1。

[0033] 步骤(2).构建和训练深度稀疏变分自编码器。

[0034] 深度稀疏变分自编码器包括编码网络和解码网络；编码网络对输入数据进行特征提取，并重采样形成新特征；解码网络对编码网络生成的新特征进行解码，解码网络输出的数据和编码网络输入的数据相同。

[0035] 编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成。

[0036] 卷积模块层由三个卷积模块构成，每个卷积模块依次为多个大小是3×3的卷积核，池化层为核大小是2×2的最大池化层，池化层后接激活层。第一卷积模块卷积核数量为32，第二卷积模块卷积核数量为64，第三卷积模块卷积核数量为128。所有卷积核滑动步长为2，零边缘填充为1，激活层均使用Relu函数作为激活函数。

[0037] 卷积模块层后连接一个全连接层，全连接层输入维数为2048，输出维数为1024。

[0038] 采样模块层包括三个并联的采样层，分别用于生成隐藏层隐变量z的均值μ、对数2
方差σ、对数峰值概率γ，

[0039] 隐藏层用于生成隐变量z，采用两个辅助噪声参数ε和η对采样模块层输出进行重新采样得到z：z＝(ε⊙σ+μ)⊙(Sigmoid(apex×(η‑1+γ)))；其中，用于从平板分布中采样；用于尖峰概率γ的采样；apex表示峰值，为10～100的整数，‑k⊙表示矢量之间的对位相乘，函数运算Sigmoid(k)＝1/(1+e )。

[0040] 解码网络依次由四个反卷积层和一个激活层构成。

[0041] 第一反卷积层包含128个大小是3×3的卷积核，第二反卷积层包含64个大小是3×3的卷积核，第三反卷积层包含32个大小是3×3的卷积核，该三个反卷积层卷积核滑动步长均为4；第四反卷积层包含1个大小是3×3的卷积核，卷积核滑动步长为1。

[0042] 激活层函数使用Sigmoid函数，用于复原输入数据。

[0043] 使用钉板分布作为先验模拟zi所在空间的稀疏性。钉板分布是一个具有稀疏性的离散混合模型。钉板分布定义在两个变量上：二元尖峰变量和连续平板变量。连续平板变量为高斯分布。尖峰变量取值为1或0，分别具有定义的概率α和1‑α。训练的目标函数如下：为输入图像数据；为Xi的编码网络的输出隐变量；α为zi中每一维非
零的概率；J为zi所在空间的维度，J＝1024；L为样本的数量，σ[j]、μ[j]、γ[j]为矢量的第j个元素。训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代N_1次后结束，批大小为B_1，600≤N_1≤1200，10≤B_1≤20。本实施例采用自适应下降的学习率训练迭代1000次后结束，批大小采用20。

[0044] 训练结束时获得训练数据集的隐藏层特征的均值c，

[0045] 步骤(3).构建和训练深度支持向量数据描述网络。

[0046] 在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络。深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成。将训练数据输入到深度支持向量数据描述网络，以训练阶段结束时得到的均值c作为超球体中心，该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离。训练优化器采用Adam优化器，采用自适应下降的学习率在训练数据集上训练迭代M_1次结束，批大小为B_2,80≤M_1≤120，10≤B_2≤20。本实施例采用自适应下降的学习率训练迭代100次结束，批大小采用20。

[0047] 测试阶段具体方法是：

[0048] 步骤(Ⅰ).对测试图像进行尺度规范化，并进行灰度归一化处理，将数据灰度值从0到255等比例缩小到0到1，得到测试数据XTi，

[0049] 步骤(Ⅱ).将测试数据XTi输入到训练好的深度支持向量数据描述网络中，得到输出zti，由异常分数计算公式计算得到对应的异常分数sti，以及对应的ROC曲2
线，sti＝||zti‑c|| 。将ROC曲线上距离坐标图左上方的点(0,1)处最近的点对应的异常分数作为最佳阈值th：若sti≤th，判定为正常；若sti＞th，判定为异常。

1一种非接触式交互装置及方法 2一种新型人脸识别设备固定支架 3基于对称性的人脸图像特征提取的方法及装置 4一种基于局部连续性的鲁棒性人脸识别方法及系统 5一种畜牧业生产管理用智能管理系统 6弦轴箱除尘控制平台 7一种优化模糊鉴别向量提取的电子鼻鉴别食醋品种方法 8一种便于清洗的键盘 9一种计算机自动化控制的辅助装置 10基于云计算和图像识别的智慧城市管理系统