[0004] 本发明的目的就是针对现有胸部CT影像异常检测算法中存在的问题,提供一种支持向量数据描述的胸部影像异常检测方法,能够自动地提取图像深层次抽象特征,提高特征识别能力,以提高对异常数据的检测率。
[0005] 本发明方法包括训练阶段和测试阶段。
[0006] 训练阶段具体方法是:
[0007] 步骤(1).获取训练数据集;训练数据集由正常胸部影像数据构成,对训练数据集进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1。
[0008] 步骤(2).构建和训练深度稀疏变分自编码器。
[0009] 深度稀疏变分自编码器包括编码网络和解码网络;编码网络对输入数据进行特征提取,并重采样形成新特征;解码网络对编码网络生成的新特征进行解码,解码网络输出的数据和编码网络输入的数据相同。
[0010] 编码网络依次由卷积模块层、全连接层、采样层模块和隐藏层构成。
[0011] 卷积模块层由三个卷积模块构成,每个卷积模块依次为多个大小是3×3的卷积核,池化层为核大小是2×2的最大池化层,池化层后接激活层。第一卷积模块卷积核数量为32,第二卷积模块卷积核数量为64,第三卷积模块卷积核数量为128。所有卷积核滑动步长为2,零边缘填充为1,激活层均使用Relu函数作为激活函数。
[0012] 卷积模块层后连接一个全连接层,全连接层输入维数为2048,输出维数为1024。
[0013] 采样模块层包括三个并联的采样层,分别用于生成隐藏层隐变量z的均值μ、对数2
方差σ、对数峰值概率γ,
[0014] 隐藏层用于生成隐变量z, 采用两个辅助噪声参数ε和η对采样模块层输出进行重新采样得到z:z=(ε⊙σ+μ)⊙(Sigmoid(apex×(η‑1+γ)));其中, 用于从平板分布中采样; 用于尖峰概率γ的采样;apex表示峰值,为10~100的整数,‑k⊙表示矢量之间的对位相乘,函数运算Sigmoid(k)=1/(1+e )。
[0015] 解码网络依次由四个反卷积层和一个激活层构成。
[0016] 第一反卷积层包含128个大小是3×3的卷积核,第二反卷积层包含64个大小是3×3的卷积核,第三反卷积层包含32个大小是3×3的卷积核,该三个反卷积层卷积核滑动步长均为4;第四反卷积层包含1个大小是3×3的卷积核,卷积核滑动步长为1。
[0017] 激活层函数使用Sigmoid函数,用于复原输入数据。
[0018] 使用钉板分布作为先验模拟zi所在空间的稀疏性。钉板分布定义在两个变量上:二元尖峰变量和连续平板变量。连续平板变量为高斯分布。尖峰变量取值为1或0,分别具有定义的概率α和1‑α。训练的目标函数如下:
[0019]
[0020] 为输入图像数据; 为Xi的编码网络的输出隐变量;α为zi中每一维非零的概率;J为zi所在空间的维度,J=1024;L为样本的数量,σ[j]、μ[j]、γ[j]为矢量的第j个元素。训练优化器采用Adam优化器,采用自适应下降的学习率在训练数据集上训练迭代N_1次后结束,批大小为B_1,600≤N_1≤1200,10≤B_1≤20。
[0021] 训练结束时获得训练数据集的隐藏层特征的均值c,
[0022] 步骤(3).构建和训练深度支持向量数据描述网络。
[0023] 在深度稀疏变分自编码器的基础上构建深度支持向量数据描述网络。深度支持向量数据描述网络由步骤(2)训练得到的编码网络和全连接层组成。将训练数据输入到深度支持向量数据描述网络,以训练阶段结束时得到的均值c作为超球体中心,该模型训练的目标函数为全连接层输出特征到超球体中心的欧氏距离。训练优化器采用Adam优化器,采用自适应下降的学习率在训练数据集上训练迭代M_1次结束,批大小为B_2,80≤M_1≤120,[0024] 10≤B_2≤20。
[0025] 测试阶段具体方法是:
[0026] 步骤(Ⅰ).对测试图像进行尺度规范化,并进行灰度归一化处理,将数据灰度值缩小到0到1,得到测试数据XTi,
[0027] 步骤(Ⅱ).将测试数据XTi输入到训练好的深度支持向量数据描述网络中,得到输出zti, 由异常分数计算公式计算得到对应的异常分数sti,以及对应的ROC曲2
线(Receiver Operating Characteristic),sti=||zti‑c||。将ROC曲线上距离坐标图左上方的点(0,1)处最近的点对应的异常分数作为最佳阈值th:若sti≤th,判定为正常;若sti>th,判定为异常。
[0028] 本发明含有一种高效实用的自编码方法,在特征提取方面,采用了变分稀疏自编码器来进行特征学习,为了增加特征的稀疏性,采用了钉板分布作为先验来模拟潜在空间的稀疏性,得到稀疏特征可以更好地学到输入数据内在的结构和特征,具有较高的特征提取能力和较强的鲁棒性,同时具有较高的检测准确性。本发明使用超球体来分离数据,通过最小化所有数据到中心的平均距离,惩罚所有数据点,将数据点紧密的映射到超球体的中心,进而达到更快的训练速度和效果。