[0019] 结合附图1,2,本发明具体的实施步骤为:
[0020] 步骤(1)构建特征提取模块提取图像多尺度特征。该模块包括8个3×3,步长为1的卷积层(8个卷积层的通道数分别为32,32,64,64,128,128,256,256),和4个2×2,步长为2的下采样层。每两个卷积层和一个下采样层作为一组特征提取基本单元,因此该模块共有4组特征提取基本单元。每张图像经过特征提取模块的前向传播后得到4个不同尺度的特征(尺寸分别是原图的1/2,1/4,1/8,1/16),如式(1)所示。
[0021] (F1,F2,F3,F4)=CNN(X;W1,b1) (1)
[0022] 其中,CNN(·)表示整个特征提取模块的前向传播部分,X,W1,b1分别表示输入的图像,特征提取模块的权重和偏置,F1,F2,F3,F4表示经过前向传播后所得到的4个多尺度特征。
[0023] 步骤(2)将特征提取模块的输出作用于损失层。首先对F4特征做上采样(16倍线性插值放大)使其达到原图尺寸,再利用1×1‑1卷积将其变成单通道特征图 然后对特征图中的每个像素点进行sigmod函数激活,与已知标签做损失运算,结果记为loss1,如式(2)所示。
[0024]
[0025] 其中 和S(X;W1,b1)分别表示未经过sigmod函数激活和经过sigmod激活后的单通道特征图;m表示图像的像素点个数;y表示与图像像素点对应位置的已知标签值,y=0表示非轮廓像素点,y=1表示轮廓像素点。
[0026] 步骤(3)构建多尺度特征解码模块。步骤(1)中得到的一组多尺度特征F1,F2,F3,F4中,F1,F2特征主要包含低级的边缘信息,而F3,F4主要包含高级的语义信息。附图2右上部分虚线框中为特征解码模块的具体结构,以金字塔的形式从下往上搭建,过程如下:
[0027] ①利用线性插值法对特征F1,F2,F3,F4进行2倍,4倍,8倍和16倍上采样,得到一组特征 并将其作为金字塔的底层(第一层特征)。1
[0028] ②对特征 做3×3的卷积,降低特征图的通道数,得到一组特征F1 ,1
F3 ,
[0029] ③将F11, F31, 相邻特征(F11和 和F31,F31和 )中位于同一位置的像素点2 2 2
相加起来,并对相加后的特征继续做卷积运算得到一组特征F1 ,F2 ,F3。
[0030] ④按上述②和③所述过程,循环搭建解码模块,直到获得最后的单通道特征图F14。
[0031] 在构建多尺度特征解码模块的过程中,第一层卷积核为3×3‑16,第二层卷积核为3×3‑8,第三层卷积核为3×3‑4,最后一层卷积核为1×1‑1。每层通用的操作如式(3)所示:
[0032]
[0033] 式中Fij(x,y;β)表示第j层,第i个,第β个通道的特征图,α表示特征的通道数,表示像素点相加后得到的特征图,n表示该层中特征的个数,W2,b2表示多尺度特征解码模块的权重和偏置,conv(·)表示卷积操作。
[0034] 步骤(4)采取与式(2)相同的方式,对单通道特征图F14的每个像素点进行sigmod函数激活后,与已知标签做损失运算,结果记为loss2。将loss2和步骤(3)中的loss1按权重相加,得到最后的总损失值Loss,如式(4)所示。
[0035] Loss=λloss1+μloss2 (4)
[0036] 式中λ和μ为权重参数,默认设置λ为0.5,μ为1。最后对Loss值进行反向传播,利用梯度下降法来更新整个模型的权重和偏置,如式(5)所示。
[0037]
[0038] 其中θ表示需要学习的参数,包括模型中的权重W1,W2和偏置b1,b2。η表示学习率,表示损失Loss对于参数θ的梯度值。通过迭代更新权重和偏置,使其收敛,最终获得训练模型。
[0039] 步骤(5)对测试图像进行N个尺度变换,得到与测试图像对应的N个不同尺度的输入图像。在N=5的默认情况时,N个变换尺度分别设置为0.5,0.8,1,1.2,1.5。将不同尺度的输入图像输入到步骤(4)获得的训练模型,输出N个响应图。然后将这N个响应图重新经过线性插值缩放到测试图像尺寸,得到S0.5,S0.8,S1,S1.2,S1.5,并按式(6)进行融合,得到最终的轮廓响应Sall。
[0040] Sall=Average(S0.5,S0.8,S1,S1.2,S1.5) (6)
[0041] 其中Average(·)表示图像矩阵均值运算。