[0011] 本发明的目的在于提供一种基于双路径特征融合网络的鲁棒声呐目标检测方法。
[0012] 本发明的具体步骤如下:
[0013] 步骤1、搭建双路径特征融合网络。
[0014] 所述的双路径特征融合网络包括初始卷积层、双路径模块、融合过渡模块、密集相连模块和最终卷积层。初始卷积层是一个3×3的卷积层。双路径模块共有五个。五个双路径模块依次排列。每个双路径模块均由3×3卷积层和两个1×1卷积层组成。双路径模块内的3×3卷积层位于两个1×1卷积层之间。任意两个相邻的双路径模块之间均通过融合过渡模块连接。最终卷积层共有三个。密集相连模块将第三个双路径模块、第四个双路径模块、第五个双路径模块与三个最终卷积层分别相连。
[0015] 步骤2、对步骤1所得的双路径特征融合网络进行训练。
[0016] 步骤3、声呐图像的生成和特征提取。
[0017] 3-1.将原始声呐数据转化为生成声呐图像。并将将所得的声呐图像输入双路径特征融合网络的初始卷积层,提取声呐特征图。声呐特征图分为第一初始特征图、第二初始特征图、第三初始特征图;
[0018] 3-2.第一初始特征图经过最终卷积层后,得到第一最终特征图;第二初始特征图与上采样两倍的第一最终特征图进行特征图维数相加后经过最终卷积层,得到第二最终特征图;第三初始特征图、上采样四倍的第一最终特征图及上采样两倍的第二最终特征图进行特征图维数相加后经过最终卷积层,得到第三最终特征图。
[0019] 3-3.在最终的第一特征图、第二特征图、第三特征图上选取默认框。
[0020] 步骤4、结合默认框进行声呐图像目标框的分类和检测。
[0021] 4-1.在第一最终特征图、第二最终特征图、第三最终特征图上预测最终的第一最终特征图、第二最终特征图、第三最终特征图的各默认框的置信度以及形状偏移量,并确定目标框的位置和大小。
[0022] 4-2.根据目标框,确定获得目标在声呐图像中的位置和类别。
[0023] 进一步地,步骤1中,在第二个1×1卷积层输出的特征图在通道数维度上被分割成两个部分。该两部分的其中一部分与输入第一个1×1卷积层的特征图进行特征图元素级相加;另一部分与输入第一个1×1卷积层的特征图进行通道数叠加。
[0024] 进一步地,步骤1中,所述的融合过渡模块对上一个双路径模块输出的特征图做一次步长为2的1×1卷积、一次步长为1的1×1卷积、一次步长为2的3×3卷积和一次步长为2的最大池化。
[0025] 进一步地,步骤1中,所述的最终卷积层由一个卷积集、一个3×3卷积层和一个1×1卷积构成。卷积集是由1×1卷积层、3×3卷积层、1×1卷积层、3×3卷积层、1×1卷积层构成。第一个最终卷积层输出的特征图进行上采样两倍和上采样四倍,分别输出给后两个最终卷积层进行融合。第二个最终卷积层输出的特征图进行上采样两倍输出给第三个最终卷积层进行融合。
[0026] 进一步地,步骤2中训练双路径特征融合网络的方法为通过反向传播算法和梯度下降算法。
[0027] 进一步地,步骤3-1中,提取声呐特征图的具体过程如下:
[0028] 3-1-1.将预处理得到声呐图像缩放至预设尺寸,然后将缩放至预设尺寸的声呐图像送入基于双路径特征融合网络的初始卷积层。
[0029] 3-1-2.进入初始卷积层后的声呐图像依次进入五个双路径模块,各双路径模块均对声呐图像做卷积操作,第三个双路径模块输出第三初始特征图,第四个双路径模块输出第二初始特征图,第五个双路径模块输出第一初始特征图。第三初始特征图、第二初始特征图及第一初始特征图的大小依次减小。
[0030] 进一步地,步骤3-2所得的第一最终特征图、第二最终特征图及第三最终特征图的通道数均为21。
[0031] 进一步地,默认框共有九种。九种默认框尺寸分别是14×15,16×16,13×33,69×7,15×46,146×12,322×31,414×32,394×59。
[0032] 进一步地,步骤3-3中,选取默认框的方法具体如下:
[0033] 3-3-1.通过k-means聚类算法生成九个默认框尺寸。
[0034] 3-3-2.在第一最终特征图上使用尺寸最大的三种默认框,在第二最终特征图上应用尺寸排在第四至第六的三种默认框,在第三最终特征图上使用尺寸最小的三个默认框,适合检测小对象。
[0035] 进一步地,步骤4-1中,预测置信度及形状偏移量的方法采用逻辑回归方法。
[0036] 本发明具有的有益效果是:
[0037] 1、在以往的水下声呐目标检测识别中,使用的都是传统图像处理方法,传统图像处理方法使用图像分割的方法将背景和目标区分;而本发明将深度学习技术融入到目标检测中,将声呐数据生成的声呐图像输入网络模型中,在模型中一次性完成特征提取、目标检测、目标分类,从而大大提高检测速度(在后续实验数据中可以看到检测效果)。
[0038] 2、在以往浅层神经网络的方法对质量较差(低对比度,低信噪比)的声呐图像进行特征提取时,因为本身算法、模型的瓶颈(如深度不够),从而难以提取到图像深层次特征,导致后面检测,分类和回归效果不好。通过在声纳数据集上测试及验证,结果表明当下流行的目标检测方法Yolov3对声纳这一类小目标检测效果也不理想,而且声纳图像中水层、地层干扰较多,多声纳目标之间还存在重叠问题,给目标检测带来了极大的难度,为了实现实时高效的低信噪比声纳目标检测,对Yolov3算法进行改进,重新设计并搭建了darknet66-dpn网络,该网络结合了Densenet和Resnet的优点,增强特征复用,通过多次卷积,上采样操作,进行特征融合,相比于传统方法和浅层神经网络,可以提取到更多的深层次特征,从根本上优化了目标分类,回归。并且本次实验设计的darknet66-dpn网络,在保证精度的前提下,计算量大大减小,速度更快,效率更高(在后续实验数据中可以看到检测效果)。因此,本发明是对在现如今声呐目标检测方法上的一次重大尝试与创新,打破了传统方法在声呐目标检测领域的瓶颈问题。
[0039] 3、本发明针对声纳图像中目标大多是小目标的情况,在多尺度预测的基础上,对双路径模块组成的基础网络在不同的输出位置上采用多尺度密集相连,以融合多层次特征,提升中小目标检测效果。