首页 > 专利 > 杭州电子科技大学 > 一种基于深度学习的车牌图像去运动模糊方法专利详情

一种基于深度学习的车牌图像去运动模糊方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2018-03-13
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-01-11
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-07-09
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2038-03-13
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201810205661.6 申请日 2018-03-13
公开/公告号 CN109035149B 公开/公告日 2021-07-09
授权日 2021-07-09 预估到期日 2038-03-13
申请年 2018年 公开/公告年 2021年
缴费截止日
分类号 G06T5/00G06K9/20G06K9/34G06K9/62 主分类号 G06T5/00
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 0 被引证专利数量 0
非专利引证 1、CN 107590774 A,2018.01.16CN 107154023 A,2017.09.12CN 107704857 A,2018.02.16T M Nimisha et al..Blur-InvariantDeep Learning for Blind-Deblurring《.2017IEEE International Conference on ComputerVision》.2017,第4762-4770页.;
引用专利 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 陈华华、毛勇、叶学义 第一发明人 陈华华
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
朱月芬
摘要
本发明提出一种基于深度学习的车牌图像去运动模糊方法。本发明分为数据集预处理阶段、训练阶段以及测试阶段。在数据集预处理阶段,确定图像中的车牌区域,分割车牌字符并规范化图像尺寸,添加高斯噪声,得到训练集。在训练阶段,采用生成对抗网络学习图像去运动模糊模型,以网络复原结果的均方误差、梯度误差及判别误差三者的线性和作为网络损失交替训练判别器和生成器。在测试阶段,分割车牌字符并依次作为生成器的输入,将去模糊结果按照车牌字符原次序组合得到去模糊车牌图像。本发明所提出的模型有效地约束了车牌图像的边缘,从而提高车牌图像去运动模糊的质量,同时缩短了复原的时间。
  • 摘要附图
    一种基于深度学习的车牌图像去运动模糊方法
  • 说明书附图:图1
    一种基于深度学习的车牌图像去运动模糊方法
  • 说明书附图:图2
    一种基于深度学习的车牌图像去运动模糊方法
  • 说明书附图:图3
    一种基于深度学习的车牌图像去运动模糊方法
  • 说明书附图:图4
    一种基于深度学习的车牌图像去运动模糊方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-07-09 授权
2 2019-01-11 实质审查的生效 IPC(主分类): G06T 5/00 专利申请号: 201810205661.6 申请日: 2018.03.13
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于深度学习的车牌图像去运动模糊方法,其特征在于包括以下操作:
步骤1、数据集预处理:
1‑1、数据集包含清晰图像模糊图像对,用于标定清晰的车辆图像中车牌的位置;从清晰的车辆图像和对应的模糊车辆图像中抠出完整的车牌区域,得到车牌区域的清晰图像和模糊图像对;
1‑2、将车牌按照字符宽度分割得到34类单个字符数据集(O和I划归为0和1),并统一归范化到16*48*3大小,其中16、48和3分别表示图像的宽度、高度和通道数;
1‑3、将所有的模糊车牌字符图像添加均值为μ,标准差为σ的高斯噪声,将清晰车牌字符图像和模糊车牌字符图像的像素值均映射到[0,1]中;
1‑4、从34类字符数据集中的每一类数据中随机抽取N1对作为训练数据集T,N2对作为验证数据集V;
步骤2、训练阶段的操作:
2‑1、从训练数据集T中随机抽取minibatch张模糊图像和对应的清晰图像,并随机裁剪
16*16方形区域作为训练模糊图像集B和清晰图像集S,此时的训练模糊图像集B和清晰图像集S均为minibatch*3*16*16,minibatch表示图像的数量,3表示图像的颜色通道数,16*16为图像的大小;将模糊图像集B输入生成器,得到生成器输出的minibatch*3*16*16的图像集L;
2‑2、将生成器的输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含minibatch个概率值,以此判定每张输入的图像是清晰图像还是生成的图像,若概率值大于0.5,则判为清晰图像;否则,判为生成图像;
2‑3、计算生成图像集L和清晰图像集S之间的均方误差lmse,即:
其中,ck、wk、hk分别表示多尺度生成器中每个尺度图像的颜色通道数、宽度以及高度,K表示尺度级数,Lk是多尺度生成器生成的第k个尺度图像,Sk是对应的第k个尺度清晰图像;
多尺度通过对图像多次降采样得到尺寸缩小的图像,同一幅图像不同尺寸的数量表示尺度的级数,其中第一级尺度为原尺寸大小的图像,从第二级开始,每一级图像的尺寸为上一级图像尺寸的宽度、高度各一半,即为上一级图像大小四分之一;
2‑4、计算生成图像集L和清晰图像集S的梯度图像 和 并计算梯度图像之间的梯度误差lgrad,即:
其中,梯度图像分别通过计算水平方向梯度值dx和垂直方向的梯度值dy绝对值之和得到,即:
2‑5、计算生成图像集L和清晰图像集S的判别误差ladv,即:
式中,s~p(S)表示清晰图像s取自于清晰图像集S,其中p(S)表示清晰图像集S的概率分布,b~p(B)表示模糊图像b取自于模糊图像集B,p(B)表示模糊图像集B的概率分布,G(im)表示输入图像im经生成器生成的结果图像,D(im)表示判别器对输入图像im的判别概率,E(x)表示对x取期望;
2‑6、计算总的损失函数ldb大小,即:
ldb=lmse+α1lgrad+α2ladv  (5)
其中α1、α2为大于0的正则项系数;
2‑7、根据步骤2‑5所述的式(4)判别误差ladv优化判别器;
2‑8、根据步骤2‑6所述的式(5)总损失函数ldb优化生成器;
2‑9、从训练数据集T中随机抽取minibatch张模糊图像和对应的清晰图像重新组成模糊图像集B和清晰图像集S,通过步骤2‑1到步骤2‑8重复训练;
2‑10、当训练的总数据量达到训练集T的图像数量时,将验证集V的模糊图像依次输入当前训练完的生成器和判别器,计算验证集的平均总损失ldb,优化判别器和生成器;
2‑11、通过步骤2‑1到步骤2‑10进行重复训练,直至该训练阶段的训练集总损失函数值ldb变化小于阈值Th,则认定该训练已达到收敛;
步骤3、测试阶段的操作:
3‑1、从运动模糊的测试车牌图像中抠出车牌区域;
3‑2、将车牌区域按照字符间隔分割成单一的车牌字符并归范化到为16*48*3大小,其中16、48和3分别表示图像的宽度、高度和颜色通道数;
3‑3、加载训练好的模型,输入分割得到的测试车牌字符图像,得到去模糊后的车牌字符图像;
3‑4、将去模糊后的车牌字符按照原次序组合得到去模糊后的整幅车牌图像;
步骤2‑5所述的判别器,具体如下:
判别器由七个卷积层、一个全连接层和一个Sigmoid激活层组成;首先,minibatch*3*
16*16的图像集输入该判别器,第一层为32*3*3的卷积层,有32通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*32*8*8;第二层为64*3*3的卷积层,有64通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*64*8*8;第三层为64*3*3的卷积层,有64通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小minibatch*64*4*4;第四层为128*3*3的卷积层,有128通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*128*4*4;第五层为128*3*3的卷积层,有128通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*128*2*2;第六层为256*3*3的卷积层,有256通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*256*2*2;第七层为256*2*2的卷积层,有256通道的卷积核,每个卷积核尺寸为2*2,边缘不补零,输出大小为minibatch*256*1*1;最后一层卷积层的输出经输入通道数为256、输出通道数为1的全连接层得到minibatch个常数,经Sigmoid函数激活后输出minibatch个判定的概率,若判定概率大于0.5,则判定对应输入图像为清晰图像;否则,判定为生成图像;
步骤2‑6所述的生成器,具体如下:
生成器由三个尺度的网络构成,粗尺度网络通过反卷积层与上一级尺度网络连接,其中反卷积层通道数为3,卷积核为5*5、步长为1、补零的宽度为2;在单个尺度的网络中,图像输入和输出的尺寸保持不变,该尺度下的网络首先是一个64通道、5*5大小的卷积核、步长为1、补零宽度为2的卷积层,设该尺度为k,该卷积层输出大小为minibatch*64*wk*hk,然后是一个ReLU激活层,接下来是19个重复的残差子网,其中每个残差子网包括两条分支,一条分支由两个卷积层和第一个卷积层后的ReLU激活层组成,其中卷积层参数均设为64通道、
5*5大小的卷积核、步长为1、补零宽度为2,另一条分支则没有任何结构单元,两条分支在残差子网输出之前完成通道级联,输出128通道的图像集;单个尺度网络中的最后一个残差子网后连接了一个卷积层和一个ReLU激活层,其中卷积层包括3通道的卷积核,每个卷积核大小为5*5、步长为1、补零宽度为2,设该尺度为k,输出大小为minibatch*3*wk*hk。
说明书

技术领域

[0001] 本发明属于图像处理技术领域,涉及一种对有运动模糊的车牌图像去模糊方法,具体是一种基于深度学习的车牌图像去运动模糊方法。

背景技术

[0002] 由于车速过快、抓拍设备硬件限制和光照环境等因素的影响,抓拍图像存在一定的运动模糊,影响了车牌号码的准确获取,给城市交通的管理带来了不利的影响。车牌去运动模糊是指利用计算机的高效运算性能,通过智能算法对存在运动模糊的车牌图像进行复原,得到清晰的车牌图像。车牌识别作为交通执法的一个重要环节,车牌的去运动模糊有利于提高车牌的辨识度。
[0003] 传统的车牌去运动模糊技术主要分为两个过程:估计运动模糊核和非盲去模糊。估计运动模糊核是指从模糊图像中估计得到运动模糊的核函数,这个过程在整个去运动模糊过程中非常重要,模糊核的好坏直接决定了能否有效还原清晰图像。非盲去模糊是指根据已知的模糊核对模糊图像进行去模糊,该方法经过近五十年的研究,有多篇技术文献被提出。
[0004] 近几年,国内外学者针对运动模糊核的估计进行深入的研究和探讨,Pan等人提出l0正则化约束中间估计图像自身及其梯度,但当图像存在较少的零值像素时,图像自身的稀疏约束不起作用,致使在车牌去模糊中复原质量不高;Fang等人提出l1正则项约束图像的稀疏性,提升了车牌去模糊的质量,但是复原图像时存在部分像素失真;Song等人则提出采用分析字典的l1稀疏正则化约束图像,并引入车牌识别算法优化去模糊效果,但是车牌去模糊与车牌识别的循环过程使得整个车牌复原过程耗时过长。
[0005] 近年来,深度学习的快速发展和计算机视觉领域上的广泛应用,图像的去运动模糊问题得到广泛研究,Svobode等人提出采用卷积神经网络模型训练车牌图像复原的模型,该方法受限于小范围内的汽车运动方向和长度,不适于复杂情况下的车牌去运动模糊;Nah等人则提出应用生成对抗网络处理动态场景下的运动模糊,但是复原的图像边缘特征并不明显,仍然存在运动模糊。
[0006] 深度学习的方法省去了估计模糊核的过程,且复原速度相对较快,具有明显优势,因此本发明将深度学习应用到车牌图像去模糊研究中,以获得更好的复原效果。

发明内容

[0007] 本发明的目的是提供一种有效的车牌图像去运动模糊的方法,以更好地提取图像特征,从而提高图像去运动模糊质量,同时缩短了复原时间。
[0008] 本发明步骤分为数据集预处理、训练阶段和测试阶段,其具体细节说明如下。
[0009] 步骤1、数据集预处理:
[0010] 1‑1、数据集包含清晰图像模糊图像对,用于标定清晰的车辆图像中车牌的位置;从清晰的车辆图像和对应的模糊车辆图像中抠出完整的车牌区域,得到车牌区域的清晰图像和模糊图像对;
[0011] 1‑2、将车牌按照字符宽度分割得到34类单个字符数据集(0和I划归为0和1),并统一归范化到16*48*3大小,其中16、48和3分别表示图像的宽度、高度和颜色通道数;
[0012] 1‑3、将所有的模糊车牌字符图像添加均值为μ,标准差为σ的高斯噪声,将清晰车牌字符图像和模糊车牌字符图像的像素值均映射到[0,1]中;
[0013] 1‑4、从34类字符数据集中的每一类数据中随机抽取N1对作为训练数据集T,N2对作为验证数据集V;
[0014] 步骤2、训练阶段的操作:
[0015] 2‑1、从训练数据集T中随机抽取minibatch张模糊图像和对应的清晰图像,并随机裁剪16*16方形区域作为训练模糊图像集B和清晰图像集S,此时的训练模糊图像集B和清晰图像集S均为minibatch*3*16*16,minibatch表示图像的数量,3表示图像的颜色通道数,16*16为图像的大小;将模糊图像集B输入生成器,得到生成器输出的minibatch*3*16*16的图像集L;
[0016] 2‑2、将生成器的输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含minibatch个概率值,以此判定每张输入的图像是清晰图像还是生成的图像,若概率值大于0.5,则判为清晰图像;否则,判为生成图像;
[0017] 2‑3、计算生成图像集L和清晰图像集S之间的均方误差lmse,即:
[0018]
[0019] 其中,ck、wk、hk分别表示多尺度生成器中每个尺度图像的颜色通道数、宽度以及高度,这里所有ck取3,K表示尺度级数,Lk是多尺度生成器生成的第k个尺度图像,Sk是对应的第k个尺度清晰图像;多尺度通过对图像多次降采样得到尺寸缩小的图像,同一幅图像不同尺寸的数量表示尺度的级数,其中第一级尺度为原尺寸大小的图像,从第二级开始,每一级图像的尺寸为上一级图像尺寸的宽度、高度各一半,即为上一级图像大小四分之一;
[0020] 2‑4、计算生成图像集L和清晰图像集S的梯度图像▽L和▽S,并计算梯度图像之间的梯度误差lgrad,即:
[0021]
[0022] 其中,梯度图像分别通过计算水平方向梯度值dx和垂直方向的梯度值dy绝对值之和得到,即:
[0023]
[0024] 2‑5、计算生成图像集L和清晰图像集S的判别误差ladv,即:
[0025]
[0026] 式中,s~p(S)表示清晰图像s取自于清晰图像集S,其中p(S)表示清晰图像集S的概率分布,b~p(B)表示模糊图像b取自于模糊图像集B,p(B)表示模糊图像集B的概率分布,G(im)表示输入图像im经生成器生成的结果图像,D(im)表示判别器对输入图像im的判别概率,E(x)表示对x取期望;
[0027] 2‑6、计算总的损失函数ldb大小,即:
[0028] ldb=lmse+α1lgrad+α2ladv   (5)
[0029] 其中α1、α2为大于0的正则项系数;
[0030] 2‑7、根据步骤2‑5所述的式(4)判别误差ladv优化判别器;
[0031] 2‑8、根据步骤2‑6所述的式(5)总损失函数ldb优化生成器;
[0032] 2‑9、从训练数据集T中随机抽取minibatch张模糊图像和对应的清晰图像重新组成模糊图像集B和清晰图像集S,通过步骤2‑1到步骤2‑8重复训练;
[0033] 2‑10、当训练的总数据量达到训练集T的图像数量时,将验证集V的模糊图像依次输入当前训练完的生成器和判别器,计算验证集的平均总损失ldb,优化判别器和生成器;
[0034] 2‑11、通过步骤2‑1到步骤2‑10进行重复训练,直至该模型训练阶段的训练集总损失函数值ldb变化小于阈值Th,则认定该模型训练已达到收敛;
[0035] 步骤3、测试阶段的操作:
[0036] 3‑1、从运动模糊的测试车牌图像中抠出车牌区域;
[0037] 3‑2、将车牌区域按照字符间隔分割成单一的车牌字符并归范化到为16*48*3大小,其中16、48和3分别表示图像的宽度、高度和颜色通道数;
[0038] 3‑3、加载训练好的模型,输入分割得到的测试车牌字符图像,得到去模糊后的车牌字符图像;
[0039] 3‑4、将去模糊后的车牌字符按照原次序组合得到去模糊后的整幅车牌图像;
[0040] 步骤2‑5所述的判别器,具体如下:
[0041] 判别器由七个卷积层、一个全连接层和一个Sigmoid激活层组成;首先,minibatch*3*16*16的图像集输入该判别器,第一层为32*3*3的卷积层,有32通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*32*8*8;第二层为64*3*3的卷积层,有64通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*64*8*8;第三层为64*3*3的卷积层,有64通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小minibatch*64*4*4;第四层为128*3*3的卷积层,有128通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*128*4*4;第五层为128*3*3的卷积层,有128通道的卷积核,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*128*2*2;第六层为256*3*3的卷积层,有256通道的卷积核,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*256*2*2;第七层为256*2*2的卷积层,有256通道的卷积核,每个卷积核尺寸为2*2,边缘不补零,输出大小为minibatch*256*1*1;最后一层卷积层的输出经输入通道数为256、输出通道数为1的全连接层得到minibatch个常数,经Sigmoid函数激活后输出minibatch个判定的概率,若判定概率大于0.5,则判定对应输入图像为清晰图像;否则,判定为生成图像;
[0042] 步骤2‑6所述的生成器,具体如下:
[0043] 生成器由三个尺度的网络构成,粗尺度网络通过反卷积层与上一级尺度网络连接,其中反卷积层通道数为3,卷积核为5*5、步长为1、补零的宽度为2;在单个尺度的网络中,图像输入和输出的尺寸保持不变,该尺度下的网络首先是一个64通道、5*5大小的卷积核、步长为1、补零宽度为2的卷积层,设该尺度为k,该卷积层输出大小为minibatch*64*wk*hk,然后是一个ReLU激活层,接下来是19个重复的残差子网,其中每个残差子网包括两条分支,一条分支由两个卷积层和第一个卷积层后的ReLU激活层组成,其中卷积层参数均设为64通道、5*5大小的卷积核、步长为1、补零宽度为2,另一条分支则没有任何结构单元,两条分支在残差子网输出之前完成通道级联,输出128通道的图像集;单个尺度网络中的最后一个残差子网后连接了一个卷积层和一个ReLU激活层,其中卷积层包括3通道的卷积核,每个卷积核大小为5*5、步长为1、补零宽度为2,设该尺度为k,输出大小为minibatch*3*wk*hk。
[0044] 本发明运用深度学习方法学习图像的去模糊过程,省去了复杂的模糊核估计过程。通过大量模糊图像和清晰图像的对比训练,所提模型可以提取图像的边缘特征,从而去除车牌图像中的运动模糊,本发明平均每张图复原仅需2.5秒,且复原效果较好。

实施方案

[0049] 下面将结合附图对本发明的具体实施作进一步说明。
[0050] 图1是生成对抗网络训练阶段的流程图。模糊图像集B输入到生成器G中,得到生成图像集L,生成图像集L作为判别器D的输入,得到判别器的判别结果,同理,清晰图像集S也作为判别器的输入,得到判别结果。该判定结果表示判定输入是来自清晰图像集还是生成图像集,若判定结果>0.5,则判定为清晰图像集S;否则,判定为生成图像集L。计算该判定结果与真实标签数据的误差,利用梯度下降算法优化判别器,继而计算生成图像和清晰图像的误差均值,利用梯度下降算法优化生成器。交替优化判别器和生成器,直至模型收敛。在本发明的实验中,训练共600000次后,模型得到收敛。
[0051] 本发明的车牌图像去模糊操作包括以下步骤:
[0052] 一、数据预处理阶段:
[0053] S1、标定数据集中清晰车辆图像的车牌图像区域,从数据集中的清晰车辆图像和对应运动模糊的车辆图像中抠出车牌区域,得到车牌的清晰图像和模糊图像对。
[0054] S2、将车牌图像按照字符宽度分割得到34类单个字符数据集(O和I划归为0和1),并统一归范化到16*48*3大小,其中16、48和3分别表示图像的宽度、高度和颜色通道数。
[0055] S3、给步骤S2得到的模糊车牌字符图像添加均值为μ=0,标准差为σ=0.01的高斯噪声并将像素值映射到[0,1]中。
[0056] S4、从步骤S3的34类字符数据集中的每一类数据随机抽取N1=500对作为训练数据集T,N2=100对作为验证数据集V。
[0057] 二、训练阶段:
[0058] S1、从训练数据集T中随机抽取minibatch=128张模糊图像和对应的清晰图像,并随机裁剪16*16方形区域的图像作为训练输入样本集B和清晰样本集S,此时的图像集B和S均为minibatch*3*16*16。将模糊图像样本集B输入生成器,得到生成器输出的minibatch*3*16*16大小的图像集L。
[0059] S2、将步骤S1得到的生成器的输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含minibatch个概率值,以此判定每张输入的图像是清晰图像还是生成的图像,若概率值大于0.5,则判为清晰图像;否则,判为生成图像。
[0060] S3、根据式(1)计算步骤S1的生成图像集L和清晰图像集S之间的均方误差lmse,其中K=3,ck=3、 k=1,2,3。
[0061] S4、根据式(3)计算步骤S1的生成图像集L和清晰图像集S的梯度图像集▽L和▽S,并根据式(2)计算梯度图像之间的梯度误差lgrad。
[0062] S5、根据式(4)计算步骤S1的生成图像集L和清晰图像集S的判别误差ladv。
[0063] S6、根据式(5)将步骤S3、S4、S5的结果线性求和计算总的损失函数大小,其中正则‑2 ‑4项系数α1=10 ,α2=10 。
[0064] S7、根据步骤S5的判别误差ladv优化判别器(如图2所示)。判别器由七个卷积层、一个全连接层和一个Sigmoid激活层组成。minibatch*3*16*16的图像集输入该判别器,第一层为3通道输入、32通道输出的卷积层,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*32*8*8;第二层为32通道输入、64通道输出的卷积层,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为minibatch*64*8*8;第三层为64通道输入、64通道输出的卷积层,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小minibatch*64*4*4;第四层为64通道输入、128通道输出的卷积层,每个卷积核尺寸为3*3,步长为1,边缘补零的宽度为1,输出大小为128*128*4*4;第五层为128通道输入、128通道输出的卷积层,每个卷积核尺寸为3*3,步长为2,边缘补零的宽度为1,输出大小为minibatch*128*2*2;第六层为128通道输入、256通道输出的卷积层,每个卷积核尺寸为3*
3,步长为1,边缘补零的宽度为1,输出大小为minibatch*256*2*2;第七层为256通道输入、
256通道输出的卷积层,每个卷积核尺寸为2*2,边缘不补零,输出大小为minibatch*256*1*
1。最后一层卷积层的输出经输入通道256、输出通道1的全连接层(fc模块)得到minibatch个常数,经Sigmoid函数激活后输出minibatch个判定的概率,若判定概率大于0.5,则判定对应输入图像为清晰图像;否则,判定为生成图像。
[0065] S8、根据步骤S6计算得到的总损失函数ldb优化生成器(如图3所示)。生成器由三个尺度级的网络构成,粗尺度网络的输出(Output)通过反卷积层(Deconv模块)的输出与上一级尺度网络的输入在Concate模块作用下完成通道级联,其中反卷积层包括3通道的卷积核,每个卷积核的大小为5*5、步长为1、补零宽度为2。在单个尺度的网络中,图像输入和输出的尺寸保持不变,该尺度下的网络首先是一个卷积层,包括64通道的卷积核,每个卷积核大小为5*5、步长为1、补零宽度为2,设该尺度为k,该卷积层输出大小为minibatch*64*wk*hk,然后接一个ReLU激活层,接下来连接19个重复的残差子网(Residual Block模块),其中每个残差子网(如图4所示)包括两个分支。一条分支由卷积层、ReLU激活层和卷积层组成,其中每个卷积层均包含64通道的卷积核,每个卷积核大小为5*5,步长为1,补零宽度为2;另一条分支则没有任何结构单元,两条分支在残差子网经Concate模块完成通道级联然后输出。单个尺度网络中的最后一个残差子网后连接了一个卷积层和一个ReLU激活层,其中卷积层包括3通道的卷积核,每个卷积核大小为5*5、步长为1、补零宽度为2,设该尺度为k,输出大小为minibatch*3*wk*hk。综上所述,从生成器的输入输出来看,生成器由第三级尺度网络输入minibatch*3*4*4的模糊图像集B3,输出第三级尺度的生成图像集L3,L3经反卷积层输出minibatch*3*8*8的图像集与第二级尺度下的模糊图像B2级联得到minibatch*6*8*8的图像集作为第二级尺度网络的输入,输出minibatch*3*8*8的生成图像集L2,L2经反卷积层输出minibatch*3*16*16的图像集与第一级尺度下的模糊图像B1级联得到minibatch*
6*16*16的图像集作为第一级尺度网络的输入,输出minibatch*3*16*16的生成图像集L1,即为去模糊的结果图像集。
[0066] S9、从训练数据集T中随机抽取minibatch张模糊图像和对应的清晰图像重新组成模糊图像集B和清晰图像集S,重复训练步骤S1到S8。
[0067] S10、当训练的总数据量达到训练集T的数量时,将验证集V的模糊图像依次输入当前训练好的生成器和判别器,根据步骤S3、S4、S5、S6计算验证集V的平均总损失ldb,按照步骤S7和S8优化判别器和生成器。
[0068] S11、重复训练过程的步骤S1到S10,直至该模型训练阶段的训练集总损失ldb变化‑3小于阈值Th=5×10 ,则认定该模型训练已达到收敛。
[0069] 三、测试阶段:
[0070] S1、从运动模糊的测试车牌图像中抠出车牌区域。
[0071] S2、将步骤S1得到的车牌区域图像按照字符间隔分割成单一的车牌字符图像并归范化到16*48*3大小。
[0072] S3、加载训练好的模型,输入步骤S2分割得到的车牌字符图像,得到去模糊后的车牌字符图像。
[0073] S4、将步骤S3得到的去模糊后的车牌字符按照原次序组合得到去模糊后的整幅车牌图像。

附图说明

[0045] 图1为本发明的训练过程流程图;
[0046] 图2为本发明的判别器网络模型;
[0047] 图3为本发明的生成器网络模型;
[0048] 图4位本发明生成器中的残差子网结构;
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号