首页 > 专利 > 杭州电子科技大学 > 基于循环多尺度生成对抗网络的图像盲去运动模糊方法专利详情

基于循环多尺度生成对抗网络的图像盲去运动模糊方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2019-06-14
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-11-19
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-04-09
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2039-06-14
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201910515590.4 申请日 2019-06-14
公开/公告号 CN110378844B 公开/公告日 2021-04-09
授权日 2021-04-09 预估到期日 2039-06-14
申请年 2019年 公开/公告年 2021年
缴费截止日
分类号 G06T5/00G06T7/13G06K9/62G06N3/04G06N20/00 主分类号 G06T5/00
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 5
权利要求数量 6 非专利引证数量 1
引用专利数量 0 被引证专利数量 0
非专利引证 1、CN 108320274 A,2018.07.24CN 109035149 A,2018.12.18毛勇.模糊车牌图像的盲去模糊算法研究. 《中国优秀硕士学位论文全文数据库 信息科技辑》.2019,(第1期),毛勇等.基于深度学习的车牌图像去运动模糊技术《.杭州电子科技大学学报(自然科学版)》.2018,第38卷(第5期),陈富成等.基于生成对抗网络的图像盲去运动模糊算法《.软件导刊》.2019,Xin Tao等.Scale-recurrent Network forDeep Image Deblurring《.2018 IEEE/CVFConference on Computer Vision and PatternRecognition》.2018,鲍宗袍.运动图像盲去模糊技术研究《.中国优秀硕士学位论文全文数据库 信息科技辑》.2018,(第2期),Yi Chen等.Motion Deblurring Via UsingGenerative Adversarial Networks ForSpace-Based Imaging《.SERA 2018》.2018,;
引用专利 被引证专利
专利权维持 3 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 陈华华、陈富成、叶学义 第一发明人 陈华华
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
杨舟涛
摘要
本发明公开了一种基于循环多尺度生成对抗网络的图像盲去运动模糊方法。本发明方法以循环多尺度编码器和解码器作为生成器,并构建了相应的判决器。以生成图像和清晰图像的对抗性损失、多尺度均方误差和多尺度梯度误差作为生成对抗网络的损失函数,以梯度下降法优化损失函数。本发明运用生成对抗网络学习运动模糊图像与其对应清晰图像之间的关系,省去了复杂的模糊核估计过程。本发明方法可以提取图像的边缘特征,具有更简单的网络结构、更少的参数,并且该网络模型更容易训练,且复原效果较好。
  • 摘要附图
    基于循环多尺度生成对抗网络的图像盲去运动模糊方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-04-09 授权
2 2019-11-19 实质审查的生效 IPC(主分类): G06T 5/00 专利申请号: 201910515590.4 申请日: 2019.06.14
3 2019-10-25 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于具体步骤是:
步骤(1).构建判别器D:
所述的判别器D由九个卷积层、一个全连接层和一个Sigmoid激活层组成,输入大小为
256×256的彩色图像;
每个卷积层均采用LeakyReLU作为激活函数:第一层有32个卷积核,每个卷积核尺寸为
5×5,步长为2,填零宽度为2;第二层有64个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第三层有64个卷积核,每个卷积核尺寸为5×5,步长为2,填零宽度为2;第四层有
128个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第五层有128个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第六层有256个卷积核,每个卷积核尺寸为5×
5,步长为1,填零宽度为2;第七层有256个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第八层有512个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第九层有
512个卷积核,每个卷积核尺寸为4×4,步长为4,填零宽度为0;
最后一层的卷积输出经输入通道数为512、输出通道数为1的全连接层,得到1个常数,经Sigmoid函数激活后输出判定的概率;
步骤(2).构建生成器G:
所述的生成器G包含级联的三个尺度的子网络,每个子网络包含1个输入模块、2个编码模块、级联1个卷积长短时记忆模块、2个解码模块和1个输出模块;每个模块中都含有残差模块,所述的残差模块由一个卷积层级联一个卷积核组成,卷积层以改进型线性单元ReLU作为激活函数;残差模块中级联的卷积核的输出和残差模块的输入相加后即为残差模块的输出;
所述的输入模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的核数量为32、大小为5×5、步长为1、填零宽度为2,独立的卷积层中使用改进型线性单元ReLU作为激活函数;
第一编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用改进型线性单元ReLU作为激活函数;
第二编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用改进型线性单元ReLU作为激活函数;
所述的卷积长短时记忆模块中记忆细胞状态输出作为解码模块的输入,卷积长短时记忆模块的隐藏状态输出与下一尺度子网络中卷积长短时记忆模块的隐藏状态输入相连;对于最后一个尺度,卷积长短时记忆模块隐藏状态输出不与其他模块连接;
第一解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用改进型线性单元ReLU作为激活函数;
第二解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用改进型线性单元ReLU作为激活函数;
所述的输出模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为32、大小为5×5、步长为1、填零宽度为2,残差模块后级联的独立的卷积层中使用改进型线性单元ReLU作为激活函数;
3 3
输出第三级尺度的生成器输出图像L ,大小为64×64,L经上采样得到尺寸为128×128
2 2
的图像,作为第二级尺度的输入,输出128×128的第二级尺度的生成器输出图像L ;L经上采样得到尺寸为256×256的图像作为第一级尺度的输入,输出256×256的第一级尺度的生
1
成器输出图像L,即为去模糊的结果图像;
步骤(3).从训练数据集T中随机抽取m张模糊图像和对应的清晰图像,并随机裁剪成
256×256的方形区域,分别组成用于训练的模糊图像集B和对应的清晰图像集S,得到的B和S的图像数量均为m张,每张图像均为256×256的3通道彩色图像;将模糊图像集B输入生成器,得到生成器输出图像集L,L中有m张尺寸大小为256×256的彩色图像;
步骤(4).将生成器输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含m个概率值,以此判定每张输入的图像是清晰图像或生成图像:若概率值大于0.5,则判定为清晰图像;概率值小于等于0.5,则判定为生成图像;
步骤(5).构建训练生成器的损失函数,损失函数为:ldb=lE+α1lgrad+α2ladv;
其中α1、α2为大于0的正则项系数,lE为生成器输出图像集L和对应的清晰图像集S之间i i
的均方误差,即: L、S分别表示在第i尺度上的生成器输出图像和清晰
图像,Ni表示在第i尺度图像上所有通道的像素个数,i=1,2,3;多尺度通过对图像3次降采样得到尺寸缩小的图像;
lgrad为梯度图像 和 之间的梯度误差,即:
i i i
L (dx)和L (dy)分别表示L的
i i i
水平梯度和垂直梯度,S(dx)和S(dy)分别表示S的水平梯度和垂直梯度;
ladv为生成器输出图像集L和对应的清晰图像集S的判别误差,即:
s~p(S)表示清晰图像s取自于清晰图像集
S,p(S)表示清晰图像集S的概率分布;b~p(B)表示模糊图像b取自于模糊图像集B,p(B)表示模糊图像集B的概率分布;D(s)表示判别器对输入图像s的判别概率,G(b)表示由输入图像b经生成器生成的结果图像,E[·]表示对括号内取期望;
步骤(6).将生成图像与清晰图像一同输入到判别器中,利用梯度下降迭代更新各层网络中的权重参数,不断优化ladv,直到判别器无法判别输入的图像是生成图像还是清晰图像,即获得的概率值与0.5的差值变化小于thr,此时判别器训练结束;
步骤(7).根据损失函数ldb=lE+α1lgrad+α2ladv训练生成器,将模糊图像输入到生成器中,经过前向传播获得生成图像,比较生成图像与清晰图像的差异性,利用梯度下降迭代更新各层网络中的权重参数,不断优化损失函数ldb=lE+α1lgrad+α2ladv,直到生成器模型训练阶段的训练集总损失函数值ldb变化小于阈值Th,此时生成器训练结束;
步骤(8).重复训练过程的步骤(3)~步骤(7),直至生成器模型训练阶段的训练集总损失函数值ldb变化小于阈值Th,即判别器无法判定输入的图像是清晰图像还是生成图像,认定生成器模型与判别器模型训练已达到收敛,此时将模糊图像输入到生成器中,获得估计的去模糊图像。

2.如权利要求1所述的基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于:步骤(2)级联的三个尺度的子网络中,三个子网络对应的结构、通道数、卷积核尺寸均相同;彩色图像RGB的三个通道中,每个通道权值共享。

3.如权利要求1所述的基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于:步骤(3)和(4)中,m≥16。

4.如权利要求1所述的基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于:步骤(5)中,多尺度通过对图像多次降采样得到尺寸缩小的图像,第一级尺度为原尺寸大小的图像,从第二级开始,每一级图像的尺寸为上一级图像尺寸的宽度、高度各一半。

5.如权利要求1所述的基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于:步骤(6)中,0.01≤thr≤0.08。

6.如权利要求1所述的基于循环多尺度生成对抗网络的图像盲去运动模糊方法,其特征在于:步骤(7)和(8)中,0.001≤Th≤0.01。
说明书

技术领域

[0001] 本发明属于图像处理技术领域,涉及一种基于循环多尺度生成对抗网络的图像盲去运动模糊方法。

背景技术

[0002] 由于拍摄设备与成像物体之间很难保持相对静止状态,因此会造成图像的运动模糊。但是,在日常生活、交通安全、医学、军事侦查等领域,能够获得一幅清晰的图像都显得尤为重要。
[0003] 运动图像的模糊可以看作是清晰图像和一个二维线性函数卷积运算后受到加性噪声污染而形成的。该线性函数被称为点扩散函数或卷积核,它包含了图像的模糊信息。图像的盲去模糊是指在模糊方式未知(即模糊核未知)的情况下,仅依靠模糊图像本身的信息来还原出原始清晰图像。在单幅运动图像盲去模糊中,模糊图像的模糊核及其尺寸均未知,这都会影响模糊核估计的准确性,进而影响最终的复原效果。

发明内容

[0004] 本发明的目的就是针对图像运动模糊这一特点,提供一种基于循环多尺度生成对抗网络的图像盲去运动模糊方法,该方法无需估计模糊核即可估计出清晰图像。
[0005] 本发明具体包括以下步骤:
[0006] 步骤(1).构建判别器D;
[0007] 所述的判别器D由九个卷积层、一个全连接层和一个Sigmoid激活层组成,输入大小为256×256的彩色图像。
[0008] 每个卷积层均采用LeakyReLU作为激活函数:第一层有32个卷积核,每个卷积核尺寸为5×5,步长为2,填零宽度(zero‑padding)为2;第二层有64个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第三层有64个卷积核,每个卷积核尺寸为5×5,步长为2,填零宽度为2;第四层有128个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第五层有128个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第六层有256个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第七层有256个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第八层有512个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第九层有512个卷积核,每个卷积核尺寸为4×4,步长为4,填零宽度为0。
[0009] 最后一层的卷积输出经输入通道数为512、输出通道数为1的全连接层,得到1个常数,经Sigmoid函数激活后输出判定的概率。
[0010] 步骤(2).构建生成器G;
[0011] 所述的生成器G包含级联的三个尺度的子网络,每个子网络包含1个输入模块、2个编码模块、级联1个卷积长短时记忆(ConvLSTM)模块、2个解码模块和1个输出模块;每个模块中都含有残差模块,所述的残差模块由一个卷积层级联一个卷积核组成,卷积层以改进型线性单元(Rectified Linear Unit,ReLU)作为激活函数;残差模块中级联的卷积核的输出和残差模块的输入相加后即为残差模块的输出。
[0012] 所述的输入模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的核数量为32、大小为5×5、步长为1、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0013] 第一编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0014] 第二编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0015] 所述的卷积长短时记忆模块中记忆细胞状态输出作为解码模块的输入,卷积长短时记忆模块的隐藏状态输出与下一尺度子网络中卷积长短时记忆模块的隐藏状态输入相连;对于最后一个尺度,卷积长短时记忆模块隐藏状态输出不与其他模块连接。
[0016] 卷积长短时记忆(ConvLSTM)模块的结构见Shi X,Chen  Z,Hao W,et al.Convolutional LSTM Network:a machine learning approach for precipitation nowcasting[C]//International Conference on Neural Information Processing Systems.2015,页码:802‑810。
[0017] 第一解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0018] 第二解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0019] 所述的输出模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为32、大小为5×5、步长为1、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0020] 输出第三级尺度的生成器输出图像L3,大小为64×64,L3经上采样得到尺寸为1282 2
×128的图像,作为第二级尺度的输入,输出128×128的第二级尺度的生成器输出图像L;L经上采样得到尺寸为256×256的图像作为第一级尺度的输入,输出256×256的第一级尺度
1
的生成器输出图像L ,即为去模糊的结果图像。级联的三个尺度的子网络中,三个子网络对应的结构、通道数、卷积核尺寸均相同。彩色图像RGB的三个通道中,每个通道权值共享。
[0021] 步骤(3).从训练数据集T中随机抽取m(m≥16)张模糊图像和对应的清晰图像,并随机裁剪成256×256的方形区域,分别组成用于训练的模糊图像集B和对应的清晰图像集S,得到的B和S的图像数量均为m张,每张图像均为256×256的3通道彩色图像。将模糊图像集B输入生成器,得到生成器输出图像集L,L中有m张尺寸大小为256×256的彩色图像。
[0022] 步骤(4).将生成器输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含m个概率值,以此判定每张输入的图像是清晰图像或生成图像:若概率值大于0.5,则判定为清晰图像;概率值小于等于0.5,则判定为生成图像。
[0023] 步骤(5).构建训练生成器的损失函数,损失函数为:ldb=lE+α1lgrad+α2ladv;
[0024] 其中α1、α2为大于0的正则项系数,lE为生成器输出图像集L和对应的清晰图像集S之间的均方误差,即:
[0025] 其中,Li、Si分别表示在第i尺度上的生成器输出图像和清晰图像,Ni表示在第i尺度图像上所有通道的像素个数,i=1,2,3;多尺度通过对图像3次降采样得到尺寸缩小的图像,其中第一级尺度为原尺寸大小的图像,从第二级开始,每一级图像的尺寸为上一级图像尺寸的宽度、高度各一半。
[0026] lgrad为梯度图像 和 之间的梯度误差,即:
[0027]
[0028] 式中Li(dx)和Li(dy)分别表示Li的水平梯度和垂直梯度,Si(dx)和Si(dy)分别表示iS的水平梯度和垂直梯度。
[0029] ladv为生成器输出图像集L和对应的清晰图像集S的判别误差,即:
[0030]
[0031] 式中s~p(S)表示清晰图像s取自于清晰图像集S,p(S)表示清晰图像集S的概率分布;b~p(B)表示模糊图像b取自于模糊图像集B,p(B)表示模糊图像集B的概率分布;
[0032] D(s)表示判别器对输入图像s的判别概率,G(b)表示由输入图像b经生成器生成的结果图像,E[·]表示对括号内取期望。
[0033] 步骤(6).将生成图像与清晰图像一同输入到判别器中,利用梯度下降迭代更新各层网络中的权重参数,不断优化ladv,直到判别器无法判别输入的图像是生成图像还是清晰图像,即获得的概率值与0.5的差值变化小于thr,0.01≤thr≤0.08,此时判别器训练结束。
[0034] 步骤(7).根据损失函数ldb=lE+α1lgrad+α2ladv训练生成器,将模糊图像输入到生成器中,经过前向传播获得生成图像,比较生成图像与清晰图像的差异性,利用梯度下降迭代更新各层网络中的权重参数,不断损失函数ldb=lE+α1lgrad+α2ladv,直到生成器模型训练阶段的训练集总损失函数值ldb变化小于阈值Th,0.001≤Th≤0.01,此时生成器训练结束。
[0035] 步骤(8).重复训练过程的步骤(3)~步骤(7),直至生成器模型训练阶段的训练集总损失函数值ldb变化小于阈值Th,即判别器无法判定输入的图像是清晰图像还是生成图像,认定生成器模型与判别器模型训练已达到收敛,此时将模糊图像输入到生成器中,获得估计的去模糊图像。
[0036] 本发明方法运用深度学习方法学习运动模糊图像与其对应清晰图像之间的关系,省去了复杂的模糊核估计过程。通过大量模糊图像和清晰图像的对比训练,所提模型可以提取图像的边缘特征,具有更简单的网络结构、更少的参数,并且该网络模型更容易训练,且复原效果较好。

实施方案

[0037] 下面将对本发明的具体实施作进一步说明。
[0038] 模糊图像集B输入到生成器G中,得到生成器输出图像集L,作为判别器D的输入,得到判别器的判别结果。同理,清晰图像集S也作为判别器的输入,得到判别结果。该判定结果表示判定输入是来自清晰图像集还是生成图像集,若判定结果大于0.5,则判定为清晰图像集S;否则,判定为生成器输出图像集L。计算该判定结果与真实标签数据的误差,利用梯度下降算法优化判别器,继而计算生成图像和清晰图像的误差均值,利用梯度下降算法优化生成器。交替优化判别器和生成器,直至模型收敛。在本发明的实验中,训练共40万次后,模型得到收敛。
[0039] 基于循环多尺度生成对抗网络的图像盲去运动模糊方法,具体步骤如下:
[0040] S1、构建判别器D:判别器D由九个卷积层、一个全连接层和一个Sigmoid激活层组成,输入大小为256×256的彩色图像。
[0041] 每个卷积层均采用LeakyReLU作为激活函数:第一层有32个卷积核,每个卷积核尺寸为5×5,步长为2,填零宽度为2;第二层有64个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第三层有64个卷积核,每个卷积核尺寸为5×5,步长为2,填零宽度为2;第四层有128个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第五层有128个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第六层有256个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第七层有256个卷积核,每个卷积核尺寸为5×5,步长为4,填零宽度为2;第八层有512个卷积核,每个卷积核尺寸为5×5,步长为1,填零宽度为2;第九层有512个卷积核,每个卷积核尺寸为4×4,步长为4,填零宽度为0。
[0042] 最后一层的卷积输出经输入通道数为512、输出通道数为1的全连接层,得到1个常数,经Sigmoid函数激活后输出判定的概率。
[0043] S2、构建生成器G:生成器G包含级联的三个尺度的子网络,每个子网络包含1个输入模块、2个编码模块、级联1个卷积长短时记忆模块、2个解码模块和1个输出模块;每个模块中都含有残差模块,所述的残差模块由一个卷积层级联一个卷积核组成,卷积层以改进型线性单元ReLU作为激活函数;残差模块中级联的卷积核的输出和残差模块的输入相加后即为残差模块的输出。
[0044] 输入模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的核数量为32、大小为5×5、步长为1、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0045] 第一编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0046] 第二编码模块包括一个独立的卷积层和三个结构相同的残差模块,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,独立的卷积层中使用ReLU函数作为激活函数。
[0047] 卷积长短时记忆模块中记忆细胞状态输出作为解码模块的输入,卷积长短时记忆模块的隐藏状态输出与下一尺度子网络中卷积长短时记忆模块的隐藏状态输入相连;对于最后一个尺度,卷积长短时记忆模块隐藏状态输出不与其他模块连接。
[0048] 第一解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为128、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0049] 第二解码模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为64、大小为5×5、步长为2、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0050] 输出模块包括三个结构相同的残差模块和一个独立的卷积层,独立的卷积层以及残差模块的卷积层卷积核的数量为32、大小为5×5、步长为1、填零宽度为2,残差模块后级联的独立的卷积层中使用ReLU函数作为激活函数。
[0051] 输出第三级尺度的生成器输出图像L3,大小为64×64,L3经上采样得到尺寸为1282 2
×128的图像,作为第二级尺度的输入,输出128×128的第二级尺度的生成器输出图像L;L经上采样得到尺寸为256×256的图像作为第一级尺度的输入,输出256×256的第一级尺度
1
的生成器输出图像L ,即为去模糊的结果图像。级联的三个尺度的子网络中,三个子网络对应的结构、通道数、卷积核尺寸均相同。彩色图像RGB的三个通道中,每个通道权值共享。
[0052] S3、从训练数据集T中随机抽取m(m=16)张模糊图像和对应的清晰图像,并随机裁剪成256×256的方形区域,分别组成用于训练的模糊图像集B和对应的清晰图像集S,此时B和S的图像均为256×256的3通道彩色图像。将模糊图像集B输入生成器,得到生成器输出图像集L。
[0053] S4、将生成器输出图像集L和对应的清晰图像集S依次作为判别器的输入,判别器依次输出两组置信度结果,每组置信度包含16个概率值,以此判定每张输入的图像是清晰图像或生成图像:若概率值大于0.5,则判定为清晰图像;否则,则判定为生成图像。
[0054] S5、构建训练生成器的损失函数,损失函数为:ldb=lE+α1lgrad+α2ladv。α1、α2为正则‑2 ‑4项系数,α1=10 ,α2=10 。lE为生成器输出图像集L和对应的清晰图像集S之间的均方误差:
i i
[0055] 其中,L 、S分别表示在第i尺度上的生成器输出图像和清晰图像,Ni表示在第i尺度图像上所有通道的像素个数,i=1,2,3;多尺度通过对图像三次降采样得到尺寸缩小的图像,第一级尺度为原尺寸大小的图像,从第二级开始,每一级图像的尺寸为上一级图像尺寸的宽度、高度各一半。
[0056] lgrad为梯度图像 和 之间的梯度误差,即:
[0057]
[0058] 式中,Li(dx)和Li(dy)分别表示Li的水平梯度和垂直梯度,Si(dx)和Si(dy)分别表示iS的水平梯度和垂直梯度;ladv为生成器输出图像集L和对应的清晰图像集S的判别误差,即:
[0059]
[0060] 式中s~p(S)表示清晰图像s取自于清晰图像集S,p(S)表示清晰图像集S的概率分布;b~p(B)表示模糊图像b取自于模糊图像集B,p(B)表示模糊图像集B的概率分布;
[0061] D(s)表示判别器对输入图像s的判别概率,G(b)表示由输入图像b经生成器生成的结果图像,E[·]表示对括号内取期望。
[0062] S6、将生成图像与清晰图像一同输入到判别器中,利用梯度下降迭代更新各层网络中的权重参数,不断优化ladv,直到判别器无法判别输入的图像是生成图像还是清晰图像,即获得的概率值与0.5的差值变化小于设定阈值0.05,此时判别器训练结束。
[0063] S7、根据损失函数ldb=lE+α1lgrad+α2ladv训练生成器,将模糊图像输入到生成器中,经过前向传播获得生成图像,比较生成图像与清晰图像的差异性,利用梯度下降迭代更新各层网络中的权重参数,不断损失函数ldb=lE+α1lgrad+α2ladv,直到生成器模型训练阶段的训练集总损失函数值ldb变化小于设定阈值0.005,此时生成器训练结束。
[0064] S8、重复训练过程的步骤S3到S7,直至生成器模型训练阶段的训练集总损失函数值ldb变化小于阈值0.005,即判别器无法判定输入的图像是清晰图像还是生成图像,认定生成器模型与判别器模型训练已达到收敛,此时将模糊图像输入到生成器中,获得估计的去模糊图像。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号