首页 > 专利 > 杭州电子科技大学 > 一种基于深度学习的图像分类方法专利详情

一种基于深度学习的图像分类方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2018-05-28
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2018-12-14
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-11-16
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2038-05-28
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201810524263.0 申请日 2018-05-28
公开/公告号 CN108846421B 公开/公告日 2021-11-16
授权日 2021-11-16 预估到期日 2038-05-28
申请年 2018年 公开/公告年 2021年
缴费截止日
分类号 G06K9/62 主分类号 G06K9/62
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 1
权利要求数量 2 非专利引证数量 0
引用专利数量 6 被引证专利数量 0
非专利引证
引用专利 CN107016356A、CN104463232A、CN108073933A、CN107944442A、CN104036474A、US2017213110A1 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 李建军、薛鑫营、郭辉、虞杰、郑秋华、王智慧、李豪杰 第一发明人 李建军
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 7
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州君度专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
朱月芬
摘要
本发明公开了一种基于深度学习的图像分类方法。本发明具体包括如下步骤:S1、将图片分为n组,将n组图片集分别作为样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅰ;S2、将待测图像样本输入到已经完成训练的图像分类模型Ⅰ中进行图像分类;S3、将不同待测图像对应的结果集归入不同的文档中,将精度较高的图像结果集重新组成图像样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅱ;S4、将所对应的待测图像样本输入到其对应的图像分类模型Ⅱ中进行图像分类。本发明能够进一步提高图像分类的准确率,为图像分类工作提供了新的解决方案。
  • 摘要附图
    一种基于深度学习的图像分类方法
  • 说明书附图:图1
    一种基于深度学习的图像分类方法
  • 说明书附图:图2
    一种基于深度学习的图像分类方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-11-16 授权
2 2018-12-14 实质审查的生效 IPC(主分类): G06K 9/62 专利申请号: 201810524263.0 申请日: 2018.05.28
3 2018-11-20 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于深度学习的图像分类方法,其特征在于对有标签的图像通过AlexNet模型进行二次训练,用得到的模型对无标签图片进行分类,具体实现步骤如下:
S1、将图片分为n组,将n组图片集分别作为样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅰ;
S2、将待测图像样本输入到已经完成训练的图像分类模型Ⅰ中进行图像分类;
S3、将不同待测图像对应的结果集归入不同的文档中,将精度较高的图像结果集重新组成图像样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅱ;
S4、将所对应的待测图像样本输入到其对应的图像分类模型Ⅱ中进行图像分类;
所述步骤S1具体包括:
S11、将N类图片每M类分为一组,组成n=ceil组图片集,n=N/M;
S12、对每一组图片集分别进行标记,标记从0开始;
S13、对图片进行预处理;
S14、将多组图片集依次输入到AlexNet模型中进行训练,每组会得到对应的判断结果错误率,然后修改模型中的参数,直至错误率收敛,则代表得到一个较好的图像分类模型Ⅰ;
所述步骤S3具体包括:
S31、经过步骤S2后,每张待测图像样本都会对应5*n个预测结果,将同一张待测图像对应的预测结果归入同一个文档中,则m张待测图像会得到m个文档;
S32、将每一个文档中的结果均按照精度值从大到小排列,取前一半的结果集,并将该结果集对应的图像重新组成一个图像集,m张待测图像都会有其对应的结果集;
S33、将得到的图像集作为样本集放入AlexNet模型中训练,得到图像分类模型Ⅱ。

2.根据权利要求1所述的一种基于深度学习的图像分类方法,其特征在于所述步骤S4具体包括:
S41、通过步骤S3的训练,每张待测图像都会有其对应的训练模型Ⅱ;
S42、将待测图像放入其对应的训练模型中进行预测,最终所得的结果便是其对应的二次训练的预测结果。
说明书

技术领域

[0001] 本发明属于计算机视觉领域,涉及一种基于深度学习的图像分类方法。

背景技术

[0002] 从1965年开始,人们开始研究图像处理和识别。随着科技进步,深度学习成为了图像分类的主流方法。AlexNet模型就是一种基于深度学习的图像分类模型。
[0003] AlexNet是2012年ImageNet竞赛冠军获得者Alex Krizhevsky设计的,它主要包括5个卷积层,3个全连接层。
[0004] AlexNet在输入时对224*224*3的图像进行预处理,将其处理为227*227*3的图像。
[0005] 第一个卷积层中,AlexNet采用96个11*11*3的卷积核,在步长为4的前提下对227*227*3的图像进行了滤波。最初的输入神经元个数为224*224*3=150528个,由于其步长为
4,卷积核大小为11*11*3,故而本层的特征图的大小为:
[0006] (227‑11)/4+1=55
[0007] 也就是96个55*55大小的特征图,其神经元个数为55*55*96=290400。得到卷积数据后,对其进行一次Relu,并对其进行池化(map大小减半),之后将其作为第二层的输入。
[0008] 第二个卷积层中,AlexNet采用256个5*5的过滤器对96*27*27个特征图进行进一步特征提取,但是此时过滤器是对96个特征图中的某几个特征图中相应的区域乘以相应的权重,之后再加上偏置之后所得到的区域进行卷积,经过这样的处理,会得到256个新的特征图,特征图的大小为:
[0009] (27+2*2‑5)/1+1=27
[0010] 也就是256个27*27大小的特征图,其神经元个数为
[0011] 256*27*27=186624。之后对其进行Relu操作,在对其进行降采样处理(特征图的大小减半),得到256个13*13大小的特征图。
[0012] 第三个卷积层中,AlexNet采用384个3*3大小的过滤器对256*13*13个特征图进一步提取特征,经过处理,会得到384个新的特征图,特征图的大小为:
[0013] (13+2*1‑3)/1+1=13
[0014] 即384个13*13的新特征图,其神经元个数为384*13*13=64896。之后对其进行Relu操作,在第三个卷积层中,不对其使用降采样处理。
[0015] 第四个卷积层中,AlexNet采用384个3*3大小的过滤器对384*13*13个特征图进一步提取特征,经过处理,会得到384个新的特征图,特征图的大小为:
[0016] (13+2*1‑3)/1+1=13
[0017] 即384个13*13的新特征图,其神经元个数为384*13*13=64896。之后对其进行Relu操作,在第四个卷积层中,同样不对其进行降采样处理。
[0018] 第五个卷积层中,AlexNet采用256个3*3大小的过滤器对384*13*13个特征图进一步提取特征,经过处理,会得到256个新的特征图,特征图的大小为:
[0019] (13+2*1‑3)/1+1=13
[0020] 即256个13*13的新特征图,其神经元个数为256*13*13=43264。之后对其进行Relu操作,并对其进行降采样处理(特征图的大小减半),得到256个6*6大小的特征图。
[0021] 第一个全链接层中,AlexNet网络在这里使用4096个神经元,对于神经元中的一个点,它是由256个特征图中的某些特征图卷积所得到的特征点乘以相应的权重,再加上一个偏置得到的。之后进行一个dropout随机从4096个节点中丢掉一些节点信息,得到新的4096个神经元。
[0022] 第二个全链接层中,方法与第一个全链接层相似。
[0023] 第三个全链接层中,采用的是1000个神经元(竞赛中是1000个类),在此过程中是对第二个全链接层中的4096个神经元进行全链接,之后通过高斯过滤器,得到1000个float的值,也就是最终的预测可能性。
[0024] 根据以上原理,可以根据以下步骤对图片进行预测:
[0025] 1.数据准备:准备好训练集,测试集和验证集。
[0026] 2.图片预处理:图片大小归一化→生成caffe所支持的数据库→生成均值文件;
[0027] 3.模型训练;
[0028] 4.模型测试

发明内容

[0029] 本发明的目的是针对现有技术的不足,在使用深度学习工具对图像进行分类时,通常是将所有的图片输入进去训练出一个模型,之后用这个模型对图片进行预测。在本发明中,提出将图片分组训练,并在一次训练的基础上对图片进行二次训练,进而提高预测精度。
[0030] 本发明解决其技术问题采用的技术方案包括如下步骤:
[0031] S1、将图片分为n组,将n组图片集分别作为样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅰ;
[0032] S2、将待测图像样本输入到已经完成训练的图像分类模型Ⅰ中进行图像分类;
[0033] S3、将不同待测图像对应的结果集归入不同的文档中,将精度较高的图像结果集重新组成图像样本输入到AlexNet模型中进行训练,得到图像分类模型Ⅱ;
[0034] S4、将所对应的待测图像样本输入到其对应的图像分类模型Ⅱ中进行图像分类。
[0035] 所述步骤S1具体包括:
[0036] S11、将N类图片每M类分为一组,组成n=ceil(N/M)组图片集;
[0037] S12、对每一组图片集分别进行标记(标记从0开始);
[0038] S13、对图片进行预处理;
[0039] S14、将多组图片集依次输入到AlexNet模型中进行训练,每组会得到对应的判断结果错误率,修改模型中的参数,直至错误率收敛,则代表得到一个较好的图像分类模型Ⅰ。
[0040] 所述步骤S3具体包括:
[0041] S31、经过步骤S2后,每张待测图像样本都会对应5*n个预测结果,将同一张待测图像对应的预测结果归入同一个文档中,则m张待测图像会得到m个文档;
[0042] S32、将每一个文档中的结果均按照精度值从大到小排列,取前一半的结果集,并将该结果集(图像类的标签)对应的图像重新组成一个图像集,m张待测图像都会有对应的结果集;
[0043] S33、将得到的图像集作为样本集放入AlexNet模型中训练,得到图像分类模型Ⅱ。
[0044] 所述步骤S4具体包括:
[0045] S41、通过步骤S3的训练,每张待测图像都会有其对应的训练模型Ⅱ。
[0046] S42、将待测图像放入其对对应的训练模型中进行预测,最终所得的结果便是其对应的二次训练的预测结果。
[0047] 本发明有益效果如下:
[0048] 本发明通过建立网络模型,在其一次训练的基础上,提出二次训练的方法,有效提高了分类精度。两次训练对比一次训练,精度平均提高30%。

实施方案

[0051] 下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
[0052] 本实施例中有1000类RGB图像,每张图像的大小为68*68。
[0053] 结合本发明的步骤,具体过程如下:
[0054] S11、将1000类图像分为20组,每组50类图像;
[0055] S12、对每组的50类图像进行标记,这里我们只拿一组来做主要说明,则第一组的50类图像的标签为:0、1、2……49;
[0056] S13、图像大小为68*68,经过预处理将其处理为227*227的图片作为以后要用的训练样本;
[0057] S14、将训练样本按照5:1的比例分为训练集和测试集放入AlexNet模型中进行训练,每次训练完毕之后都会得到loss值,修改网络中的参数,知道最终的loss值收敛(不变),此时便得到了比较好的训练模型了。
[0058] S2、将38张待测图像放入20组模型中依次进行分类。
[0059] S31、放入模型中分类后,最终会得到20个文档,每个文档都会有38个预测结果;
[0060] S32、将待测图像对应的预测结果整理其对应的文档中,则20个文档经过整理后回到38个文档,每个文档中有100个预测标签,38个文档对应38张待测图像的一次预测结果。拿其中一个文档来说,将该文档中的标签按照对应的精度值由大到小排列,取前50个标签,将这50个标签对应的图片类整合成一个图片集,则最终经过整合会得到38个图片集,每个图片集合都对应着一张待测图像。
[0061] S33、将图片集放入AlexNet模型中进行训练,得到38个模型
[0062] S41、每张待测图片都会得到一个对应的模型;
[0063] S42、38张图片一一对应38个模型,将待测图片放到对应的模型进行预测,最终得到的结果便是最终的分类结果。
[0064] 以上所述便是本发明的具体实例及所运用的技术原理,若依本发明的构想所作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的保护范围。

附图说明

[0049] 图1为本发明实施例的流程图;
[0050] 图2是本发明中AlexNet模型运算结构框图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号