首页 > 专利 > 安徽师范大学 > 一种基于关键点的区域建议生成方法专利详情

一种基于关键点的区域建议生成方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2019-08-05

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2019-12-03

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-08-27

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2039-08-05

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201910717208.8	申请日	2019-08-05
公开/公告号	CN110427941B	公开/公告日	2021-08-27
授权日	2021-08-27	预估到期日	2039-08-05
申请年	2019年	公开/公告年	2021年
缴费截止日
分类号	G06K9/32 、G06K9/20 、G06N3/04 、G06N3/08	主分类号	G06K9/32
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	4
权利要求数量	5	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2018.11.29CN 109919122 A,2019.06.21董德轩.基于深度学习的人脸检测算法研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2018,David G. Lowe et al.Distinctive imagefeatures from scale-invariant keypoints. 《International Journal of Computer Visionvolume》.2004,Xiu-Shen Wei et al.SelectiveConvolutional Descriptor Aggregation forFine-Grained Image Retrieval《.IEEETransactions on Image Processing 》.2017,;
引用专利	WO2018213972A	被引证专利
专利权维持	3	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	安徽师范大学	第一申请人	安徽师范大学
专利权人	安徽师范大学	当前专利权人	安徽师范大学
发明人	丁新涛、汪金宝、卞维新、接标	第一发明人	丁新涛
地址	安徽省芜湖市弋江区花津南路安徽师范大学	邮编	241000
申请人数量	1	发明人数量	4
申请人所在省	安徽省	申请人所在市	安徽省芜湖市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

芜湖安汇知识产权代理有限公司

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

钟雪

摘要

本发明适用于深度学习技术领域，提供一种基于关键点的区域建议生成方法，包括如下步骤：S1、对关键点集D进行二样本抽样并生成矩形框；S2、建立各矩形框的正负标签及回归值数组；S3、基于面积大小对矩形框进行分组，基于组别数来构建表示正负标签的特征立方体，称为标签特征；S4、基于4倍组别数来构建表示回归变量的特征立方体，称为回归特征；S5、将矩形框的正负标签映射到标签特征上；S6、将矩形框的回归值数组映射到回归特征上；S7、将标签特征和回归特征代入已知的卷积网络训练，生成区域建议。提供了一种基于关键点的区域建议生成方法，将目标的局部属性应用于区域建议，提高了区域建议的智能性、针对性。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3
说明书附图：图4
说明书附图：图5
说明书附图：图6
说明书附图：图7
说明书附图：图8

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-08-27	授权
2	2019-12-03	实质审查的生效	IPC(主分类): G06K 9/32 专利申请号: 201910717208.8 申请日: 2019.08.05
3	2019-11-08	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于关键点的区域建议生成方法，其特征在于，所述方法具体包括如下步骤：
S1、对关键点集D进行二样本抽样并生成矩形框；
S2、建立各矩形框的正负标签及回归值数组；
S3、基于面积大小对矩形框进行分组，基于组别数来构建表示正负标签的特征立方体，称为标签特征；
正负标签的特征立方体的构建方法具体如下：
正负标签特征立方体的通道数设置为c，宽和高分别为w＝[W/shrank]和h＝[H/shrank]，其中，W和H为设输入图像的宽和高，shrank为卷积网络中池化操作所产生的缩减倍数；
S4、基于4倍组别数来构建表示回归变量的特征立方体，称为回归特征；
回归变量特征立方体的构建方法具体如下：
回归变量特征立方体的通道数设置为4c，宽和高分别为w＝[W/shrank]和h＝[H/shrank]，其中，W和H为设输入图像的宽和高，shrank为卷积网络中池化操作所产生的缩减倍数；
S5、将矩形框的正负标签映射到标签特征上；
正负标签到标签特征的映射方法具体如下：
针对矩形框aij，(1)若矩形框面积S(aij)大于16，将图像的最大面积Smax除以矩形框面积k k+1
S(aij)，若Smax/S(aij)的比值落在[2 ,2 )的区间内，则将矩形框aij的正标签或负标签映射到特征的第k个通道上的[ctij/shrank]坐标点处，其中k＝0，1，2，…，c‑2；(2)若矩形框面积S(aij)小于等于16，则将矩形框aij的正标签或负标签映射到特征的第c‑1个通道上的[ctij/shrank]坐标点处；
S6、将矩形框的回归值数组映射到回归特征上；
所述步骤S6具体如下：
对于标签为正标签1的矩形框aij，若矩形框aij属于第k个组别，则将矩形框aij的回归值数组依次映射到第4k到4k+3个通道的[ctij/shrank]坐标点处，其中，ctij为矩形框aij中心点坐标；
S7、将完成相关映射的标签特征和回归特征代入已知的卷积网络训练，生成区域建议。

2.如权利要求1所述基于关键点的区域建议生成方法，其特征在于，矩形框的构建方法具体如下：
在关键点集D中任意抽取两个样本关键点pi和pj，以样本关键点pi和pj作为矩形框对角线上的两端点，来构建矩形框aij。

3.如权利要求1所述基于关键点的区域建议生成方法，其特征在于，矩形框的分组方法具体如下：
基于面积大小对矩形框进行分组，分成c个组别，其中 Smax为工
作数据集中所有图像的最大尺寸面积。

4.如权利要求1所述基于关键点的区域建议生成方法，其特征在于，矩形框的正负标签的建立方法如下：
计算矩形框与标注区域的交集与并集的比值；
若比值大于设定值，则矩形框的标签设为正标签1，否则矩形框的标签设为负标签0。

5.如权利要求1所述基于关键点的区域建议生成方法，其特征在于，矩形框的回归值数组建立方法如下：
对于标签为正标签1的矩形框，回归值数组为矩形框与标注区域之间中心点的横坐标差、中心点的纵坐标差、宽度差、高度差所组成的四元数组。

说明书

技术领域

[0001] 本发明属于深度学技术领域，提供了一种基于关键点的区域建议生成方法。

背景技术

[0002] 图像中一般目标的检测是一个复杂问题，其中的一个难点是需要对不同的目标分配一个准确的矩形定位框，如Zhaowei Cai and Nuno Vasconcelos,Cascade R‑CNN:delving into high quality object detection,IEEE Conference on Computer Vision and Pattern Recognition(CVPR)2018,pp.6154‑6162。过去二十年，基于卷积神经网络的方法在目标检测问题上取得了令人瞩目的成绩。通常基于卷积神经网络的目标检测方法可以分为两类：一是基于区域建议的二阶段方法；二是不需要区域建议的一阶段方法。基于区域建议的方法包括Fast R‑CNN(Ross Girshick,Fast R‑CNN,IEEE International Conference on Computer Vision(ICCV),(2015),pp.1440‑1448)、Faster R‑CNN(Shaoqing Ren,Kaiming He,Ross Girshick,and Jian Sun,Faster R‑CNN:Towards real‑time object detection with region proposal networks,IEEE Transactions on Pattern Analysis And Machine Intelligence,2017,39:1137‑1149)、R‑FCN(Jifeng Dai,Yi Li,Kaiming He,Jian Sun,R‑FCN:Object detection via region‑based fully convolutional networks,30th Conference on Neural Information Processing Systems,2016,pp.379‑387)等，其中Fast R‑CNN通过选择性搜索产生区域建议，Faster R‑CNN和R‑FCN都通过RPN网络，在整个图像上直接产生固定大小和宽高比的矩形框用于区域建议的产生。

[0003] 与选择性搜索相比，直接生成矩形框的方法速度较快，但是直接生成的方法忽略了图像本身的角点、边缘等局部属性，具有一定的盲目性，其“吸附”目标的智能性有待提高。

发明内容

[0004] 本发明实施例提供了一种基于关键点的区域建议生成方法，针对二阶段目标识别方法，通过局部关键点诱导卷积特征，用于提高区域建议产生的智能性。

[0005] 本发明是这样实现的，一种基于关键点的区域建议生成方法，所述方法具体包括如下步骤：

[0006] S1、对关键点集D进行二样本抽样并生成矩形框；

[0007] S2、建立各矩形框的正负标签及回归值数组；

[0008] S3、基于面积大小对矩形框进行分组，基于组别数来构建表示正负标签的特征立方体，称为标签特征；

[0009] S4、基于4倍组别数来构建表示回归变量的特征立方体，称为回归特征；

[0010] S5、将矩形框的正负标签映射到标签特征上；

[0011] S6、将矩形框的回归值数组映射到回归特征上；

[0012] S7、将完成相关映射的标签特征和回归特征代入已知的卷积网络训练，生成区域建议。

[0013] 进一步的，矩形框的构建方法具体如下：

[0014] 在关键点集D中任意抽取两个关键点pi和pj，以关键点pi和pj作为矩形框对角线上的两端点，来构建矩形框aij。

[0015] 进一步的，矩形框的分组方法具体如下：

[0016] 基于面积大小对矩形框进行分组，分成c个组别，其中 Smax为工作数据集中所有图像的最大尺寸面积。

[0017] 进一步的，矩形框的正负标签的建立方法如下：

[0018] 计算矩形框与标注区域的交集与并集的比值；

[0019] 若比值大于设定值，则矩形框的标签设为正标签1，否则矩形框的标签设为负标签0。

[0020] 进一步的，矩形框的回归值数组建立方法如下：

[0021] 对于标签为正标签1的矩形框，回归值数组为矩形框与标注区域之间中心点的横坐标差、中心点的纵坐标差、宽度差、高度差所组成的四元数组。

[0022] 进一步的，正负标签的特征立方体的构建方法具体如下：

[0023] 正负标签特征立方体的通道数设置为c，宽和高分别为w＝[W/shrank]和h＝[H/shrank]，其中，W和H为设输入图像的宽和高，shrank为卷积网络中池化操作所产生的缩减倍数。

[0024] 进一步的，回归变量特征立方体的构建方法具体如下：

[0025] 回归变量特征立方体的通道数设置为4c，宽和高分别为w＝[W/shrank]和h＝[H/shrank]，其中，W和H为设输入图像的宽和高，shrank为卷积网络中池化操作所产生的缩减倍数。

[0026] 进一步的，回归值数组到回归特征的映射方法具体如下：

[0027] 针对矩形框aij，(1)若矩形框面积s(aij)大于16，将图像的最大面积Smax除以矩形k k+1框面积S(aij)，若Smax/S(aij)的比值落在(2 ,2 ]的区间内，则将矩形框aij的正标签或负标签映射到特征的第k个通道上的[ctij/shrank]坐标点处，其中k＝0,1,2,…,c‑2；(2)若矩形框面积S(aij)小于等于16，则将矩形框aij的正标签或负标签映射到特征的第c‑1个通道上的[ctij/shrank]坐标点处，其中，ctij为矩形框aij中心点坐标。

[0028] 进一步的，所述步骤S5具体如下：

[0029] 对于标签为正标签1的矩形框aij，若矩形框aij属于第k个组别，则将矩形框aij的回归值数组依次映射到第4k到4k+3个通道的[ctij/shrank]坐标点处。

[0030] 本发明提供的基于关键点的区域建议生成方法具如下益效果：

[0031] 1.提供了一种基于关键点的区域建议生成方法，将目标的局部属性应用于区域建议，提高了区域建议的智能性、针对性。

[0032] 2.该方法首先提取图像中的关键点；其次生成训练矩形框；再次，构建表示正负标签和回归变量的特征立方体；然后建立矩形框到正负标签特征和回归特征的映射；最后，将标签特征和回归特征用于深度神经网络的训练，生成区域建议，以便实现区域建议的智能化。

实施方案

[0041] 为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

[0042] 本发明是通过关键点诱导适用于密度不均匀和大小不规范的异质矩形框的卷积特征，用于区域建议的训练，其中密度不均匀是指矩形框在图像中的分布密度不均匀，如集中分布在左上角，大小不规范是指矩形框的尺寸不统一；矩形框卷积特征该构造方法的梗概如图2‑图7所示。首先，通过检测到的关键点，生成矩形框集合，如图2所示；其次将矩形框按照面积大小进行分组，如图3所示；再次，根据组别数设计标签特征的尺寸，如图4所示；然后，根据组别数的4倍设计回归特征的尺寸，如图5所示；再将矩形框的标签映射到标签特征上，如图6所示，然后，将矩形框的回归值映射到回归特征上，如图7所示；最后，将标签特征和回归特征代入卷积网络训练生成区域建议，如图8所示。

[0043] 图1为本发明实施例提供的基于关键点的候选目标生成方法流程图，该方法具体包括如下步骤：

[0044] S1、对关键点集D进行二样本抽样并生成矩形框；

[0045] 本发明所要解决的问题是由关键点集D诱导用于深度学习的特征，以便训练出吸附于关键点这一局部属性的区域建议，使区域建议具有一定的智能性、针对性。在本发明实施例中，关键点集D已基于图像处理技术提取出来，如基于Harris角点检测图像中的关键点坐标，形成关键点集D，基于关键点集D来生成矩形框，假定关键点集中有n个关键点，可以形成n(n‑1)/2个矩形框，即在关键点集D中任意抽取两个样本关键点pi和pj，以样本关键点pi和pj作为矩形框对角线上的两端点，来构建矩形框。假定样本关键点pi和pj的坐标分别为(xi,yi)、(xj,yj)，构成矩形框的四个端点坐标依次为(xi,yi)、(xj,yi)、(xj,yj)及(xi,yj)；

[0046] S2、建立各矩形框的正负标签及回归值数组；

[0047] 矩形框的正负标签的建立方法如下：根据训练数据集，计算矩形框与标注区域的交集与并集的比值，根据比值对矩形框进行0标签或1标签的映射，若比值大于设定值，则矩形框的标签设为正标签1，否则矩形框的标签设为负标签0；

[0048] 其中标注区域是数据集自带的，是指已经在图像上标识了目标的位置和类别。

[0049] 矩形框的回归值数组建立方法如下：对于标签为正标签1的矩形框，回归值数组为矩形框与标注区域之间中心点的横坐标差、中心点的纵坐标差、宽度差、高度差所组成的四元数组；

[0050] 正样本为目标样本，负样本不是目标样本，因此不需要回归坐标位置。

[0051] S3、基于面积大小对矩形框进行分组，基于组别数来构建表示正负标签的特征立方体，称为标签特征；

[0052] 在本发明实施例中，步骤S3具体包括如下步骤：

[0053] S 31 、基于面积大小对矩形框进行分组，分成 c 个组别，其中Smax为工作数据集中所有图像的最大尺寸面积；

[0054] S32、正负标签特征立方体的通道数设置为c，宽和高分别为w＝[W/shrank]和h＝[H/shrank]，标签特征立方体的宽和高由卷积网络的池化操作确定，设输入图像的宽和高分别为W和H，卷积网络中池化操作所产生的缩减倍数为shrank，则标签特征立方体的宽和高分别为w＝[W/shrank]和h＝[H/shrank]

[0055] 在本发明实施例中，步骤S31具体包括如下步骤：

[0056] 设D＝{pi＝(xi,yi)|i＝0,1,…,N}是检测到的关键点集合，矩形框集合A＝{aij＝(xi,yi,xj,yj)}，其中xi≤xj,yi≤yj，(xi,yi),(xj,yj)∈D；设数据集中所有图像的最大尺寸为Smax，则A的分组为：A＝A0∪A1∪…∪Ac‑1(如图3所示)，其中第0组矩形框，aij∈A0满足sk+1 k(aij)＞Smax/2，其中第k(k＝1,…,c‑2)组矩形框，aij∈A1满足Smax/2 ＜s(aij)≤Smax/2 ，第c‑1组aij∈Ac‑1满足s(aij)≤16，s(●)表示●的面积；也即：c＝
max
[ln(S /16)/ln(2)]+1，[●]表示●的整数部分。

[0057] 获取数据集中所有图像的最大尺寸面积，其尺寸为Smax，从最大尺寸Smax开始重复模2，直到结果小于等于16，设总共除了c次，其中c＝[ln(Smax/16)/ln(2)]+1，正负标签特征立方体的通道数设置为c(正负标签的特征立方体长度)，标签特征立方体的宽和高由卷积网络的池化操作确定，设输入图像的宽和高分别为W和H，卷积网络中池化操作所产生的缩减倍数为shrank，则标签特征立方体的宽和高分别为w＝[W/shrank]和h＝[H/shrank]，通道数设置为c。

[0058] S4、基于4倍组别数来构建表示回归变量的特征立方体，称为回归特征；

[0059] 设输入图像的宽和高分别为W和H，则回归特征的宽和高分别为：w＝[W/shrank]和h＝[H/shrank]，通道数设置为4c。

[0060] S5、将矩形框的正负标签映射到标签特征上；

[0061] 若矩形框共分为c个组别，则标签特征上设有c个通道，对于任一待映射矩形框，若矩形框aij＝(xi,yi,xj,yj)∈Ak，矩形框aij的中心点坐标为：ctij＝((xi+xj)/2,(yi+yj)/2)，则将aij的正负标签映射到第k个通道上的[ctij/shrank]坐标点处，其映射过程具体如下：

[0062] (1)针对矩形框aij，若该矩形框面积s(aij)大于16，将图像的最大面积Smax除以该k k+1矩形框面积S(aij)，若Sxam/S(aij)的比值落在[2 ,2 )的区间内，则将矩形框aij的正标签或负标签映射到特征的第k个通道上的[ctij/shrank]坐标点处，其中k＝0,1,2,…,c‑2；(2)该矩形框面积s(aij)小于等于16，则将矩形框aij的正标签或负标签映射到特征的第c‑1个通道上的[ctij/shrank]坐标点处，其中c＝[ln(Smax/16)/ln(2)]+1，[●]表示●的整数部分，其具体实现方法如下：

[0063] 对于任意一个待映射矩形，(1)当该矩形框面积大于16时，若该矩形框面积大于Smax/2，则将该矩形映射到第0个通道上；若该矩形框面积小于等于Smax/2大于Smax/4，则将该矩形映射到第1个通道上；以此类推，直到倒数第二个通道映射完毕；(2)若该矩形框面积小于等于16，则将该矩形的正标签或负标签映射到特征的最后一个通道上的某个位置，其中所述的某个位置为图像中待映射矩形的中心点位置经卷积网络卷积所得到的坐标位置。

[0064] S6、将矩形框的回归值数组映射到回归特征上；

[0065] 对于标签为正标签1的矩形框aij，若aij＝(xi,yi,xj,yj)∈Ak，即最大尺寸矩形框面k k+1积Smax除以矩形面积S(aij)，若Smax/S(aij)的比值落在[2 ,2 )的区间内，即矩形框aij∈Ak，其中心点坐标为：ctij＝((xi+xj)/2,(yi+yj)/2)，则将aij的回归值四元数组依次映射到第4k到4k+3个通道的[ctij/shrank]坐标点处。

[0066] S7、将完成相关映射的标签特征和回归特征代入已知的卷积网络训练，生成区域建议。

[0067] 在本发明实施例中，完成相关映射的标签特征和回归特征分别是指：完成正负标签映射的标签特征及完成回归值数组映射的回归特征，此外，训练区域建议的神经网络采用现有的。

[0068] 本发明提供的基于关键点的区域建议生成方法具如下益效果：

[0069] 1.提供了一种基于关键点的区域建议生成方法，将目标的局部属性应用于区域建议，提高了区域建议的智能性、针对性。

[0070] 2.该方法首先提取图像中的关键点；其次生成训练矩形框；再次，构建表示正负标签和回归变量的特征立方体；然后建立矩形框到正负标签特征和回归特征的映射；最后，将标签特征和回归特征用于深度神经网络的训练，生成区域建议，以便实现区域建议的智能化。

[0071] 以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

附图说明

[0033] 图1为本发明实施例提供的基于关键点的区域建议生成方法流程图；

[0034] 图2是本发明的具体实施方式的由关键点生成矩形框的示意图。

[0035] 图3是本发明的具体实施方式的矩形面积框分组的示意图。

[0036] 图4是本发明的具体实施方式的标签特征的构造示意图。

[0037] 图5是本发明的具体实施方式的回归变量特征的构造示意图。

[0038] 图6是本发明的具体实施方式的矩形框到标签特征的映射的示意图。

[0039] 图7是本发明的具体实施方式的矩形框到标签特征的映射的示意图。

[0040] 图8是本发明的具体实施方式的从关键点到卷积特征的构造方法示意图。