首页 > 专利 > 济南大学 > 一种基于0-1规划的文档碎片拼接方法专利详情

一种基于0-1规划的文档碎片拼接方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2014-02-18
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2014-06-11
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2016-09-07
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2034-02-18
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201410054418.0 申请日 2014-02-18
公开/公告号 CN103778597B 公开/公告日 2016-09-07
授权日 2016-09-07 预估到期日 2034-02-18
申请年 2014年 公开/公告年 2016年
缴费截止日
分类号 G06T3/40G06T5/50 主分类号 G06T3/40
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 3 被引证专利数量 0
非专利引证 1、薛毅.碎纸片拼接复原的数学方法.《数学建模及其应用》.2013,第2卷(第5-6期),第9-13页.;
引用专利 CN103559697A、CN101710388A、US2006/0185202A1 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 济南大学 当前专利权人 济南大学
发明人 屈忠锋、房莹 第一发明人 屈忠锋
地址 山东省济南市市中区南辛庄西路336号 邮编
申请人数量 1 发明人数量 2
申请人所在省 山东省 申请人所在市 山东省济南市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
济南泉城专利商标事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
刘德
摘要
本发明属信息技术领域,涉及一种碎纸片的拼接复原方法,特别涉及一种基于0‑1规划的文档碎片拼接方法。本发明的拼接方法为:首先读取每张碎片的像素值并计算任意两张碎片之间的距离,然后通过引入0‑1变量xij刻画任意两个碎片是否可以相接,以所有相邻的碎片之间的距离之和最小为目标函数建立0‑1规划模型,最后利用优化软件lingo对上述模型求解,若xij=1,则碎片i右接碎片j,进而确定碎片的拼接顺序。本发明利用数字化方法解决了无任何边缘信息可用的文档碎片的拼接,通过引入0‑1变量的方法判断任意两个碎片是否相接,最优化方法的引入使得碎片拼接正确率高且拼接速度快。
  • 摘要附图
    一种基于0-1规划的文档碎片拼接方法
  • 说明书附图:图1
    一种基于0-1规划的文档碎片拼接方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2016-09-07 授权
2 2014-06-11 实质审查的生效 IPC(主分类): G06T 3/40 专利申请号: 201410054418.0 申请日: 2014.02.18
3 2014-05-07 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于0-1规划的文档碎片拼接方法,其特征在于采用以下步骤:
(1)首先将所有纵向分隔的碎片进行扫描,存入电脑并自动为全部n张碎片编号,记为i=1…n,每张碎片的大小为M×N,M为碎片的高度,N为碎片的宽度;
(2)读取每张碎片的像素值,得到碎片的像素矩阵Ai,其中Ai的每一个元素为0到255之间的整数,表示像素点的灰度值;
(3)定义两张碎片i,j之间的距离为:碎片i的右边缘和碎片j的左边缘像素值差的绝对值之和,记做rij,i=1…n,j=1…n,
用aik表示Ai的最后一列的第k个元素,ajk表示Aj第一列的第k个元素,则碎片i和碎片j之间的距离
(4)引入0-1变量xij,i=1…n,j=1…n,xij只有两个取值:0和1,用xij=1表示i和j左右相接,xij=0表示i和j左右不相接;
(5)建立0-1规划模型
正确的拼接方式应该使得所有相邻的碎片之间的距离之和最小,因此有目标函数:
由于碎片i右侧只能接一张碎片,同时碎片j也只能接在一张碎片的右侧,因此xij应满足约束条件:
(6)利用最优化软件lingo求解上述模型,解出xij,i=1…n,j=1…n,若xij=1,则碎片i右接碎片j,进而确定碎片的拼接顺序。
说明书

技术领域

[0001] 本发明涉及一种碎纸片的拼接复原方法,特别涉及一种基于0-1规划的文档碎片拼接方法,属信息技术领域。

背景技术

[0002] 破碎文件的拼接在文件恢复、司法取证、情报获取等领域都有着重要的应用。
[0003] 对于数量不大或边缘特征明显的碎片,人工即可完成拼接复原,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
[0004] 现有的碎片拼接方法多根据轮廓特征或者文字特征进行拼接。如茹少峰提到了基于轮廓线匹配的2D碎片物体复原方法,要求碎片轮廓特征显著,对于边缘轮廓相同的碎片拼接则无能为力;罗智中提出了基于文字特征的文档碎纸片半自动拼接,但文字特征的提取复杂且准确度不高,特别是对英文字母而言更是困难。
[0005] 0-1规划属最优化方法,0-1变量可以数量化地描述诸如是与否、取与舍、有与无等现象所反映的离散变量间的逻辑关系、顺序关系,在决策、优化等领域有着重要应用。

发明内容

[0006] 本发明的目的对形状规则、无任何轮廓信息可用的文档碎片拼接,提供一种高效、快速的基于0-1规划的文档碎片拼接方法。
[0007] 本发明所涉及的基于0-1规划的文档碎片拼接方法,采用以下步骤:
[0008] (1).首先将所有纵向分隔的碎片进行扫描,存入电脑并自动为全部n张碎片编号,记为i=1…n,每张碎片的大小为M×N,M为碎片的高度,N为碎片的宽度;
[0009] (2).读取每张碎片的像素值,得到碎片的像素矩阵Ai,其中Ai的每一个元素为0到255之间的整数,表示像素的灰度值,255表示像素为白色,随着数字的减小,颜色变暗,0表示像素为黑色;
[0010] (3).定义两张碎片i,j之间的距离为:碎片i的右边缘和碎片j的左边缘像素值差的绝对值之和,记做rij,i=1…n,j=1…n;
[0011] 用aik表示Ai的最后一列的第k个元素,ajk表示Aj第一列的第k个元素,则碎片i和碎片j之间的距离:
[0012] (4).引入0-1变量xij,i=1…n,j=1…n,xij只有两个取值:0和1,用xij=1表示碎片i和碎片j左右相接,xij=0表示碎片i和碎片j左右不相接,只要确定了xij的取值即可判断碎片i是否和碎片j左右相接;
[0013] (5).如果碎片i和碎片j左右相接,则碎片i的右边缘和碎片j的左边缘像素值应该相近,因此碎片i和碎片j的距离应该很小,正确的拼接方式应该使得所有相邻的碎片之间的距离之和最小,即所求的xij应该使得 达到最小;
[0014] (6).xij还应满足以下两条:
[0015] 1)碎片i右侧只能接一张碎片,即对每一个i有且仅有一个xij=1,由于xij只有0和1两个取值,因此他们的和应该等于1,即应成立:
[0016] 2)碎片j也只能接在一张碎片的右侧,即对每一个j有且仅有一个xij=1,应成立[0017] (7).我们得到0-1规划模型:
[0018]
[0019] (8).利用计算机求出xij,i=1…n,j=1…n.若xij=1,则碎片i右接碎片j,进而确定碎片的拼接顺序,完成碎片的拼接。
[0020] 上述的发明主要针对碎纸机产生的文档碎片进行拼接,这种碎片形状规则、无任何轮廓信息可用,文档碎片拼接具有相当的难度。
[0021] 同样道理,对于横向切割的文档,通过计算碎片i的下边缘和碎片j的上边缘之间的距离,建立0-1规划模型,解出xij,i=1…n,j=1…n.若xij=1,则碎片i下接碎片j,进而确定碎片的拼接顺序。横向切割如遇到行与行之间的空白,可以根据上述方法确定的拼接顺序,结合人工调整完成文档的拼接。
[0022] 与现有技术相比,本发明的碎片拼接方法,其突出特点是:利用数字化方法解决了无任何边缘信息可用的文档碎片的拼接,通过引入0-1变量的方法判断任意两个碎片是否相接,最优化方法的引入使得碎片拼接正确率高且拼接速度快。附图说明:
[0023] 图1为整理后的拼接示意图,其中,灰色竖条为碎片间的间隔,数字表示碎片的编号。具体实施方式:
[0024] 文档被纵向切割成17条碎片,扫描之后存储为BMP格式的图片,标记为1,2,…,17,每张图片的大小为582×25。
[0025] 读取每张碎片的像素值,得到矩阵Ai,i=1…17,其中Ai是一个582×25的矩阵。
[0026] 用aik表示Ai的最后一列的第k个元素,ajk表示Aj第一列的第k个元素。计算碎片i和碎片j之间的距离:
[0027]
[0028] 为了描述第i张碎片右边是否和第j张碎片相接,引入0-1变量如下:
[0029]
[0030] 最优的拼接方式应该使得所有相邻的碎片之间的距离之和最小,我们根据所有相邻的碎片之间的距离之和最小得到目标函数:
[0031]
[0032] 第i张碎片右侧只能接一张碎片,同时第j张碎片也只能接在一张碎片的右侧,我们以此得到约束条件:
[0033]
[0034] 利用0-1规划软件lingo求解,运行1秒钟即可得到:
[0035] x1,6=x2,10=x3,8=x4,7=x5,4=x6,2=x7,3=x8,16=x9,13
[0036] =x10,14=x11,9=x12,1=x13,15=x14,11=x15,17=x16,12=x17,5=1,[0037] 即碎片1右边接6,碎片2右边接10,……,碎片16右边接12,碎片17右边接碎片5,碎片左右相接呈环状,容易看出4、5为文档的左右边缘,在4、5处断开,整理得碎片拼接顺序如下表:
[0038]
[0039] 按表中整理好的序号,进行拼接,拼接后的文档见图1。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号