首页 > 专利 > 宁波大学 > 一种基于三维小波变换的视频质量评价方法专利详情

一种基于三维小波变换的视频质量评价方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2014-07-25
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2015-01-07
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2016-04-13
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2034-07-25
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201410360953.9 申请日 2014-07-25
公开/公告号 CN104202594B 公开/公告日 2016-04-13
授权日 2016-04-13 预估到期日 2034-07-25
申请年 2014年 公开/公告年 2016年
缴费截止日
分类号 H04N17/00 主分类号 H04N17/00
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 4
权利要求数量 5 非专利引证数量 0
引用专利数量 0 被引证专利数量 0
非专利引证
引用专利 被引证专利
专利权维持 6 专利申请国编码 CN
专利事件 转让 事务标签 公开、实质审查、授权、权利转移
申请人信息
申请人 第一申请人
专利权人 宁波大学 当前专利权人 铜陵市创威科技有限责任公司
发明人 蒋刚毅、宋洋、刘姗姗、郑凯辉、靳鑫 第一发明人 蒋刚毅
地址 浙江省宁波市江北区风华路818号 邮编 315211
申请人数量 1 发明人数量 5
申请人所在省 浙江省 申请人所在市 浙江省宁波市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
宁波奥圣专利代理事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
周珏
摘要
本发明公开了一种基于三维小波变换的视频质量评价方法,其将三维小波变换应用于视频质量评价之中,对视频中的各帧组进行二级三维小波变换,通过在时间轴上对视频序列的分解完成对帧组内时域信息的描述,在一定程度上解决了视频时域信息描述困难的问题,有效地提高了视频客观质量评价的准确性,从而有效地提高了客观评价结果与人眼主观感知质量之间的相关性;其对于帧组间存在的时域相关性,通过运动剧烈程度和亮度特征对各帧组的质量进行加权,从而使得本发明方法能较好地符合人眼视觉特性。
  • 摘要附图
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图1
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图2
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图3a
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图3b
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图3c
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图3d
    一种基于三维小波变换的视频质量评价方法
  • 说明书附图:图3e
    一种基于三维小波变换的视频质量评价方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2020-11-17 专利权的转移 登记生效日: 2020.11.04 专利权人由宣城优度科技服务有限公司变更为铜陵市创威科技有限责任公司 地址由242000 安徽省宣城市宁波飞彩办事处梅溪路与卧龙巷交叉口变更为244000 安徽省铜陵市高新技术创业服务中心B号楼204号
2 2016-04-13 授权
3 2015-01-07 实质审查的生效 IPC(主分类): H04N 17/00 专利申请号: 201410360953.9 申请日: 2014.07.25
4 2014-12-10 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种基于三维小波变换的视频质量评价方法,其特征在于包括以下步骤:
①令Vref表示原始的无失真的参考视频序列,令Vdis表示失真的视频序列,Vref和Vdis均n
包含Nfr帧图像,其中,Nfr≥2 ,n为正整数,且n∈[3,5];
n
②以2帧图像为一个帧组,将Vref和Vdis分别分为nGoF个帧组,将Vref中的第i个帧组记为 将Vdis中的第i个帧组记为 其中, 符号 为向下取整符号,
1≤i≤nGoF;
③对Vref中的每个帧组进行二级三维小波变换,得到Vref中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像;
同样,对Vdis中的每个帧组进行二级三维小波变换,得到Vdis中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像;
④计算Vdis中各帧组对应的每组子带序列的质量,将 对应的第j组子带序列的质量记为Qi,j, 其中,1≤j≤15,1≤k≤K,K表示 对应的
第j组子带序列和 对应的第j组子带序列中各自包含的图像的总帧数,如果 和各自对应的第j组子带序列为一级子带序列,则 如果 和 各自对应的第j组子带序列为二级子带序列,则 表示 对应的第j组子带序列中的第k帧图
像, 表示 对应的第j组子带序列中的第k帧图像,SSIM()为结构相似度计算函数,μref表示 的均值,μdis表示
的均值,σref表示 的标准差,σdis表示 的标准差,σref-dis表示 与之间的协方差,c1和c2均为常数,c1≠0,c2≠0;
⑤在Vdis中的每个帧组对应的7组一级子带序列中选取两组一级子带序列,然后根据Vdis中的每个帧组对应的选取的两组一级子带序列各自的质量,计算Vdis中的每个帧组对应的一级子带序列质量,对于 对应的7组一级子带序列,假设选取的两组一级子带序列分别为第p1组子带序列和第q1组子带序列,则将 对应的一级子带序列质量记为其中,9≤p1≤15,9≤q1≤15,wLv1为 的权值,
表示 对应的第p1组子带序列的质量, 表示 对应的第q1组子带序列的质量;
并且,在Vdis中的每个帧组对应的8组二级子带序列中选取两组二级子带序列,然后根据Vdis中的每个帧组对应的选取的两组二级子带序列各自的质量,计算Vdis中的每个帧组对应的二级子带序列质量,对于 对应的8组二级子带序列,假设选取的两组二级子带序列分别为第p2组子带序列和第q2组子带序列,则将 对应的二级子带序列质量记为其中,1≤p2≤8,1≤q2≤8,wLv2为 的权值, 表
示 对应的第p2组子带序列的质量, 表示 对应的第q2组子带序列的质量;
⑥根据Vdis中的每个帧组对应的一级子带序列质量和二级子带序列质量,计算Vdis中的每个帧组的质量,将 的质量记为 其中,wLv为
的权值;
⑦根据Vdis中的每个帧组的质量,计算Vdis的客观评价质量,记为Q, 其i
中,w为 的权值。

2.根据权利要求1所述的一种基于三维小波变换的视频质量评价方法,其特征在于所述的步骤⑤中两组一级子带序列及两组二级子带序列的具体选取过程为:
⑤-1、选取一具有主观视频质量的视频数据库作为训练视频数据库,按照步骤①至步骤④的操作过程,以相同的方式获取训练视频数据库中的每个失真的视频序列中各帧组对应的每组子带序列的质量,将训练视频数据库中的第nv个失真的视频序列记为 将中的第i'个帧组对应的第j组子带序列的质量记为 其中,1≤nv≤U,U表示训练视频数据库中包含的失真的视频序列的个数,1≤i'≤nGoF',nGoF'表示 中包含的帧组的个数,1≤j≤15;
⑤-2、计算训练视频数据库中的每个失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量,将 中的所有的帧组对应的第j组子带序列的客观视频质量记为
⑤-3、由训练视频数据库中的所有的失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量构成向量 由训练视频数据库
中的所有的失真的视频序列的主观视频质量构成向量vY, 其
中,1≤j≤15, 表示训练视频数据库中的第1个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第2个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第U个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量,VS1表示训练视频数据库中的第1个失真的视频序列的主观视频质量,VS2表示训练视频数据库中的第2个失真的视频序列的主观视频质量, 表示训练视频数据库中的第nv个失真的视频序列的主观视频质量,VSU表示训练视频数据库中的第U个失真的视频序列的主观视频质量;
然后计算失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系数,将失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系数记j
为CC, 其中,1≤j≤15, 为 中的所有元素的值的均
值, 为vY中的所有元素的值的均值;
⑤-4、从得到的15个线性相关系数中与一级子带序列相应的7个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的一级子带序列和值次大的线性相关系数对应的一级子带序列作为应选取的两组一级子带序列;并且,从得到的15个线性相关系数中与二级子带序列相应的8个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的二级子带序列和值次大的线性相关系数对应的二级子带序列作为应选取的两组二级子带序列。

3.根据权利要求1或2所述的一种基于三维小波变换的视频质量评价方法,其特征在于所述的步骤⑤中取wLv1=0.71,取wLv2=0.58。

4.根据权利要求3所述的一种基于三维小波变换的视频质量评价方法,其特征在于所述的步骤⑥中取wLv=0.93。

5.根据权利要求4所述的一种基于三维小波变换的视频质量评价方法,其特征在于所i
述的步骤⑦中w的获取过程为:
⑦-1、计算Vdis中的每个帧组中的所有图像的亮度均值的平均值,将 中的所有图i
像的亮度均值的平均值记为Lavg, 其中, 表示 中的第f帧图像的亮
度均值, 的值为 中的第f帧图像中的所有像素点的亮度值取平均得到的亮度平均值,
1≤i≤nGoF;
⑦-2、计算Vdis中的每个帧组中除第1帧图像外的所有的图像的运动剧烈程度的i
平均值,将 中除第1帧图像外的所有的图像的运动剧烈程度的平均值记为MAavg,n
其中,2≤f'≤2,MAf'表示 中的第f'帧图像的运动剧烈程度,
W表示 中的第f'帧图像的宽度,H表示
中的第f'帧图像的高度,mvx(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量水平方向上的值,mvy(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量垂直方向上的值;
⑦-3、将Vdis中的所有的帧组中的所有图像的亮度均值的平均值组成亮度均值向量,
1
记为 其中,Lavg表示Vdis中的第1个帧组中的所
有图像的亮度均值的平均值,Lavg2表示Vdis中的第2个帧组中的所有图像的亮度均值的平均值, 表示Vdis中的第nGoF个帧组中的所有图像的亮度均值的平均值;
并且,将Vdis中的所有的帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值组成运动剧烈程度均值向量,记为VMAavg, 其中,
MAavg1表示Vdis中的第1个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值,MAavg2表示Vdis中的第2个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值,表示Vdis中的第nGoF个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值;
⑦-4、对VLavg中的每个元素的值进行归一化计算,得到VLavg中的每个元素归一化后的值,将VLavg中的第i元素归一化后的值记为 其中,
i
Lavg表示VLavg中的第i元素的值,max(VLavg)表示取VLavg中值最大的元素的值,min(VLavg)表示取VLavg中值最小的元素的值;
并且,对VMAavg中的每个元素的值进行归一化计算,得到VMAavg中的每个元素归一化后的值,将VMAavg中的第i元素归一化后的值记为
i
其中,MAavg表示VMAavg中的第i元素的值,max(VMAavg)表示取VMAavg中值最大的元素的值,min(VMAavg)表示取VMAavg中值最小的元素的值;
i
⑦-5、根据 和 计算 的权值w,
说明书

技术领域

[0001] 本发明涉及一种视频信号的处理技术,尤其是涉及一种基于三维小波变换的视频质量评价方法。

背景技术

[0002] 随着视频编码技术和显示技术的迅速发展,各类视频系统得到了越来越广泛的应用和关注,并逐渐成为了信息处理领域的研究重点。视频信息在视频采集、编码压缩、网络传输以及解码显示等阶段都会因为一系列不可控制的因素而不可避免地引入失真,从而造成视频质量的下降。因此,如何准确有效地衡量视频质量对于视频系统的发展起到了重要的作用。视频质量评价主要分为主观质量评价和客观质量评价两大类。由于视觉信息最终由人眼所接受,因此主观质量评价的准确性最为可靠,然而主观质量评价需要观察者打分得到,费时费力且不易集成于视频系统之中。而客观质量评价模型却可以很好地集成于视频系统实现实时质量评价,有助于及时调整视频系统参数,从而实现高质量视频系统应用。因此,准确有效且符合人眼视觉特点的视频客观质量评价方法具有很好的实际应用价值。现有的视频客观质量评价方法主要从模拟人眼对于视频中运动以及时域信息处理方式的角度出发,并结合一些图像客观质量评价方法,即在现有的图像客观质量评价方法的基础上加入对于视频中时域失真的评价,从而完成对视频信息的客观质量评价。虽然以上方法从不同角度对于视频序列的时域信息进行了描述,但是目前阶段对于人眼观看视频信息时的处理方式的了解较为有限,因此以上方法对于时域信息的描述均存在一定的局限性,即对视频时域质量评价存在困难,最终导致客观评价结果与人眼主观感知质量的一致性较差。

发明内容

[0003] 本发明所要解决的技术问题是提供一种能够有效提高客观评价结果与人眼主观感知质量之间的相关性的基于三维小波变换的视频质量评价方法。
[0004] 本发明解决上述技术问题所采用的技术方案为:一种基于三维小波变换的视频质量评价方法,其特征在于包括以下步骤:
[0005] ①令Vref表示原始的无失真的参考视频序列,令Vdis表示失真的视频序列,Vref和nVdis均包含Nfr帧图像,其中,Nfr≥2 ,n为正整数,且n∈[3,5];
[0006] ②以2n帧图像为一个帧组,将Vref和Vdis分别分为nGoF个帧组,将Vref中的第i个帧组记为 将Vdis中的第i个帧组记为 其中, 符号 为向下取整符号,1≤i≤nGoF;
[0007] ③对Vref中的每个帧组进行二级三维小波变换,得到Vref中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像;
[0008] 同样,对Vdis中的每个帧组进行二级三维小波变换,得到Vdis中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像;
[0009] ④计算Vdis中各帧组对应的每组子带序列的质量,将 对应的第j组子带序列的质量记为Qi,j, 其中,1≤j≤15,1≤k≤K,K表示 对应的第j组子带序列和 对应的第j组子带序列中各自包含的图像的总帧数,如果 和各自对应的第j组子带序列为一级子带序列,则 如果 和 各自对应的第j组子带序列为二级子带序列,则 表示 对应的第j组子带序列中的第k帧图
像, 表示 对应的第j组子带序列中的第k帧图像,SSIM()为结构相似度计算函数,μref表示 的均值,μdis表示
的均值,σref表示 的标准差,σdis表示 的标准差,σref-dis表示 与之间的协方差,c1和c2均为常数,c1≠0,c2≠0;
[0010] ⑤在Vdis中的每个帧组对应的7组一级子带序列中选取两组一级子带序列,然后根据Vdis中的每个帧组对应的选取的两组一级子带序列各自的质量,计算Vdis中的每个帧组对应的一级子带序列质量,对于 对应的7组一级子带序列,假设选取的两组一级子带序列分别为第p1组子带序列和第q1组子带序列,则将 对应的一级子带序列质量记为其中,9≤p1≤15,9≤q1≤15,wLv1为 的权值,表示 对应的第p1组子带序列的质量, 表示 对应的第q1组子带序列的质量;
[0011] 并且,在Vdis中的每个帧组对应的8组二级子带序列中选取两组二级子带序列,然后根据Vdis中的每个帧组对应的选取的两组二级子带序列各自的质量,计算Vdis中的每个帧组对应的二级子带序列质量,对于 对应的8组二级子带序列,假设选取的两组二级子带序列分别为第p2组子带序列和第q2组子带序列,则将 对应的二级子带序列质量记为其中,1≤p2≤8,1≤q2≤8,wLv2为 的权值,表示 对应的第p2组子带序列的质量, 表示 对应的第q2组子带序列的质量;
[0012] ⑥根据Vdis中的每个帧组对应的一级子带序列质量和二级子带序列质量,计算Vdis中的每个帧组的质量,将 的质量记为 其中,wLv为的权值;
[0013] ⑦根据Vdis中的每个帧组的质量,计算Vdis的客观评价质量,记为Q,i其中,w为 的权值。
[0014] 所述的步骤⑤中两组一级子带序列及两组二级子带序列的具体选取过程为:
[0015] ⑤-1、选取一具有主观视频质量的视频数据库作为训练视频数据库,按照步骤①至步骤④的操作过程,以相同的方式获取训练视频数据库中的每个失真的视频序列中各帧组对应的每组子带序列的质量,将训练视频数据库中的第nv个失真的视频序列记为 将中的第i'个帧组对应的第j组子带序列的质量记为 其中,1≤nv≤U,U表示训练视频数据库中包含的失真的视频序列的个数,1≤i'≤nGoF',nGoF'表示 中包含的帧组的个数,1≤j≤15;
[0016] ⑤-2、计算训练视频数据库中的每个失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量,将 中的所有的帧组对应的第j组子带序列的客观视频质量记为
[0017] ⑤-3、由训练视频数据库中的所有的失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量构成向量 由训练视频数据库中的所有的失真的视频序列的主观视频质量构成向量vY,
其中,1≤j≤15, 表示训练视频数据库中的第1个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第2个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第U个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量,VS1表示训练视频数据库中的第1个失真的视频序列的主观视频质量,VS2表示训练视频数据库中的第
2个失真的视频序列的主观视频质量, 表示训练视频数据库中的第nv个失真的视频序列的主观视频质量,VSU表示训练视频数据库中的第U个失真的视频序列的主观视频质量;
[0018] 然后计算失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系数,将失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系j数记为CC, 其中,1≤j≤15, 为 中的所有元素的值
的均值, 为vY中的所有元素的值的均值;
[0019] ⑤-4、从得到的15个线性相关系数中与一级子带序列相应的7个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的一级子带序列和值次大的线性相关系数对应的一级子带序列作为应选取的两组一级子带序列;并且,从得到的15个线性相关系数中与二级子带序列相应的8个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的二级子带序列和值次大的线性相关系数对应的二级子带序列作为应选取的两组二级子带序列。
[0020] 所述的步骤⑤中取wLv1=0.71,取wLv2=0.58。
[0021] 所述的步骤⑥中取wLv=0.93。
[0022] 所述的步骤⑦中wi的获取过程为:
[0023] ⑦-1、计算Vdis中的每个帧组中的所有图像的亮度均值的平均值,将 中的所有i图像的亮度均值的平均值记为Lavg, 其中, 表示 中的第f帧图像的亮
度均值, 的值为 中的第f帧图像中的所有像素点的亮度值取平均得到的亮度平均值,
1≤i≤nGoF;
[0024] ⑦-2、计算Vdis中的每个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值,将 中除第1帧图像外的所有的图像的运动剧烈程度的平均值记为MAavgi,n其中,2≤f'≤2,MAf'表示 中的第f'帧图像的运动剧烈程度,
W表示 中的第f'帧图像的宽度,H表示
中的第f'帧图像的高度,mvx(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量水平方向上的值,mvy(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量垂直方向上的值;
[0025] ⑦-3、将Vdis中的所有的帧组中的所有图像的亮度均值的平均值组成亮度均值向1
量,记为VLavg, 其中,Lavg表示Vdis中的第1个帧组中的
2
所有图像的亮度均值的平均值,Lavg表示Vdis中的第2个帧组中的所有图像的亮度均值的平均值, 表示Vdis中的第nGoF个帧组中的所有图像的亮度均值的平均值;
[0026] 并且,将Vdis中的所有的帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值组成运动剧烈程度均值向量,记为VMAavg, 其中,MAavg1表示Vdis中的第1个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值,MAavg2表示Vdis中的第2个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值, 表示Vdis中的第nGoF个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值;
[0027] ⑦-4、对VLavg中的每个元素的值进行归一化计算,得到VLavg中的每个元素归一化后的值,将VLavg中的第i元素归一化后的值记为i
其中,Lavg表示VLavg中的第i元素的值,max(VLavg)表示取VLavg中值最大的元素的值,min(VLavg)表示取VLavg中值最小的元素的值;
[0028] 并且,对VMAavg中的每个元素的值进行归一化计算,得到VMAavg中的每个元素归一化后的值,将VMAavg中的第i元素归一化后的值记为i
其中,MAavg表示VMAavg中的第i元素的值,max(VMAavg)表示取VMAavg中值最大的元素的值,min(VMAavg)表示取VMAavg中值最小的元素的值;
[0029] ⑦-5、根据 和 计算 的权值wi,
[0030] 与现有技术相比,本发明的优点在于:
[0031] 1)本发明方法将三维小波变换应用于视频质量评价之中,对视频中的各帧组进行二级三维小波变换,通过在时间轴上对视频序列的分解完成对帧组内时域信息的描述,在一定程度上解决了视频时域信息描述困难的问题,有效地提高了视频客观质量评价的准确性,从而有效地提高了客观评价结果与人眼主观感知质量之间的相关性;
[0032] 2)本发明方法对于帧组间存在的时域相关性,通过运动剧烈程度和亮度特征对各帧组的质量进行加权,从而使得本发明方法能较好地符合人眼视觉特性。

实施方案

[0040] 以下结合附图实施例对本发明作进一步详细描述。
[0041] 本发明提出的一种基于三维小波变换的视频质量评价方法,其总体实现框图如图1所示,其包括以下步骤:
[0042] ①令Vref表示原始的无失真的参考视频序列,令Vdis表示失真的视频序列,Vref和nVdis均包含Nfr帧图像,其中,Nfr≥2 ,n为正整数,且n∈[3,5],在本实施例中n=5。
[0043] ②以2n帧图像为一个帧组,将Vref和Vdis分别分为nGoF个帧组,将Vref中的第i个帧组记为 将Vdis中的第i个帧组记为 其中, 符号 为向下取整符号,1≤i≤nGoF。
[0044] 由于本实施例中n=5,因此以32帧图像为一个帧组。在实际实施时,如果Vref和nVdis中包含的图像的帧数不是2 的正整数倍时,则按序分得若干个帧组后,对多余的图像不作处理。
[0045] ③对Vref中的每个帧组进行二级三维小波变换,得到Vref中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像。
[0046] 在此,Vref中的每个帧组对应的7组一级子带序列分别为一级参考时域低频水平方向细节序列LLHref、一级参考时域低频垂直方向细节序列LHLref、一级参考时域低频对角线方向细节序列LHHref、一级参考时域高频近似序列HLLref、一级参考时域高频水平方向细节序列HLHref、一级参考时域高频垂直方向细节序列HHLref、一级参考时域高频对角线方向细节序列HHHref;Vref中的每个帧组对应的8组二级子带序列分别为二级参考时域低频近似序列LLLLref、二级参考时域低频水平方向细节序列LLLHref、二级参考时域低频垂直方向细节序列LLHLref、二级参考时域低频对角线方向细节序列LLHHref、二级参考时域高频近似序列LHLLref、二级参考时域高频水平方向细节序列LHLHref、二级参考时域高频垂直方向细节序列LHHLref、二级参考时域高频对角线方向细节序列LHHHref。
[0047] 同样,对Vdis中的每个帧组进行二级三维小波变换,得到Vdis中的每个帧组对应的15组子带序列,其中,15组子带序列包括7组一级子带序列和8组二级子带序列,每组一级子带序列包含 帧图像,每组二级子带序列包含 帧图像。
[0048] 在此,Vdis中的每个帧组对应的7组一级子带序列分别为一级失真时域低频水平方向细节序列LLHdis、一级失真时域低频垂直方向细节序列LHLdis、一级失真时域低频对角线方向细节序列LHHdis、一级失真时域高频近似序列HLLdis、一级失真时域高频水平方向细节序列HLHdis、一级失真时域高频垂直方向细节序列HHLdis、一级失真时域高频对角线方向细节序列HHHdis;Vdis中的每个帧组对应的8组二级子带序列分别为二级失真时域低频近似序列LLLLdis、二级失真时域低频水平方向细节序列LLLHdis、二级失真时域低频垂直方向细节序列LLHLdis、二级失真时域低频对角线方向细节序列LLHHdis、二级失真时域高频近似序列LHLLdis、二级失真时域高频水平方向细节序列LHLHdis、二级失真时域高频垂直方向细节序列LHHLdis、二级失真时域高频对角线方向细节序列LHHHdis。
[0049] 本发明方法利用三维小波变换对视频进行时域分解,从频率成分的角度描述视频时域信息,在小波域中完成对时域信息的处理,从而在一定程度上解决了视频质量评价中时域质量评价困难的问题,提高了评价方法的准确性。
[0050] ④计算Vdis中各帧组对应的每组子带序列的质量,将 对应的第j组子带序列的质量记为Qi,j, 其中,1≤j≤15,1≤k≤K,K表示 对应的第j组子带序列和 对应的第j组子带序列中各自包含的图像的总帧数,如果 和各自对应的第j组子带序列为一级子带序列,则 如果 和 各自对应的第j组子带序列为二级子带序列,则 表示 对应的第j组子带序列中的第k帧图
像, 表示 对应的第j组子带序列中的第k帧图像,SSIM()为结构相似度计算函数,μref表示 的均值,μdis表示
的均值,σref表示 的标准差,σdis表示 的标准差,σref-dis表示 与之间的协方差,c1和c2是为了防止
当分母接近零时产生不稳定现象所添加的常数,c1≠0,c2≠0。
[0051] ⑤在Vdis中的每个帧组对应的7组一级子带序列中选取两组一级子带序列,然后根据Vdis中的每个帧组对应的选取的两组一级子带序列各自的质量,计算Vdis中的每个帧组对应的一级子带序列质量,对于 对应的7组一级子带序列,假设选取的两组一级子带序列分别为第p1组子带序列和第q1组子带序列,则将 对应的一级子带序列质量记为其中,9≤p1≤15,9≤q1≤15,wLv1为 的权值,表示 对应的第p1组子带序列的质量, 表示 对应的第q1组子带序列的质量。
Vdis中的每个帧组对应的15组子带序列中第9组子带序列至第15组子带序列为一级子带序列。
[0052] 并且,在Vdis中的每个帧组对应的8组二级子带序列中选取两组二级子带序列,然后根据Vdis中的每个帧组对应的选取的两组二级子带序列各自的质量,计算Vdis中的每个帧组对应的二级子带序列质量,对于 对应的8组二级子带序列,假设选取的两组二级子带序列分别为第p2组子带序列和第q2组子带序列,则将 对应的二级子带序列质量记为其中,1≤p2≤8,1≤q2≤8,wLv2为 的权值,表示 对应的第p2组子带序列的质量, 表示 对应的第q2组子带序列的质量。
Vdis中的每个帧组对应的15组子带序列中第1组子带序列至第8组子带序列为二级子带序列。
[0053] 在本实施例中,取wLv1=0.71,wLv2=0.58;p1=9,q1=12,p2=3,q2=1。
[0054] 在本发明中,第p1组和第q1组一级子带序列的选取以及第p2组和第q2组二级子带序列的选取其实是一个利用数理统计分析以选取得到合适参数的过程,即利用合适的训练视频数据库通过以下步骤⑤-1至⑤-4得到的,在得到p2,q2,p1以及q1的值后,其后采用本发明方法对失真的视频序列进行视频质量评价时可直接采用固定的p2,q2,p1以及q1的值。
[0055] 在此,两组一级子带序列及两组二级子带序列的具体选取过程为:
[0056] ⑤-1、选取一具有主观视频质量的视频数据库作为训练视频数据库,按照步骤①至步骤④的操作过程,以相同的方式获取训练视频数据库中的每个失真的视频序列中各帧组对应的每组子带序列的质量,将训练视频数据库中的第nv个失真的视频序列记为 将中的第i'个帧组对应的第j组子带序列的质量记为 其中,1≤nv≤U,U表示训练视频数据库中包含的失真的视频序列的个数,1≤i'≤nGoF',nGoF'表示 中包含的帧组的个数,1≤j≤15。
[0057] ⑤-2、计算训练视频数据库中的每个失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量,将 中的所有的帧组对应的第j组子带序列的客观视频质量记为
[0058] ⑤-3、由训练视频数据库中的所有的失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量构成向量 针对同一组子带序列构成一个向量即共有15个向量,由训练视频数据库中的所有的失真的视频序列的主观视频质量构成向量vY, 其中,1≤j≤15, 表示训练视
频数据库中的第1个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第2个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量, 表示训练视频数据库中的第U个失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量,VS1表示训练视频数据库中的第1个失真的视频序列的主观视频质量,VS2表示训练视频数据库中的第2个失真的视频序列的主观视频质量, 表示训练视频数据库中的第nv个失真的视频序列的主观视频质量,VSU表示训练视频数据库中的第U个失真的视频序列的主观视频质量;
[0059] 然后计算失真的视频序列中的所有的帧组对应的同一组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系数,将失真的视频序列中的所有的帧组对应的第j组子带序列的客观视频质量与失真的视频序列的主观视频质量的线性相关系j数记为CC, 其中,1≤j≤15, 为 中的所有元素的值
的均值, 为vY中的所有元素的值的均值。
[0060] ⑤-4、步骤⑤-3共得到15个线性相关系数,从得到的15个线性相关系数中与一级子带序列相应的7个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的一级子带序列和值次大的线性相关系数对应的一级子带序列作为应选取的两组一级子带序列;并且,从得到的15个线性相关系数中与二级子带序列相应的8个线性相关系数中选出值最大的线性相关系数和值次大的线性相关系数,将值最大的线性相关系数对应的二级子带序列和值次大的线性相关系数对应的二级子带序列作为应选取的两组二级子带序列。
[0061] 在本实施例中,对于第p2组和第q2组二级子带序列以及第p1组和第q1组一级子带序列的选取,采用了由德克萨斯大学奥斯汀分校的LIVE Video Quality Database(LIVE视频库)给出的10段无失真的视频序列建立的其在4种不同失真类型不同失真程度下的失真视频集,该失真视频集包括40段无线网络传输失真的失真视频序列、30段IP网络传输失真的失真视频序列、40段H.264压缩失真的失真视频序列以及40段MPEG-2压缩失真的失真视频序列,每段失真视频序列均具有相应的主观质量评价结果,由平均主观评分差值DMOS表示,即本实施例中训练视频数据库中第nv个失真的视频序列的主观质量评价结果 由 表示。对上述失真视频序列按本发明方法的步骤①至步骤⑤的操作过程,计算得到每个失真视频序列中的所有的帧组对应的同一组子带序列的客观视频质量,即得到每个失真视频序列对应的15个子带序列的客观视频质量,然后按步骤⑤-3计算失真视频序列对应的每个子带序列的客观视频质量与相应的失真视频序列的平均主观评分差值DMOS之间的线性相关系数,即可得到失真视频序列的15个子带序列各自的客观视频质量对应的线性相关系数。图2给出了上述LIVE视频库中的所有失真视频序列的同一组子带序列的客观视频质量与平均主观评分差值之间的线性相关系数图。根据图2所示的结果,7组一级子带序列中的LLHdis对应的线性相关系数的值最大,HLLdis对应的线性相关系数的值次大,即p1=9,q1=12;8组二级子带序列中的LLHLdis对应的线性相关系数的值最大,LLLLdis对应的线性相关系数的值次大,即p2=3,q2=1。该线性相关系数的值越大,表示与主观视频质量相比该子带序列的客观视频质量的准确度越高,因此分别选取一级、二级子带序列质量中与视频主观质量线性相关系数值最大和次大的线性相关系数所对应的子带序列进行下一步计算。
[0062] ⑥根据Vdis中的每个帧组对应的一级子带序列质量和二级子带序列质量,计算Vdis中的每个帧组的质量,将 的质量记为 其中,wLv为的权值,在本实施例中取wLv=0.93。
[0063] ⑦根据Vdis中的每个帧组的质量,计算Vdis的客观评价质量,记为Q,i i其中,w为 的权值,在此具体实施例中,w的获取过程为:
[0064] ⑦-1、计算Vdis中的每个帧组中的所有图像的亮度均值的平均值,将 中的所有i图像的亮度均值的平均值记为Lavg, 其中, 表示 中的第f帧图像的亮
度均值, 的值为 中的第f帧图像中的所有像素点的亮度值取平均得到的亮度平均值,
1≤i≤nGoF;
[0065] ⑦-2、计算Vdis中的每个帧组中除第1帧图像外的所有的图像的运动剧烈程度i的平均值,将 中除第1帧图像外的所有的图像的运动剧烈程度的平均值记为MAavg,n
其中,2≤f'≤2,MAf'表示 中的第f'帧图像的运动剧烈程度,
W表示 中的第f'帧图像的宽度,H表示
中的第f'帧图像的高度,mvx(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量水平方向上的值,mvy(s,t)表示 中的第f'帧图像中坐标位置为(s,t)的像素点的运动矢量垂直方向上的值。 中的第f'帧图像中的每个像素点的运动矢量是以 中的第f'帧图像的前一帧图像为参考获得的。
[0066] ⑦-3、将Vdis中的所有的帧组中的所有图像的亮度均值的平均值组成亮度均值向1
量,记为VLavg, 其中,Lavg表示Vdis中的第1个帧组中的
2
所有图像的亮度均值的平均值,Lavg表示Vdis中的第2个帧组中的所有图像的亮度均值的平均值, 表示Vdis中的第nGoF个帧组中的所有图像的亮度均值的平均值;
[0067] 并且,将Vdis中的所有的帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值组成运动剧烈程度均值向量,记为VMAavg,1
其中,MAavg表示Vdis中的第1个帧组中除第1帧图像外的所有的图像的运动剧烈程度的
2
平均值,MAavg表示Vdis中的第2个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值, 表示Vdis中的第nGoF个帧组中除第1帧图像外的所有的图像的运动剧烈程度的平均值;
[0068] ⑦-4、对VLavg中的每个元素的值进行归一化计算,得到VLavg中的每个元素归一化后的值,将VLavg中的第i元素归一化后的值记为 其中,i
Lavg表示VLavg中的第i元素的值,max(VLavg)表示取VLavg中值最大的元素的值,min(VLavg)表示取VLavg中值最小的元素的值;
[0069] 并且,对VMAavg中的每个元素的值进行归一化计算,得到VMAavg中的每个元素归一化后的值,将VMAavg中的第i元素归一化后的值记为i
其中,MAavg表示VMAavg中的第i元素的值,max(VMAavg)表示取VMAavg中值最大的元素的值,min(VMAavg)表示取VMAavg中值最小的元素的值;
[0070] ⑦-5、根据 和 计算 的权值wi,
[0071] 为说明本发明方法的有效性和可行性,利用德克萨斯大学奥斯汀分校的LIVE Video Quality Database(LIVE视频质量数据库)进行实验验证,以分析本发明方法的客观评价结果与平均主观评分差值(Difference Mean Opinion Score,DMOS)之间的相关性。对LIVE视频质量数据库给出的10段无失真的视频序列建立其在4种不同失真类型不同失真程度下的失真视频集,该失真视频集包括40段无线网络传输失真的失真视频序列、30段IP网络传输失真的失真视频序列、40段H.264压缩失真的失真视频序列以及40段MPEG-2压缩失真的失真视频序列。图3a给出了40段无线网络传输失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;图3b给出了30段IP网络传输失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;图3c给出了40段H.264压缩失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;图3d给出了40段MPEG-2压缩失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;图3e给出了150段失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图。在图3a至图3e中,散点越集中说明客观质量评价方法的评价性能越好,与平均主观评分差值DMOS之间的一致性也越好。从图3a至图3e中可以看出本发明方法可以很好地区分低质量和高质量的视频序列,且具有较好的评价性能。
[0072] 在此,利用评估视频质量评价方法的4个常用客观参量作为评价标准,即非线性回归条件下的Pearson相关系数(Correlation Coefficients,CC)、Spearman等级相关系数(Spearman Rank Order Correlation Coefficients,SROCC)、异常值比率指标(Outlier Ratio,OR)以及均方根误差(Rooted Mean Squared Error,RMSE)。其中,CC用来反映客观质量评价方法预测的精确性,SROCC用来反映客观质量评价方法的预测单调性,CC和SROCC的值越接近1,表示该客观质量评价方法的性能越好;OR用来反映客观质量评价方法的离散程度,OR值越接近0表示客观质量评价方法越好;RMSE用来反映客观质量评价方法的预测准确性,RMSE的值越小表示客观质量评价方法准确性越高。反映本发明方法准确性、单调性和离散率的CC、SROCC、OR和RMSE系数如表1所列,根据表1所列数据可见,本发明方法的整体混合失真CC值和SROCC值均达到0.79以上,其中CC值在0.8以上,离散率OR均为0,均方根误差低于6.5,按本发明方法得到的失真的视频序列的客观评价质量Q和平均主观评分差值DMOS之间的相关性较高,表明本发明方法的客观评价结果与人眼主观感知的结果较为一致,很好地说明了本发明方法的有效性。
[0073] 表1 本发明方法对于各类型失真视频序列的客观评价准确性性能指标[0074]CC SROCC OR RMSE
40段无线网络传输失真的失真视频序列 0.8087 0.8047 0 6.2066
30段IP网络传输失真的失真视频序列 0.8663 0.7958 0 4.8318
40段H.264压缩失真的失真视频序列 0.7403 0.7257 0 7.4110
40段MPEG-2压缩失真的失真视频序列 0.8140 0.7979 0 5.6653
150段所有失真视频序列 0.8037 0.7931 0 6.4570

附图说明

[0033] 图1为本发明方法的总体实现框图;
[0034] 图2为LIVE视频数据库中的所有失真视频序列的同一组子带序列的客观视频质量与平均主观评分差值之间的线性相关系数图;
[0035] 图3a为存在无线传输失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;
[0036] 图3b为存在IP网络传输失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;
[0037] 图3c为存在H.264压缩失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;
[0038] 图3d为存在MPEG-2压缩失真的失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图;
[0039] 图3e为针对整个视频质量数据库中的所有失真视频序列通过本发明方法得到的客观评价质量Q与平均主观评分差值DMOS之间的散点图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号