首页 > 专利 > 杭州电子科技大学 > 一种在线的群组电影推荐方法专利详情

一种在线的群组电影推荐方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2021-01-22
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2021-05-28
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2022-04-08
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2041-01-22
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN202110092664.5 申请日 2021-01-22
公开/公告号 CN112784172B 公开/公告日 2022-04-08
授权日 2022-04-08 预估到期日 2041-01-22
申请年 2021年 公开/公告年 2022年
缴费截止日
分类号 G06F16/9536G06F16/735G06F17/16G06F17/18 主分类号 G06F16/9536
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 0
引用专利数量 3 被引证专利数量 0
非专利引证
引用专利 CN101739416A、CN109933726A、CN109344176A 被引证专利
专利权维持 1 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 徐建、李维 第一发明人 徐建
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 2
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州浙科专利事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
孙孟辉
摘要
本发明公开了一种在线的群组电影推荐方法,包括如下步骤:步骤1、计算电影类型的社会影响力;步骤2、统计群组成员对电影类型熟悉程度;步骤3、计算群组成员对于某种电影类型的话语权;步骤4、融合群组成员的偏好;步骤5、电影推荐。本发明通过上述基于采样的电影类型社会影响力计算方法,简化了计算,反映了电影流行趋势;使用观众偏好融合方法对不同观众权重进行了考虑,进而获得合理的群组偏好。本方法能够考虑群组内部和群组外部对观众偏好融合影响,从而保证了推荐的有效性。
  • 摘要附图
    一种在线的群组电影推荐方法
  • 说明书附图:图1
    一种在线的群组电影推荐方法
  • 说明书附图:图2
    一种在线的群组电影推荐方法
  • 说明书附图:图3
    一种在线的群组电影推荐方法
  • 说明书附图:图4
    一种在线的群组电影推荐方法
  • 说明书附图:图5
    一种在线的群组电影推荐方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2022-04-08 授权
2 2021-05-28 实质审查的生效 IPC(主分类): G06F 16/9536 专利申请号: 202110092664.5 申请日: 2021.01.22
3 2021-05-11 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种在线的群组电影推荐方法,其特征在于包括如下步骤:
步骤1、计算电影类型的社会影响力;
步骤2、统计群组成员对电影类型熟悉程度;
步骤3、计算群组成员对于某种电影类型的话语权;
步骤4、融合群组成员的偏好;
步骤5、电影推荐;
所述步骤1由以下步骤组成:
步骤1‑1、动态样本库维护
采用采样池采样的方法,对观众群体进行抽样;
假设采样池的大小,也就是样本数为M;针对观众集合U中观众序列,对采样池进行以下操作:
若采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间;
若采样池已满,也即蓄水池中观众数量已经为M时:
第一步、针对观众序列中的第i‑j名观众,顺序号i为当前观众序号,j为8周前一天0时数据库中的最大序号,若(i‑j)>=M,在[0,(i‑j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众;
第二步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众;
重复第一步,直至没有新增观众;
步骤1‑2电影类型影响力计算
访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
说明书

技术领域

[0001] 本发明属于计算机应用技术领域,涉及一种基于偏好融合的电影群组,即多个具有相似特征的观众)推荐方法,当向群组所推荐的电影具有明确的题材或类别信息时,使用本方法能取得良好效果。

背景技术

[0002] 在日常生活中,随着智能手机的普及,移动社交服务平台如雨后春笋般不断涌现,极大地丰富了人们的日常生活。这些平台的出现扩大了人们的社交半径,为集体活动的组织和举办提供了便捷。为了向观众构成的群组推荐让群组成员尽可能都满意的项目,群组推荐系统应运而生。群组推荐系统相较于传统推荐系统而言,引入了群组的概念。之所以说群组推荐系统的设计更具挑战性,主要是因为群组偏好的获取是十分困难的,因此用于获取群组偏好的偏好融合方法成为了群组推荐系统的核心部分。因此,使用改进的观众偏好融合方法对群组推荐系统性能的提升有着现实的意义。
[0003] 给定全体观众集合U,全体电影集合V,全体群组集合G,全体电影类型集合C,观众‑电影交互矩阵R,以及电影‑类型交互矩阵T。其中,U={u1,u2,...,uk},k为观众总数,在本发明中,k值动态变化;V={v1,v2,...,vn},n为电影总数;G={G1,G2,...,Gs},s为群组总数;C={c1,c2,...,cl},l为类型总数;矩阵R中元素是观众对电影的评分,设置评分的值为1到5之间的整数;矩阵T中元素的值为0或1,为0表示项目不包含该类型,为1表示包含该类型。观众偏好融合的目标是将群组成员对电影的评分进行融合得到群组对项目的评分。
[0004] 大多数现存的观众偏好融合方法是根据观众评分的数据特征来进行偏好融合的,偏好融合时观众权重的合理性和可解释性被忽视,所获取的群组偏好的准确性将无法保证,成为群组推荐系统性能的瓶颈。而且在线电影推荐过程中集合U中的观众动态发生变化,给权重计算进一步增加了困难。

发明内容

[0005] 本发明的目的是在于克服现有技术中的不足,在观众动态变化过程中采用采样的方法在保证电影类型权重计算精确度的条件下,减小计算复杂度;同时考虑观众在不同领域认知的差异以及群组内部成员之间的相互影响,提出了一种基于电影类型的观众偏好融合方法,使电影推荐过程更加客观、符合群组实际需要。具体技术方案如下:
[0006] 一种在线的群组电影推荐方法,包括如下步骤:
[0007] 步骤1、计算电影类型的社会影响力;
[0008] 步骤2、统计群组成员对电影类型熟悉程度;
[0009] 步骤3、计算群组成员对于某种电影类型的话语权;
[0010] 步骤4、融合群组成员的偏好;
[0011] 步骤5、电影推荐。
[0012] 进一步的,所述步骤1由以下步骤组成:
[0013] 步骤1‑1、动态样本库维护
[0014] 采用采样池采样的方法,对观众群体进行抽样;
[0015] 假设采样池的大小,也就是样本数为M;针对观众集合U中观众序列,对采样池进行以下操作:
[0016] 若采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间;
[0017] 若采样池已满,也即蓄水池中观众数量已经为M时:
[0018] 第一步、针对观众序列中的第i‑j名观众,顺序号i为当前观众序号,j为8周前一天0时数据库中的最大序号,若(i‑j)>=M,在[0,(i‑j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众;
[0019] 第二步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众。
[0020] 重复第一步,直至没有新增观众。
[0021] 步骤1‑2电影类型影响力计算
[0022] 访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
[0023] 进一步的,所述步骤2具体包括:
[0024] 根据观众‑电影交互矩阵和电影‑类型交互矩阵确定观众对电影类型的熟悉程度;
[0025] 假设数据集中所有电影的类型属于19种类型中的一种或多种,对于每一个电影项目,可以得到一个维度为19的类型向量,用这个类型向量来表示每一部电影的类型信息;
[0026] 所有电影的类型向量构成的矩阵为T=(t1T,t2T,...,tnT)T,其中n表示电影总数;根据观众的观影记录和电影的类型向量,确定观众和电影类型之间的关系;对于观众ui,其计数向量wui用已观看电影的类型向量的累加和来表示,具体可用如下公式计算:
[0027]
[0028] 其中,Vu是观众ui已观看电影的集合;群组Gi中所有成员的计数向量构成的矩阵为:
[0029]
[0030] 其中,m为群组Gi中成员的数量。
[0031] 进一步的,所述步骤3包括如下步骤:
[0032] 步骤3‑1、群组成员话语权计算
[0033] 计算在群组Gi中群组成员对于某种电影类型k的话语权,观众权重通过下列公式计算得到;
[0034]
[0035] 其中Wu,k表示某个群组成员在步骤2中所得矩阵WGi中u行,k列的值,也即某个观众观看某种类型电影的数量;
[0036] 步骤3‑2、计算群组成员的权重方差,并调整成员权重;
[0037] 群组Gi的成员权重方差可以被定义为:
[0038]
[0039] 其中,m表示群组Gi中成员总数,是群组成员对于电影类型k的平均权重;
[0040] 对观众权重设置阈值L;首先,在群组Gi中得到平均转移权重 平均转移权重的计算过程是将群组内小于阈值的观众权重求和然后除以权重大于阈值的观众数;具体计算公式如下:
[0041]
[0042] 其中,Si是群组Gi的子集,而且Si中的成员权重都低于阈值L;调整观众权重如下:
[0043]
[0044] 当权重方差低于阈值t时,认为群组成员对于该电影类型的熟悉程度比较均匀,此时群组成员的相互影响很小。
[0045] 进一步的,所述步骤4包括如下步骤:
[0046] 步骤4‑1仅考虑电影的一种类型时,融合群组成员的偏好;
[0047] 群组对于电影j的评分能通过下列公式计算得到:
[0048]
[0049] 其中,ru,j是观众u对电影j的评分,Cj是电影j包含的类型构成的集合,ek是电影类型的社会影响力,α和β分别控制群组内部和群组外部对观众偏好融合影响的程度;
[0050] 4‑2考虑电影j包含的所有类型时,群组对电影j的评分,即群组偏好,计算公式如下:
[0051]
[0052] 进一步的,所述步骤5具体如下:根据当前影院上映电影的类型,选取历史数据库中某部相同类型的电影,根据步骤4计算得到等待推荐群组的偏好,选择当前播放电影中满足该偏好的影片进行推荐。
[0053] 本发明的有益效果:
[0054] 本发明通过上述基于采样的电影类型社会影响力计算方法,简化了计算,反映了电影流行趋势;使用观众偏好融合方法对不同观众权重进行了考虑,进而获得合理的群组偏好。本方法能够考虑群组内部和群组外部对观众偏好融合影响,从而保证了推荐的有效性。

实施方案

[0063] 下面结合附图对本发明作进一步说明。
[0064] 本发明的在线的群组电影推荐方法,具体步骤如下:
[0065] 步骤1、计算电影类型的社会影响力;
[0066] 步骤2、统计群组成员对电影类型熟悉程度;
[0067] 步骤3、计算群组成员对于某种电影类型的话语权;
[0068] 步骤4、融合群组成员的偏好;
[0069] 步骤5、电影推荐。
[0070] 具体的,步骤1计算电影类型的社会影响力由以下步骤组成:
[0071] 电影类型的社会影响力可以理解为当前的流行趋势。由于观众人数过多,并且动态变化,为了减少计算量,通过随机采取总体观众样本的部分观众,对抽取观众的观影记录及相应电影类型进行统计计数,得到电影类型的社会影响力e,用于后续观众偏好融合的计算。
[0072] 1‑1动态样本库维护
[0073] 由于在线推荐电影中观众观影记录动态变化,本步骤采用采样池采样的方法,对观众群体进行抽样,减小电影类型社会影响力的计算工作量。
[0074] 假设采样池的大小,也就是样本数为M。针对观众集合U中观众序列,对采样池进行以下操作:
[0075] 如果采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间。
[0076] 第一步:当对采样池已满,也即蓄水池中观众数量已经为M时:
[0077] 第二步:针对观众序列中的第i‑j名观众(顺序号i为当前观众序号,j为56天(8周)前一天0时数据库中的最大序号),有(i‑j)>=M,在[0,(i‑j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众。
[0078] 第三步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众。
[0079] 重复第二步,直至没有新增观众。
[0080] 1‑2电影类型影响力计算
[0081] 访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
[0082] 具体的,步骤2群组成员对电影类型熟悉程度统计过程如下:
[0083] 根据观众‑电影交互矩阵和电影‑类型交互矩阵确定观众对电影类型的熟悉程度。
[0084] 假设一个数据集中所有电影的类型属于19种类型中的一种或多种。因此对于每一个电影项目,可以得到一个维度为19的类型向量,用这个类型向量来表示每一部电影的类型信息。例如,电影《GoldenEye》是动作、冒险、恐怖类型,那么它的类型向量为[0085] t=(1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0)T,
[0086] 于是所有电影的类型向量构成的矩阵为T=(t1T,t2T,...,tnT)T,其中n表示电影总数。根据观众的观影记录和电影的类型向量,能确定观众和电影类型之间的关系,并使用计数向量来表示这种关系。对于观众ui,其计数向量wui可用已观看电影的类型向量的累加和来表示,具体可用如下公式计算:
[0087]
[0088] 其中,Vu是观众ui已观看电影的集合。于是,群组Gi中所有成员的计数向量构成的矩阵为:
[0089]
[0090] 其中,m为群组Gi中成员的数量。
[0091] 计数向量反映了观众对电影类型的熟悉程度,计数向量构成的计数矩阵被用来确定观众在偏好融合过程中的决策权重。因为电影一般有多种类型,所以群组成员的决策权重会随着电影类型的改变而改变。
[0092] 具体的,步骤3群组成员对于某种电影类型的话语权计算过程有以下步骤组成:
[0093] 3‑1群组成员话语权计算
[0094] 计算在群组Gi中群组成员对于某种电影类型k的话语权,观众权重能通过下列公式计算得到;
[0095]
[0096] 其中Wu,k表示某个群组成员在步骤2中所得矩阵WGi中u行,k列的值,也即某个观众观看某种类型电影的数量。
[0097] 3‑2计算群组成员的权重方差,并调整成员权重;
[0098] 考虑到观众会受到群组中其他成员的影响,观众权重应进行适当调整,为了将这种合理假设引入到偏好融合方法中,以群组成员的权重方差为切入点进行合理优化。群组Gi的成员权重方差可以被定义为:
[0099]
[0100] 其中,m表示群组Gi中成员总数,是群组成员对于电影类型k的平均权重。
[0101] 对于方差考虑两种情况:第一,群组权重方差低于规定阈值t;第二,群组权重方差高于规定阈值t。当群组权重方差高于阈值时,认为群组成员对于该电影类型的熟悉程度差异极大。基于一个合理的假设:人们通常会采纳权威人士的建议,于是把低影响力的成员的决策权重调整为0。相对应地,高决策权重的成员的权重会变得更高。本发明中t取值为0.1。
[0102] 为了方便建模,对观众权重也设置一个阈值L。如果观众权重高于该阈值,则认为他是权威人士,通常认为低于阈值的成员乐意听从权威人士的建议。本发明中L值设为0.5。
[0103] 首先,在群组Gi中得到平均转移权重 平均转移权重的计算过程是将群组内小于阈值的观众权重求和然后除以权重大于阈值的观众数。具体计算公式如下:
[0104]
[0105] 其中,Si是群组Gi的子集,而且Si中的成员权重都低于阈值L。然后,调整观众权重如下:
[0106]
[0107] 当权重方差低于阈值t时,认为群组成员对于该电影类型的熟悉程度比较均匀,此时群组成员的相互影响很小。为了公平起见,不调整观众权重。
[0108] 具体的,步骤4融合群组成员的偏好基本过程如下:
[0109] 4‑1仅考虑电影的一种类型时,融合群组成员的偏好;
[0110] 群组对于电影j的评分能通过下列公式计算得到:
[0111]
[0112] 其中,ru,j是观众u对电影j的评分,Cj是电影j包含的类型构成的集合,ek是电影类型的社会影响力,α和β分别控制群组内部和群组外部(例如流行趋势)对观众偏好融合影响的程度,本发明分别取0.5和0.5。
[0113] 4‑2考虑电影j包含的所有类型时,群组对电影j的评分,即群组偏好,计算公式如下:
[0114]
[0115] 具体的,步骤5电影推荐过程如下:
[0116] 根据当前影院上映电影的类型,选取历史数据库中某部相同类型的电影,根据步骤4计算得到等待推荐群组的偏好,选择当前播放电影中满足该偏好的影片进行推荐。
[0117] 根据图5以及图2和图4所示数据计算可知该群组对于电影《GoldenEye》的偏好融合后的评分为3.2分。该评分即可用于衡量该群组用户的电影类型喜好,进而从当前上演电影中选择相应影片进行推荐。

附图说明

[0055] 图1是本发明的流程图。
[0056] 图2是步骤1计算结果示意图:
[0057] 图中影响力表示该种类型电影当前影响力。
[0058] 图3是步骤2计算结果示意图:
[0059] 图中显示了某一个群组的成员a、b、c对电影类型熟悉程度统计结果。
[0060] 图4是步骤3计算结果示意图:
[0061] 图中显示该群组成员对于奇幻电影的权重方差超过了0.1,但是群组中无权重小于阈值L(0.5)可供转移的观众,因此不需要进行权重转移计算。
[0062] 图5显示了某一个群组的成员a、b、c对一部电影的评分。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号