首页 > 专利 > 中国计量大学 > 一种基于非局部网络和局部网络的短视频推荐方法专利详情

一种基于非局部网络和局部网络的短视频推荐方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2021-01-12

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2021-05-25

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-11-12

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2041-01-12

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN202110034609.0	申请日	2021-01-12
公开/公告号	CN112765401B	公开/公告日	2021-11-12
授权日	2021-11-12	预估到期日	2041-01-12
申请年	2021年	公开/公告年	2021年
缴费截止日
分类号	G06F16/735 、G06N3/04 、G06N3/08	主分类号	G06F16/735
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	0
权利要求数量	1	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2019.05.23CN 112100440 A,2020.12.18都奕冰等《.融合项目嵌入表征与注意力机制的推荐算法》《.计算机工程与设计》.2020,第41卷(第3期),第682-688页.;
引用专利	US2019156210A	被引证专利
专利权维持	1	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	中国计量大学	第一申请人	中国计量大学
专利权人	中国计量大学	当前专利权人	中国计量大学
发明人	顾盼	第一发明人	顾盼
地址	浙江省杭州市下沙高教园区学源街258号	邮编	310018
申请人数量	1	发明人数量	1
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

摘要

本发明公开了一种基于非局部网络和局部网络的短视频推荐方法。该方法根据用户对短视频的多行为交互序列，得到用户兴趣表征，进而预测用户对目标短视频的点击率。原始的序列推荐方法都是针对单行为序列，无法适用于多行为交互序列表征。而用户的短视频交互序列中既包括“点击”行为又包括“肯定”行为。因此，本方法提出一种非局部网络和局部网络相结合的方法。主要由三个部分组成：第一部分是采用注意力机制方法，得到用户的短视频交互序列中“肯定”行为对每个“点击”行为的影响；第二部分是采用基于非局部注意力机制的循环神经网络生成用户兴趣表征；第三部分是根据用户兴趣表征，预测用户对目标短视频的点击率。

摘要附图
说明书附图：图1
说明书附图：图2

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-11-12	授权
2	2021-05-25	实质审查的生效	IPC(主分类): G06F 16/735 专利申请号: 202110034609.0 申请日: 2021.01.12
3	2021-05-07	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于非局部网络和局部网络的短视频推荐方法，其特征在于：
采用注意力机制方法，得到用户的短视频多行为交互序列中“肯定”行为对每个“点击”行为的影响；对于一个用户的交互行为序列可以表示为X＝[x1,…,xl]，其中是短视频的封面图特征向量，d是特征向量长度；其中，“肯定”行为序列表示为*
且X是X的子集；“点击”行为序列即是X＝[x1,…,xl]；用非局部网络方法中的注意力机制方法，得到“肯定”行为序列对“点击”行为的影响；序列中最后点击短视频(last‑click)用于代表用户的当前点击兴趣，所以注意力机制是基于最后点击短视频的：
其中，和是模型需要训练的参数；xt表示点击序
列中的最后一个短视频向量表征，代表当前“点击”序列中“肯定”序列的第i个短视频向量表征；σ为sigmoid函数；代表当前“点击”序列中“肯定”序列的第i个短视频向量表征的重要程度；是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣的影响；
采用基于非局部注意力机制的循环神经网络生成用户兴趣表征；基于非局部注意力机制的循环神经网络中的门控制循环神经网络单元(unit)对信息的选择不仅考虑序列中当前短视频和上一个门控制循环神经网络单元的状态，还考虑“肯定”行为的影响，如下：
其中，zt为更新门(update gate),rt是重置门(reset gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出；是当前记忆内容；xt是当前层的节点输入，是“肯定”行为的影响；和
分别是控制更新门zt和重置门rt的参数；和是控制前记忆内容的参
数；⊙是元素级别的矩阵相乘，σ是sigmoid函数；门控制循环神经网络最后一层的隐藏状态ht的输出就是用户兴趣表征v；
根据用户兴趣表征，预测用户对目标短视频xnew的点击率：
其中，v是用户兴趣表征，xnew是目标短视频；是用户对目标短视频的点击率预测值；
和是转移矩阵，是偏置向量，b2是偏置标量；σ是
sigmoid激活函数；
根据模型特性，设计损失函数；通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数；采用交叉熵损失函数来指导模型参数的更新过程：
其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频；σ是sigmoid函数；采用Adam优化器更新模型参数。

说明书

技术领域

[0001] 本发明属于互联网服务技术领域，尤其是涉及一种基于非局部网络和局部网络的短视频推荐方法。

背景技术

[0002] 短视频是一种新型的且时间较短的视频。短视频的拍摄不需要使用专业设备，也不需要专业技巧。用户直接通过手机就可以很方便地进行拍摄和上传到短视频平台，因此短视频平台的短视频数量增长得非常快。这使得对有效短视频推荐系统的需求非常迫切，有效的短视频推荐系统可以提升用户体验和用户黏性，从而给平台带来巨大的商业价值。

[0003] 近些年，很多研究者提出了基于视频的个性化推荐方法。这些方法可以分为三类：协同过滤、基于内容的推荐和混合推荐方法。但是相比于视频，短视频有着不同的特点：描述文本质量较低、时长较短且用户在一段时间内的交互序列较长。因此，短视频推荐是一个更具有挑战性的任务。且在短视频推荐问题中用户的交互行为有很多种，包括“点击”、“喜欢”和“收藏”。不同的交互行为代表不同的喜欢程度。“点击”表示该用户愿意观看该短视频，但情感不强烈；而“喜欢”和“收藏”都属于用户强烈和确切的情感，“喜欢”表示用户喜欢该短视频，愿意再观看同类的视频，“收藏”表示用户不仅当前喜欢该短视频，还希望以后能再看到该视频。被用户“喜欢”和“收藏”的短视频也同时被用户“点击”。可以将“喜欢”和“收藏”归纳为同一类型的行为，即“肯定”行为。此时，用户的交互序列具有两种交互行为，一种是“点击”行为，另一种是“肯定”行为。针对于短视频推荐问题，有研究者提出了一些方法。
例如，Chen等人利用分层的注意力机制去计算物品和类目这两种级别的重要性，得到更准确的预测结果。Li等人使用基于图的循环神经网络去建模，最后得到用户的偏好。

[0004] Chen等人的方法只采用了用户的点击行为信息，没有考虑用户的其他行为信息。Li等人分别将序列推荐方法应用于“点击”行为序列和“肯定”行为序列。最后实验表明，基于“肯定”行为序列的用户兴趣表征对提升推荐效果的作用很不明显。原因有两个：用户的“肯定”行为序列时间相隔较长，序列性不强；将“肯定”行为序列单独建模，忽视了“肯定”行为对后续“点击”行为的作用。本方法创新性地提出多行为交互序列建模方法，将“点击”和“肯定”这两种行为序列放到一个行为序列中处理，生成用户兴趣向量表征。其中，“点击”行为是有序列性的，而“肯定”行为因为行为事件间隔较大，是无序的。本方法将非局部网络(non‑local network)和局部网络(local network)结合起来，其中，非局部网络采用的是注意力机制(attention mechanism)，学习过去一段时间内“肯定”行为对“点击”行为的影响；局部网络采用的是门控循环神经网络(GRU)，学习“点击”行为的序列性。本方法是一种基于非局部注意力机制的循环神经网络，改进原始神经网络的结构，使得网络可以同时学习到“肯定”行为对“点击”行为的影响以及“点击”行为对“点击”行为的影响。

发明内容

[0005] 本发明所要解决的技术问题是根据用户对短视频的多行为点击序列，预测用户对目标短视频的点击率。用户的交互行为有很多种，包括“点击”、“喜欢”和“收藏”。不同的交互行为代表不同的喜欢程度。“点击”表示该用户愿意观看该短视频，但情感不强烈；而“喜欢”和“收藏”都属于用户的强烈和确切的情感，“喜欢”表示用户喜欢该短视频，愿意再观看同类的视频，“收藏”表示用户不仅当前喜欢该短视频，还希望以后能再看到该视频。被用户“喜欢”和“收藏”的短视频也同时被用户“点击”。可以将“喜欢”和“收藏”归纳为同一类型的行为，即“肯定”行为。此时，用户的交互序列具有两种交互行为，一种是“点击”行为，另一种是“肯定”行为。然而，原始的序列推荐方法都是针对一种交互行为的序列。为此，本发明采用以下技术方案：

[0006] 一种基于非局部网络和局部网络的短视频推荐方法，包括以下步骤：

[0007] 采用注意力机制方法，得到用户的短视频多行为交互序列中“肯定”行为对每个“点击”行为的影响。对于一个用户的交互行为序列可以表示为X＝[x1,…,xl]，其中是短视频的封面图特征向量，d是特征向量长度。其中，“肯定”行为序列表示为*且X是X的子集。“点击”行为序列即是X＝[x1,…,xl]。用非局部网络方法
中的注意力机制方法，得到“肯定”行为序列对“点击”行为的影响。通常，序列中最后点击短视频(last‑click)用于代表用户的当前点击兴趣，所以注意力机制是基于最后点击短视频的：

[0008]

[0009]

[0010] 其中，和是模型需要训练的参数。xt表示点击序列中的最后一个短视频向量表征，代表当前“点击”序列中“肯定”序列的第i个短视频向量表征。σ为sigmoid函数。代表当前“点击”序列中“肯定”序列的第i个短视频向量表征的重要程度。是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣的影响。

[0011] 采用基于非局部注意力机制的循环神经网络生成用户兴趣表征。原始的门控制循环神经网络(GRU)只能处理单行为序列，结构如下，：

[0012] zt＝σ(Wxz·xt+Whz·ht‑1)

[0013] rt＝σ(Wxr·xt+Whr·ht‑1)

[0014]

[0015]

[0016] 其中，rt是重置门(reset gate)，zt为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xt是当前层的节点输入。和分别是控制更新门zt和重置门rt的参数。
和是控制前记忆内容的参数。⊙ 是元素级别的矩阵相乘，σ是
sigmoid函数。

[0017] 然而门控制循环神经网络不适用多行为序列。为了适用于多行为序列，本方法改进原始的门控制循环神经网络，使得门控制循环神经网络单元(unit)对信息的选择不仅考虑序列中当前短视频和上一个门控制循环神经网络单元的状态，还考虑“肯定”行为的影响，如下：

[0018]

[0019]

[0020]

[0021]

[0022] 其中，zt为更新门(update gate),rt是重置门(reset gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xt是当前层的节点输入，是“肯定”行为的影响。和分别是控制更新门zt和重置门rt的参数。和是控制前记忆
内容的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数。门控制循环神经网络最后一层的隐藏状态ht的输出就是用户兴趣表征v。

[0023] 根据用户兴趣表征，预测用户对目标短视频xnew的点击率：

[0024]

[0025] 其中，v是用户兴趣表征，xnew是目标短视频。是用户对目标短视频的点击率预测值。和是转移矩阵，是偏置向量，b2是偏置标量。σ是sigmoid激活函数。

[0026] 根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程：

[0027]

[0028] 其中，y∈{0，1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。我们采用Adam优化器更新模型参数。

[0029] 本发明的有益技术效果如下：

[0030] (1)本发明是一种多行为序列表征方法。和以往单一行为序列表征方法不同，本方法将“点击”和“肯定”这两种行为序列放到一个行为序列中处理，生成用户兴趣向量表征。其中，“点击”行为是有序列性的，而“肯定”行为因为行为事件间隔较大，是无序的。

[0031] (2)本发明将非局部网络(non‑local network)和局部网络(local network)结合起来。其中，非局部网络采用的是注意力机制(attention mechanism)，学习过去一段时间内所有“肯定”行为对“点击”行为的影响；局部网络采用的是门控循环神经网络(GRU)，学习近段时间内“点击”行为对“点击”行为的影响。

[0032] (3)本发明是一种基于非局部注意力机制的循环神经网络，通过改进原始神经网络的结构，使得网络可以同时学习到“肯定”行为对“点击”行为的影响以及“点击”行为对“点击”行为的影响。

实施方案

[0035] 为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于非局部网络和局部网络的短视频推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

[0036] 短视频点击率预测任务是建立一个模型去预测用户点击短视频的概率。用户的历史交互短视频序列表示为其中，xj代表第j个短视频，l是序列的长度。用户的交互行为有很多种，包括“点击”、“喜欢”和“收藏”。不同的交互行为代表不同的喜欢程度。“点击”表示该用户愿意观看该短视频，但情感不强烈；而“喜欢”和“收藏”都属于用户强烈和确切的情感，“喜欢”表示用户喜欢该短视频，愿意再观看同类的视频，“收藏”表示用户不仅当前喜欢该短视频，还希望以后能再看到该视频。被用户“喜欢”和“收藏”的短视频也同时被用户“点击”。因此，短视频点击率预测问题可以表示成：输入用户多行为交互序列以及目标短视频xnew，来预测用户对目标短视频xnew的点击率。

[0037] 为此，本发明提出了一种基于非局部网络和局部网络的短视频推荐方法。它根据用户对短视频的多行为交互序列，预测用户对目标短视频的点击率。这里的多行为包括用户的“点击”、“喜欢”和“收藏”行为。在本方法中，将“喜欢”和“收藏”归纳为同一类型的行为，即“肯定”行为。此时，用户的交互序列具有两种交互行为，一种是“点击”行为，另一种是“肯定”行为。原始的序列推荐方法都是针对一种交互行为的序列。Li等人分别将序列推荐方法应用于“点击”行为序列和“肯定”行为序列，最后实验表明，基于“肯定”行为序列的用户兴趣表征对提升推荐效果的作用很不明显。原因有两个：用户的“肯定”行为序列时间相隔较长，序列性不强；将“肯定”行为序列单独建模，忽视了“肯定”行为对后续“点击”行为的作用。本方法创新性地提出多行为交互序列建模方法，将“点击”和“肯定”这两种行为序列放到一个行为序列中处理，生成用户兴趣向量表征。其中，“点击”行为是有序列性的，而“肯定”行为因为行为事件间隔较大，是无序的。本方法将非局部网络(non‑local network)和局部网络(local network)结合起来，其中，非局部网络采用的是注意力机制(attention mechanism)，学习过去一段时间内“肯定”行为对“点击”行为的影响；局部网络采用的是门控循环神经网络(GRU)，学习“点击”行为的序列性。本方法同时是一种基于非局部注意力机制的循环神经网络，改进了原始神经网络的结构，使得网络可以同时学习到“肯定”行为对“点击”行为的影响以及“点击”行为对“点击”行为的影响。

[0038] 本方法主要由三个部分组成，如图2所示。第一部分是采用注意力机制方法，得到用户的短视频多行为交互序列中“肯定”行为对每个“点击”行为的影响。第二部分是采用基于非局部注意力机制的循环神经网络生成用户兴趣表征。第三部分是根据用户兴趣表征，预测用户对目标短视频的点击率。

[0039] 如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

[0040] S100，采用注意力机制方法，得到用户的短视频多行为交互序列中“肯定”行为对每个“点击”行为的影响。对于一个用户的交互行为序列可以表示为X＝[x1,…,xl]，其中是短视频的封面图特征向量，d是特征向量长度。其中，“肯定”行为序列表示为*且X 是X的子集。“点击”行为序列即是X＝[x1，…,xl]。用非局部网络方法
中的注意力机制方法，得到“肯定”行为序列对“点击”行为的影响。通常，序列中最后点击短视频(last‑click)用于代表用户的当前点击兴趣，所以注意力机制是基于最后点击短视频的：

[0041]

[0042]

[0043] 其中，和是模型需要训练的参数。xt表示点击序列中的最后一个短视频向量表征，代表当前“点击”序列中“肯定”序列的第i个短视频向量表征。σ为sigmoid函数。代表当前“点击”序列中“肯定”序列的第i个短视频向量表征的重要程度。是以xt为结尾的“点击”行为序列中“肯定”行为对当前点击兴趣的影响。

[0044] S200，采用基于非局部注意力机制的循环神经网络生成用户兴趣表征。原始的门控制循环神经网络(GRU)只能处理单行为序列，结构如下：

[0045] zt＝σ(Wxz·xt+Whz·ht‑1)

[0046] rt＝σ(Wxr·xt+Whr·ht‑1)

[0047]

[0048]

[0049] 其中，rt是重置门(reset gate)，zt为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xt是当前层的节点输入。和分别是控制更新门zt和重置门rt的参数。
和是控制前记忆内容的参数。⊙是元素级别的矩阵相乘，σ是
sigmoid函数。

[0050] 然而门控制循环神经网络不适用多行为序列。为了适用于多行为序列，本方法改进原始的门控制循环神经网络，使得门控制循环神经网络单元(unit)对信息的选择不仅考虑当前序列中短视频和上一个门控制循环神经网络单元的状态，还考虑“肯定”行为的影响，如下：

[0051]

[0052]

[0053]

[0054]

[0055] 其中，zt为更新门(update gate),rt是重置门(reset gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。是当前记忆内容。xt是当前层的节点输入，是“肯定”行为的影响。和分别是控制更新门zt和重置门rt的参数。和是控制前记忆
内容的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数。门控制循环神经网络最后一层的隐藏状态ht的输出就是用户兴趣表征v。

[0056] S300，根据用户兴趣表征，预测用户对目标短视频xnew的点击率：

[0057]

[0058] 其中，v是用户兴趣表征，xnew是目标短视频。是用户对目标短视频的点击率预测值。和是转移矩阵，是偏置向量，b2是偏置标量。σ是sigmoid激活函数。

[0059] S400，根据模型特性，设计损失函数。通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差，进而使用误差来更新模型参数。我们采用交叉熵损失函数来指导模型参数的更新过程：

[0060]

[0061] 其中，y∈{0,1}是真实值，代表用户是否点击了目标短视频。σ是sigmoid函数。我们采用Adam优化器更新模型参数。

[0062] 上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

附图说明

[0033] 图1为本发明一种基于非局部网络和局部网络的短视频推荐方法的流程示意图；

[0034] 图2为本发明一种基于非局部网络和局部网络的短视频推荐方法的模型框架图。

1基于互联网和数字技术的信息优化处理方法及服务器 2基于人工智能的互联网用户整合方法及大数据服务系统