盲专网 - 一种基于选择记忆的马尔可夫模型的用户位置预测方法

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2019-11-12

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2020-06-02

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-04-06

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2039-11-12

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201911097403.1	申请日	2019-11-12
公开/公告号	CN111125551B	公开/公告日	2021-04-06
授权日	2021-04-06	预估到期日	2039-11-12
申请年	2019年	公开/公告年	2021年
缴费截止日
分类号	G06F16/9537 、G06F17/18 、G06Q50/00	主分类号	G06F16/9537
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	0
权利要求数量	1	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	3	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	颜成钢、李文超、孙垚棋、张继勇、张勇东、沈韬	第一发明人	颜成钢
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	6
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

杨舟涛

摘要

本发明提供一种基于选择记忆的马尔可夫模型的用户位置预测方法。本发明基于传统马尔可夫模型，汲取循环神经网络模型的思想，在保留马尔可夫模型优点的前提下，增加选择记忆单元，解决马尔可夫模型本身的缺陷，即假设未来状态只与当前状态相关，与其他历史状态相互独立。本发明方法保留了传统马尔可夫模型运算简单，速度快的优势的基础上，通过选择记忆单元大幅度提升了预测的精度，在速度远快于RNN预测模型的前提下，可以取的与一般RNN预测模型近似的预测精度。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-04-06	授权
2	2020-06-02	实质审查的生效	IPC(主分类): G06F 16/9537 专利申请号: 201911097403.1 申请日: 2019.11.12
3	2020-05-08	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于选择记忆的马尔可夫模型的用户位置预测方法，其特征在于，具体步骤如下：
步骤(1)、确定用户位置预测的基本数学模型：
社交媒体中的用户信息基本包含了用户身份信息U，用户位置信息L，打卡的时间信息T，社交关系信息E；用户身份信息U＝(u1,u2,u3,…,ux),由社交媒体平台的用户ID信息组成，用户位置信息其中 l＝(lon,lat)，lon
表示用户位置的经度坐标信息，lat表示用户位置的纬度坐标信息；打卡时间信息其中t表示打卡的时间戳；
用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置，计算公式如下式所示：
上式中v＝1,2,3…x'，M为需要求解的预测模型；
设置固定的时间变化，仅考虑位置的变迁，则用户位置预测方法的公式可简化为：
步骤(2)、确定基本的马尔可夫预测模型的数学模型
有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程，且满足马尔可夫特性，即无记忆特性；
式中，in,in-1,…,i0∈S，n∈N；
引入转移概率pij(n)，公式如下；
pij(n)＝P(X(n+1)＝j|X(n)＝i),i,j∈S      (4)
考虑时间同质马尔可夫链，将转移概率简化为pij，不再依赖时间索引n∈N；
pij＝P(X(n+1)＝j|X(n)＝i),i,j∈S      (5)
记P为状态转移矩阵，
状态转移矩阵P满足以下性质，
步骤(3)、构建选择记忆单元的数学模型：
在用户位置预测中，用户访问的位置点定义为状态，通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵；
马尔可夫特性简化了计算，但丢失了大量有用信息，本发明引入了选择记忆功能，定义记忆单元转换矩阵为：
H＝(H2,H3,…,Hh)   (8)
式中，h表示最长记忆时间距离；
在实际的用户位置变迁过程中，下一步的可能目的地不仅与当前位置有关，还受到过去到达过的位置的影响，同时吸取马尔可夫特性简化计算的优势，对于前k步的记忆，忽略k+1步影响，定义记忆单元中：
步骤(4)、构建选择记忆的马尔可夫模型M：
M＝[P,H2,H3,…,Hh]W               (11)
式中，W∈Rh×1表示选择记忆权重向量，人类越临近的行为对未来行为影响作用越大，基于该人类行为的基本规律，对于选择记忆权重向量W中各个元素wk的取值原则为,k值越小，则相应的权重值wk越大，定义当前步k＝1；为降低运算复杂度，将W定义为One-hot向量，公式如下：
步骤(5)、预处理真实的原生用户打卡数据；
原生用户打卡数据稀疏性较强，在不影响模型预测精度的情况下，为提升计算效率，将用户中打卡总数少于阈值θ1的用户剔除，将被打卡地点中打卡次数少于阈值θ2的地点剔除；
根据用户打卡行为的统计规律，将每连续Γ时长内的打卡行为记录划分为一个时间窗口，考虑到打卡数据本身潜在的周期性与序列性，确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4，将用户时间窗口总数少于阈值θ3的用户剔除，将单个时间窗口内打卡次数小于阈值θ4的窗口剔除；
步骤(6)、训练选择记忆的马尔可夫模型
将预处理后的数据输入提出的选择记忆的马尔可夫模型M，模型训练的程序通过python语言编写；最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。

说明书

技术领域

[0001] 本发明针对位置预测方法，具体涉及一种基于选择记忆的马尔可夫模型的用户位置预测方法。

背景技术

[0002] 近年来随着移动终端的普及，基于位置的社交网络(如四方、新浪、微信、脸谱、推特等)得到了空前的发展，用户的打卡行为逐渐成为一种潮流，甚至是一种习惯。用户位置预测算法在基于位置的各类应用中蕴藏了巨大的可供挖掘的价值。比如，对于当下城市中流行的商业综合体，其运维管体系统可以根据用户当前的位置信息以及其历史打卡的位置信息推测其心怡的下一位置，基于该推测结果做出更精准的娱乐消费场所的推荐，从而可以大大提升成功推荐的概率。这不仅提高了当下的商业收益，而且提升了用户对该商业体的满意度，为商业体的长期繁荣发展奠定了基础。对于政府而言，交通管理部门可以根据用户位置流动状况，推测交通分布变化状况，提前做好干预引导工作，从而可以减轻交通阻塞问题，确保交通体系安全流畅的运行。

[0003] 现有的用户位置预测算法既有基于传统马尔可夫模型的预测方法也有基于当前被广泛关注的循环神经网络(RNN)模型的方法。以上两类方法均有较为明显的优点与缺点，前者运算速度快，运算成本低，但是其精度相对较低，后者的预测精度更高，但是其算力消耗大，对于训练数据的需求量大。

发明内容

[0004] 针对现有技术中存在的问题，本发明提供一种基于选择记忆的马尔可夫模型的用户位置预测方法。

[0005] 本发明基于传统马尔可夫模型，汲取循环神经网络模型的思想，在保留马尔可夫模型优点的前提下，增加选择记忆单元，解决马尔可夫模型本身的缺陷，即假设未来状态只与当前状态相关，与其他历史状态相互独立。

[0006] 一种基于选择记忆的马尔可夫模型的用户位置预测方法，步骤如下：

[0007] 步骤(1)、确定用户位置预测的基本数学模型：

[0008] 社交媒体中的用户信息基本包含了用户身份信息U，用户位置信息L，打卡的时间信息T，社交关系信息E。用户身份信息U＝(u1,u2,u3,…,un),由社交媒体平台的用户ID信息组成，用户位置信息其中 l＝(lon,lat)，lon表示用户位置的经度坐标信息，lat表示用户位置的纬度坐标信息。打卡时间信息其中ti表示打卡的时间戳。

[0009] 用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置，计算公式如下式所示：

[0010]

[0011] 上式中i＝1,2,3…n，M为需要求解的预测模型。

[0012] 设置固定的时间变化，仅考虑位置的变迁，则用户位置预测方法的公式可简化为：

[0013]

[0014] 步骤(2)、确定基本的马尔可夫预测模型的数学模型

[0015] 有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程，且满足马尔可夫特性(无记忆特性)；

[0016]

[0017] 式中，in,in-1,…,i0∈s，n∈N。

[0018] 引入转移概率pij(n)，公式如下；

[0019] pij(n)＝P(X(n+1)＝j|X(n)＝i),i,j∈S (4)

[0020] 考虑时间同质马尔可夫链，将转移概率简化为pij，不再依赖时间索引n∈N；

[0021] pij＝P(X(n+1)＝j|X(n)＝i),i,j∈S (5)

[0022] 记P为状态转移矩阵，

[0023]

[0024] 状态转移矩阵P满足以下性质，

[0025]

[0026] 步骤3构建选择记忆单元的数学模型：

[0027] 在用户位置预测中，用户访问的位置点定义为状态，通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵。

[0028] 马尔可夫特性简化了计算，但丢失了大量有用信息，本发明引入了选择记忆功能，定义记忆单元转换矩阵为：

[0029] H＝(H2,H3,…,Hh) (8)

[0030] 式中，h表示最长记忆时间距离。

[0031]

[0032] 在实际的用户位置变迁过程中，下一步的可能目的地不仅与当前位置有关，还受到过去到达过的位置的影响，同时吸取马尔可夫特性简化计算的优势，对于前k步的记忆，忽略k+1步影响，定义记忆单元中：

[0033]

[0034] 步骤(4)、构建选择记忆的马尔可夫模型M：

[0035] M＝[P,H2,H3,…,Hh]W (11)

[0036] 式中，W∈Rh×1表示选择记忆权重向量，人类越临近的行为对未来行为影响作用越大，基于该人类行为的基本规律，对于选择记忆权重向量W中各个元素wk的取值原则为,k(定义当前步k＝1)值越小，则相应的权重值wk越大。为降低运算复杂度，将W定义为One-hot向量，公式如下：

[0037]

[0038] 步骤(5)、预处理真实的原生用户打卡数据。

[0039] 原生用户打卡数据稀疏性较强，在不影响模型预测精度的情况下，为提升计算效率，将用户中打卡总数少于阈值θ1的用户剔除，将被打卡地点中打卡次数少于阈值θ2的地点剔除。根据用户打卡行为的统计规律，将每连续Γ时长内的打卡行为记录划分为一个时间窗口，考虑到打卡数据本身潜在的周期性与序列性，确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4，将用户时间窗口总数少于阈值θ3的用户剔除，将单个时间窗口内打卡次数小于阈值θ4的窗口剔除。

[0040] 步骤(6)、训练选择记忆的马尔可夫模型

[0041] 将预处理后的数据输入提出的选择记忆的马尔可夫模型M，模型训练的程序通过python语言编写。最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。

[0042] 本发明有益结果如下：

[0043] 1、随着5G技术的入市，基于位置的社交网络将迎来一轮迅猛的发展，因此对于高质量位置预测算法的需求会进一步提升。因此该专利中的算法的出现将为5G技术的推广普及奠定坚实的基础。

[0044] 2、选择记忆的马尔可夫模型保留了传统马尔可夫模型运算简单，速度快的优势的基础上，通过选择记忆单元大幅度提升了预测的精度，在速度远快于RNN预测模型的前提下，可以取的与一般RNN预测模型近似的预测精度。

实施方案

[0048] 以下结合附图对本发明方法进行进一步描述。

[0049] 如图1所示，本发明的用户位置预测方法，步骤如下：

[0050] 步骤(1)、确定用户位置预测的基本数学模型：

[0051] 社交媒体中的用户信息基本包含了用户身份信息U，用户位置信息L，打卡的时间信息T，社交关系信息E。用户身份信息U＝(u1,u2,u3,…,un),由社交媒体平台的用户ID信息组成，用户位置信息其中 l＝(lon,lat)，lon表示用户位置的经度坐标信息，lat表示用户位置的纬度坐标信息。打卡时间信息其中ti表示打卡的时间戳。

[0052] 用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置，计算公式如下式所示：

[0053]

[0054] 上式中i＝1,2,3…n，M为需要求解的预测模型。

[0055] 设置固定的时间变化，仅考虑位置的变迁，则用户位置预测方法的公式可简化为：

[0056]

[0057] 步骤(2)、确定基本的马尔可夫预测模型的数学模型

[0058] 有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程，且满足马尔可夫特性(无记忆特性)；

[0059]

[0060] 式中，in,in-1,…,i0∈s，n∈N。

[0061] 引入转移概率pij(n)，公式如下；

[0062] pij(n)＝P(X(n+1)＝j|X(n)＝i),i,j∈S (4)

[0063] 考虑时间同质马尔可夫链，将转移概率简化为pij，不再依赖时间索引n∈N；

[0064] pij＝P(X(n+1)＝j|X(n)＝i),i,j∈S (5)

[0065] 记P为状态转移矩阵，

[0066]

[0067] 状态转移矩阵P满足以下性质，

[0068]

[0069] 步骤3构建选择记忆单元的数学模型：

[0070] 在用户位置预测中，用户访问的位置点定义为状态，通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵。

[0071] 马尔可夫特性简化了计算，但丢失了大量有用信息，本发明引入了选择记忆功能，定义记忆单元转换矩阵为：

[0072] H＝(H2,H3,…,Hh) (8)

[0073] 式中，h表示最长记忆时间距离。

[0074]

[0075] 在实际的用户位置变迁过程中，下一步的可能目的地不仅与当前位置有关，还受到过去到达过的位置的影响，同时吸取马尔可夫特性简化计算的优势，对于前k步的记忆，忽略k+1步影响，定义记忆单元中：

[0076]

[0077] 步骤(4)、构建选择记忆的马尔可夫模型M：

[0078] M＝[P,H2,H3,…,Hh]W (11)

[0079] 式中，W∈Rh×1表示选择记忆权重向量，人类越临近的行为对未来行为影响作用越大，基于该人类行为的基本规律，对于选择记忆权重向量W中各个元素wk的取值原则为,k(定义当前步k＝1)值越小，则相应的权重值wk越大。为降低运算复杂度，将W定义为One-hot向量，公式如下：

[0080]

[0081] 步骤(5)、预处理真实的原生用户打卡数据。

[0082] 原生用户打卡数据稀疏性较强，在不影响模型预测精度的情况下，为提升计算效率，将用户中打卡总数少于阈值θ1的用户剔除，将被打卡地点中打卡次数少于阈值θ2的地点剔除。根据用户打卡行为的统计规律，将每连续Γ时长内的打卡行为记录划分为一个时间窗口，考虑到打卡数据本身潜在的周期性与序列性，确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4，将用户时间窗口总数少于阈值θ3的用户剔除，将单个时间窗口内打卡次数小于阈值θ4的窗口剔除。

[0083] 步骤(6)、训练选择记忆的马尔可夫模型

[0084] 如图2所示，将预处理后的数据输入提出的选择记忆的马尔可夫模型M，模型训练的程序通过python语言编写。最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。

[0085] 步骤(7)、验证选择记忆的马尔可夫模型的性能

[0086] 与传统马尔可夫预测模型、RNN模型的预测结果对比

[0087] 图3为本发明方法在纽约与东京两地的数据集上三种预测模型的预测精度直方图。

附图说明

[0045] 图1为本发明方法整体流程图；

[0046] 图2为本发明方法预测模型训练流程图；

[0047] 图3为本发明方法在纽约与东京两地的数据集上三种预测模型的预测精度直方图。

首页 > 专利 > 杭州电子科技大学 > 一种基于选择记忆的马尔可夫模型的用户位置预测方法专利详情

一种基于选择记忆的马尔可夫模型的用户位置预测方法 0 0

技术领域

背景技术

发明内容

实施方案

附图说明