[0004] 针对现有技术中存在的问题,本发明提供一种基于选择记忆的马尔可夫模型的用户位置预测方法。
[0005] 本发明基于传统马尔可夫模型,汲取循环神经网络模型的思想,在保留马尔可夫模型优点的前提下,增加选择记忆单元,解决马尔可夫模型本身的缺陷,即假设未来状态只与当前状态相关,与其他历史状态相互独立。
[0006] 一种基于选择记忆的马尔可夫模型的用户位置预测方法,步骤如下:
[0007] 步骤(1)、确定用户位置预测的基本数学模型:
[0008] 社交媒体中的用户信息基本包含了用户身份信息U,用户位置信息L,打卡的时间信息T,社交关系信息E。用户身份信息U=(u1,u2,u3,…,un),由社交媒体平台的用户ID信息组成,用户位置信息 其中 l=(lon,lat),lon表示用户位置的经度坐标信息,lat表示用户位置的纬度坐标信息。打卡时间信息其中ti表示打卡的时间戳。
[0009] 用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置,计算公式如下式所示:
[0010]
[0011] 上式中i=1,2,3…n,M为需要求解的预测模型。
[0012] 设置固定的时间变化,仅考虑位置的变迁,则用户位置预测方法的公式可简化为:
[0013]
[0014] 步骤(2)、确定基本的马尔可夫预测模型的数学模型
[0015] 有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程,且满足马尔可夫特性(无记忆特性);
[0016]
[0017] 式中,in,in-1,…,i0∈s,n∈N。
[0018] 引入转移概率pij(n),公式如下;
[0019] pij(n)=P(X(n+1)=j|X(n)=i),i,j∈S (4)
[0020] 考虑时间同质马尔可夫链,将转移概率简化为pij,不再依赖时间索引n∈N;
[0021] pij=P(X(n+1)=j|X(n)=i),i,j∈S (5)
[0022] 记P为状态转移矩阵,
[0023]
[0024] 状态转移矩阵P满足以下性质,
[0025]
[0026] 步骤3构建选择记忆单元的数学模型:
[0027] 在用户位置预测中,用户访问的位置点定义为状态,通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵。
[0028] 马尔可夫特性简化了计算,但丢失了大量有用信息,本发明引入了选择记忆功能,定义记忆单元转换矩阵为:
[0029] H=(H2,H3,…,Hh) (8)
[0030] 式中,h表示最长记忆时间距离。
[0031]
[0032] 在实际的用户位置变迁过程中,下一步的可能目的地不仅与当前位置有关,还受到过去到达过的位置的影响,同时吸取马尔可夫特性简化计算的优势,对于前k步的记忆,忽略k+1步影响,定义记忆单元中:
[0033]
[0034] 步骤(4)、构建选择记忆的马尔可夫模型M:
[0035] M=[P,H2,H3,…,Hh]W (11)
[0036] 式中,W∈Rh×1表示选择记忆权重向量,人类越临近的行为对未来行为影响作用越大,基于该人类行为的基本规律,对于选择记忆权重向量W中各个元素wk的取值原则为,k(定义当前步k=1)值越小,则相应的权重值wk越大。为降低运算复杂度,将W定义为One-hot向量,公式如下:
[0037]
[0038] 步骤(5)、预处理真实的原生用户打卡数据。
[0039] 原生用户打卡数据稀疏性较强,在不影响模型预测精度的情况下,为提升计算效率,将用户中打卡总数少于阈值θ1的用户剔除,将被打卡地点中打卡次数少于阈值θ2的地点剔除。根据用户打卡行为的统计规律,将每连续Γ时长内的打卡行为记录划分为一个时间窗口,考虑到打卡数据本身潜在的周期性与序列性,确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4,将用户时间窗口总数少于阈值θ3的用户剔除,将单个时间窗口内打卡次数小于阈值θ4的窗口剔除。
[0040] 步骤(6)、训练选择记忆的马尔可夫模型
[0041] 将预处理后的数据输入提出的选择记忆的马尔可夫模型M,模型训练的程序通过python语言编写。最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。
[0042] 本发明有益结果如下:
[0043] 1、随着5G技术的入市,基于位置的社交网络将迎来一轮迅猛的发展,因此对于高质量位置预测算法的需求会进一步提升。因此该专利中的算法的出现将为5G技术的推广普及奠定坚实的基础。
[0044] 2、选择记忆的马尔可夫模型保留了传统马尔可夫模型运算简单,速度快的优势的基础上,通过选择记忆单元大幅度提升了预测的精度,在速度远快于RNN预测模型的前提下,可以取的与一般RNN预测模型近似的预测精度。