[0074] 为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
[0075] 如图1所示,本发明实施例的基于马尔科夫链的无线体域网低时延传输调度方法,包括以下流程:初始化阶段,各节点获得网络的基本状态信息并得到节点间的配置参数;根据网络配置信息,计算出节点间的路由安全中断概率以及连接成功概率;根据安全中断概率和连接成功概率,建立离散马尔科夫链优化模型;利用拉格朗日乘子法将有约束的优化问题转化为无约束的优化问题;针对该无约束的优化模型,根据贝尔曼优化理论,采用改进的实时动态规划算法获得低时延的传输调度方法。
[0076] 具体地,本发明实施例的基于马尔科夫链的无线体域网低时延传输调度方法,包括以下步骤:
[0077] S1:初始化阶段,各节点获得网络的基本状态信息并得到节点间的配置参数;
[0078] S2:根据网络配置信息,利用无线体域网体内外信道的统计特性,推导出节点间的路由安全中断概率以及连接成功概率表达式;
[0079] S3:根据安全中断概率和连接成功概率,建立离散马尔科夫链优化模型;
[0080] S4:利用拉格朗日乘子法,将有约束的优化问题转化为无约束的优化问题;
[0081] S5:针对该无约束的优化模型,根据贝尔曼优化,理论采用改进的实时动态规划算法获得低时延的传输调度方法。
[0082] 其中,上述步骤S1中,在初始化阶段,节点获取节点之间的参数包括邻居节点的信息,通过HELLO包交互获取邻居节点的位置信息,节点通过邻居节点的位置信息可以计算得到与邻居节点之间的距离,以及交换彼此的操作权限信息。
[0083] 上述步骤S2中,推导出节点间的路由安全中断概率和连接成功概率的表达式如下:
[0084] 在无线体域网中,将体内信道(即主信道)建模为对数正态衰落信道,因此主信道的接收信噪比(SNR)服从对数正态分布;将体外信道(即窃听信道)建模为瑞利衰落信道,因此窃听信道的接收SNR服从指数分布。
[0085] 为了能够达到消息的完全保密,使得发送信号与无线体域网体外窃听者接收信号之间的互信息为零,应当满足以下条件如下,
[0086] C(n,z)≤ζ (1)
[0087] 其中,n和z分别代表发送节点和体外窃听者,ζ表示发送速率,C(·)表示链路的瞬时频谱效率其单位是bit/s/Hz。
[0088] 利用无线体域网中窃听信道的统计特性,推导出发送节点n的安全中断概率q(n)的表达式如下:
[0089]
[0090] 其中,P[·]为概率算子;C(·)表示链路的瞬时频谱效率,其单位是bit/s/Hz;n和z分别代表发送节点和体外窃听者;ζ表示发送速率;d为发送节点与体外窃听者之间的距离;α为路径损耗因子;ρ表示单位距离的发送信噪比;gO定义为窃听信道的信道增益,其服从均值为1的指数分布。
[0091] 为了确保消息的可靠传输,应满足以下条件,
[0092]
[0093] 其中,n和m分别代表发送节点和接收节点,表示保密速率。
[0094] 与此同时,利用无线体域网主信道的统计特性,获得从发送节点n到接收节点m的连接成功概率p(n,m)的表达式如下:
[0095]
[0096] 其中,n和m分别代表发送节点和接收节点,d为发送节点与接收节点之间的距离;ζ和 分别表示发送速率和保密速率,gI定义为从发送节点n到接收节点m的信道增益,服从对数正态分布,μ和σ分别表示对数正态分布的均值和标准差;erf(·)为误差函数,令[0097]
[0098]
[0099] 在传输之前合法节点不知道信道条件,定义 为整条路由的安全中断概率,形式如下:
[0100]
[0101] 其中, 表示从初始状态到吸收状态的动作序列,表示源节点, 表示第i次状态转移时,在已解码的节点集合 中选择的动作(即发送节点);在这一过程中,当且仅当保证每条链路的安全,才能使整条路由安全; 是当发送节点为 时的安全中断概率,即
[0102]
[0103] 上述步骤S3中,定义马尔科夫链状态如下:
[0104] 系统的状态x由 这两个因素决定, 表示为在x状态时之前阶段所有已经解码保密消息的节点集合;表示全部合法节点的集合;ω(x)表示为保密消息是否被窃听者所窃听,当在x状态下保密消息被窃听到,则ω(x)=1;否则为0。A(·)代表传输调度策略,即可作为下一跳发送机的节点。
[0105] 此时,离散马尔科夫链由状态x转移到状态y有以下四种情况:
[0106] 情况1:由 ω(x)=0的状态x,转移到ω(y)=0, 的状态y;
[0107] 情况2:由 ω(x)=0的状态x,转移到ω(y)=1, 的状态y;
[0108] 情况3:由 ω(x)=1的状态x,转移到ω(y)=1, 的状态y;
[0109] 情况4:由 的状态x,转移到 的状态x;
[0110] 其中,g表示目标节点。
[0111] 从状态x到另一状态y的转换是一个随机事件,具体取决于在x状态下的动作[0112] 在本发明中,πxy(a)表征在采取动作a 的前提下,从状态x转移到状态y的状态转移概率。
[0113] 对于满足上述四个状态转移情况的状态转移概率表达式如下:
[0114]
[0115] 其他不满足这四种状态转移情况的转移概率为零。
[0116] 其中,m代表从状态x转移到状态y过程中新增的已解码消息的节点,q(a)表示当发射节点为a时的安全中断概率,p(a,m)表示从发送节点a到接收节点m的连接成功概率。
[0117] 随后,基于所述马尔科夫链状态转移概率表达式,根据安全中断概率和连接成功概率表达式,建立优化模型,获得在满足安全中断概率约束的条件下最小化平均时延的多跳传输策略,其优化模型的形式如下:
[0118]
[0119]
[0120]
[0121]
[0122] 其中,目标函数定义为平均时延,i表示第i次状态转移, 表示在第i次状态转移后的已解码节点集合,E[·]为数学期望,c(·)表示状态转移过程中的代价;第一个约束条件为保密性约束, 表示整条路由的安全中断概率,平均安全中断概率的阈值为∈;第二个约束条件为时延约束,目标节点解码消息时的时延为0,否则时延为1;第三个约束为策略约束, 集合表示在没有安全中断概率约束的情况下的所有可能策略集。
[0123] 根据离散马尔科夫链模型中对于窃听的表述,在路由选择策略A(·)下,将无线体A(·)域网的安全中断概率H (x0)重新定义为如下形式:
[0124]
[0125] 其中,
[0126]
[0127] 在式(11)中,x0代表初始状态,xi代表第i次状态转移后的状态,δ(·)代表在马尔科夫链模型中安全中断的定义,ω(·)表示在某一状态下保密消息是否被窃听,若未被窃听其值为0,否则其值为1;
[0128] 根据新定义的安全中断概率的表达式,优化模型进一步转化为:
[0129]
[0130] 上述步骤S4中,利用拉格朗日乘子法将有约束的优化问题转化为无约束的优化问题:
[0131]
[0132] 其中,
[0133] 表示目标函数;
[0134] 表示安全中断概率约束,λ是拉格朗日乘子;
[0135] 对于给定的λ,将选取动作a时状态x转移到状态y的时延成本函数 重新定义为:
[0136]
[0137] 其中,c(·)表示原成本函数,δ(·)表示安全中断函数;
[0138] 相应的,在策略A(·)下给定λ的无约束目标函数 表达式如下:
[0139]
[0140] 上述步骤S5中,根据贝尔曼优化理论中的价值迭代,获得贝尔曼方程如下:
[0141]
[0142] 其中,γ∈[0,1)是贝尔曼方程中的折扣因子, 表示状态x的邻居状态集合y*代表邻居状态,A(·)表示最优的路由选择策略;
[0143] 最后,提出采用改进的实时动态规划方法来求解无线体域网时延最小的安全路由选择问题,步骤如下:
[0144] (1)随机产生一个无线体域网拓扑,计算出节点间的距离,根据式(2)和式(4)计算出安全中断概率和连接成功概率,并且初始化所有状态值的上限V;
[0145] (2)初始化S为初始状态,此时已解码节点只有源节点且保密消息未被窃听;
[0146] (3)根据贝尔曼方程,以概率1‑θ选取状态S的最佳动作a;概率θ随机选取状态S的动作集合A(S)中的其他动作;
[0147] (4)执行选取的动作,依据状态转移概率随机选择一个状态S',重做步骤(3),直到S'为吸收状态,转步骤(5)。
[0148] (5)根据贝尔曼方程,回溯更新从初始状态到吸收状态转移过程中每一状态值V;
[0149] (6)重复步骤(2)至(5),直到初始状态值V(S0)与上一次探索试验的差小于阈值τ,则停止运行,并且返回最佳调度策略。
[0150] 本发明的基于马尔科夫链的无线体域网低时延传输调度方法,适用于无线体域网。在该网络中具有L个合法节点,合法节点集合用 表示。合法节点之间能够共享和转发消息。同时存在一个窃听者会窃听保密消息。所有的节点都工作在半双工的模式下,并且以相同地发送信噪比对保密消息进行传输。在此考虑多跳通信,在每一跳中所有的合法节点都尝试对保密消息解码。当目标节点解码消息时,则停止传输过程。在初始化阶段,节点获取节点之间的参数包括邻居节点的信息,通过HELLO包交互获取邻居节点的位置信息,节点通过邻居节点的位置信息可以计算得到与邻居节点之间的距离,以及交换彼此的操作权限信息。
[0151] 在无线体域网中,将体内信道(即主信道)建模为对数正态衰落信道,因此主信道的接收信噪比(SNR)服从对数正态分布;将体外信道(即窃听信道)建模为瑞利衰落信道,因此窃听信道的SNR服从指数分布。
[0152] 基于无线体域网的信道特点,在节点之间交换信息可获得相邻节点之间的距离后,根据式(2)和(4)可以计算出任意发射节点发送消息后,链路的安全中断概率和连接成功概率。在式(4)中,从合法发送节点到接收节点之间的信道接收信噪比服从均值为3.38且标准差为2.8的对数正态分布。
[0153] 随后,可以根据式(9)马尔科夫链的状态转移概率,可以获得在x状态下,选择a作为发送节点时,转移到邻居状态y的状态转移概率。然后,根据新的安全中断概率的定义式(12),优化模型重写如下:
[0154]
[0155] 在本发明中,目标是获得时延最小的安全路由。在此,时延由跳数来表征,经过一跳则时延为1。
[0156] 为了简化求解所述的优化模型,运用拉格朗日乘子法将有约束的优化问题转化为无约束的优化问题。对于给定的拉格朗日乘子λ,将时延成本函数重新定义为[0157]
[0158] 相应的给定λ的无约束目标函数表达式如下,
[0159]
[0160] 随后,根据贝尔曼优化理论中的价值迭代,获得贝尔曼方程如下:
[0161]
[0162] 其中,γ∈[0,1)是贝尔曼方程中的折扣因子,其值越大则表明策略更加注重长远利益。 表示状态x的邻居状态集合。
[0163] 最后,提出采用改进的实时动态规划方法来求解无线体域网时延最小的安全路由选择问题,步骤如下:
[0164] 1)随机产生一个无线体域网拓扑,计算出节点间的距离,根据式(2)和式(4)计算出安全中断概率和连接成功概率,并且初始化所有状态值的上限V;
[0165] 2)初始化S为初始状态,此时已解码节点只有源节点且保密消息未被窃听;
[0166] 3)根据贝尔曼方程式(21),贪婪地选择动作(根据式(21)对于可选择的动作集合D(x)中遍历所有的动作,选取代价最小的作为最佳的动作,因此是贪婪的选择动作。),计算选择不同动作的状态值变化,并且选取使状态值最小的动作确定为最佳动作,然后以概率1‑θ选取状态S的最佳动作a;概率θ随机选取状态S的动作集合A(S)中的其他动作;
[0167] 4)执行选取的动作,在该状态的邻居状态中,依据状态转移概率随机选择一个状态S'作为下一状态,重做3),直到S'为吸收状态,转步骤5)。
[0168] 5)根据贝尔曼方程,回溯更新从初始状态到吸收状态转移过程中每一状态值V;
[0169] 6)重复步骤2)至5),直到初始状态值V(S0)与上一次探索试验的差小于阈值τ,则停止运行,并且返回最佳调度策略。
[0170] 如图2所示,存在一个体外窃听者的无线体域网示意图。右脚脚踝处是一个中心节点用于收集数据信息,并且对信息进行简单处理后转发到互联网。其他五个节点为传感器节点,用于收集信息,发送给中心节点。体外存在一个窃听者,窃听合法节点之间共享的消息。在本发明中,以头部的传感器节点作为源节点,右脚脚踝处的中心节点作为目标节点,寻找保密消息从源节点发送到目标节点的最小时延路由。图4是一个100×100的仿真区域,(0,0)处的1是源节点,(100,100)处的6是目标节点,*点为窃听者,其他节点都是合法的传感器节点。在仿真中,设置路径损耗指数α=3.5,单位发送信噪比ρ=10dB,安全中断概率阈‑2值∈=10 。
[0171] 由于消息在传输过程中,状态转移是随机的,图3是就是某一状态转移过程。在图中的集合中,第一位的0或者1用于表示在该状态下消息是否被窃听,随后的数字表示在该状态下已经解码消息的节点编号。其中S0={0,1}为初始状态,已解码消息的节点只有源节点(节点1)且此状态下消息未被窃听者窃听。初始状态选择源节点1为发送节点,下一随机状态为S1={0,1,3},该状态未被窃听且已经解码保密消息的节点有1和3。依据贝尔曼方程此状态下最佳的发送节点为节点3。随后,下一状态为S2={0,1,3,5},此状态的最佳发送节点为5。最后转移到吸收状态S3={1,1,3,4,5,2,6},此时目标节点(节点6)已经解码消息,且此状态下消息已经被窃听者窃听。图4是在图3的状态转移过程中最佳策略下的路由1→3→5→6。
[0172] 以上对本发明的主要特征和具体实施例进行了具体且详细的描述,但是本发明不受上述实施例的限制,这也只是一种可行的实施方式。本领域的科研人员可以根据本发明的思想,对实施例进行改进或者变型,这些变型和改进都落入要求保护的本发明范围内。