[0062] 下面对照附图,通过对实施例的描述,对本发明的具体实施方式作进一步详细的说明,以帮助本领域的技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。
[0063] 构建基于通道网络的动态演化博弈模型,需要考虑博弈分析的三个基本要素:参与者、策略空间和收益矩阵。
[0064] 博弈的参与者分别由两类不同的节点集合构成:一类是由I型节点构成的节点集合,可通过转发一笔交易来获得收益;另一类是由II型节点构成的节点集合,可通过发动攻击或转发交易来获得收益。
[0065] 对于I型节点来说,有合作、不合作和防御三种策略,I型节点的策略空间记为:
[0066] S1∈{1,2,3} (1)
[0067] 其中,1表示I型节点采取合作策略,采用合作策略的节点将同意进行交易转发;2表示采取不合作策略,采用不合作策略的节点将拒绝进行交易转发;3表示采取防御策略;采用防御策略的节点将防御II型节点实施的恶意不合作和攻击。
[0068] 对于II型节点来说,有合作、攻击和不合作三种策略,II型节点I型节点的策略空间记为:
[0069] S2∈{1,2,3} (2)
[0070] 其中,1表示II型节点采取合作策略,采用合作策略的节点将同意进行交易转发;2表示采取攻击策略,采用攻击策略的节点将对I型节点实施恶意不合作和攻击行为并以此来获利;3表示采取不合作策略。采用不合作策略的节点将拒绝进行交易转发。
[0071] 根据通道网络的特点,对I型节点和II型节点双方的收益参数进行如下定义:R(Reward):表示双方在一次博弈中所获得的收益,可以是节点成功转发一次交易所获得的收益;CD(Cost of defense):表示I型节点采取防御策略所需的成本,可以是资金的消耗;RA(Reward of attack):表示II型节点成功进行一次攻击活动所获得的收益,可以是获得资金的收益,假定R>RA;CA(Cost of attack):表示II型节点进行攻击活动所需的成本,可以是攻击时消耗的资金以及被发现时受到相关法律制裁等;CR(Cost of relay):表示节点进行一次交易所需的成本,可以是资金的消耗;L(Loss):表示I型节点在受到攻击时的损失;P(Probability):表示I型节点采取防御策略的情况下,攻击方攻击成功的成功率;在I型节点和II型节点双方的收益参数中,R>CD>CA,R>CR>CA。
[0072] 演化博弈的前提是博弈中的每个参与者在决策阶段是有限理性的,即参与者是为了追求收益最大化而进行策略选择。有限理性的博弈参与者的自私或利他行可使得博弈双方群体的利益达到最大化。即一个参与者群体或不同参与者群体之间如果只有自私行为或只有利他行为都不是收益最大化的最优策略,只有在某些方面自私而在某些方面利他也就是自私行为和利他行为达到一定比例的时候才能达到群体利益的最大化,也称最优策略。因此本专利的前提假设是要求每个节点在给定各自策略空间中,以期望收益最大化为目的进行策略选择。博弈双方节点在不知道彼此策略的情况下,按II型节点策略,博弈双方的收益分析分为以下三大类情况。
[0073] ①当II型节点采取合作策略时,I型节点采用合作、不合作、防御策略时,I型节点和II型节点之间的博弈组合策略包括:(合作,合作)、(不合作,合作)和(防御,合作)三种情况。博弈双方的收益分析如表4.1所示。
[0074] 表4.1II型节点采取合作策略时博弈双方的收益分析
[0075]
[0076] (合作,合作):双方同意进行交易,各方收益均为博弈所获得收益或节点成功转发一次交易的收益R减去转发一次交易所需的成本CR。因此I型节点最终收益为R‑CR,II型节点最终收益为R‑CR;(不合作,合作):I型节点不合作,I型节点既无损失也无收益,最终收益为0。II型节点由于I型节点不与之合作转发交易而不能顺利完成转发操作,因此没有转发成功的收益,只有进行一次交易所消耗的资金CR。II型节点最终收益记为‑CR;(防御,合作):I型节点因采取防御措施而进行交易,双方达成合作。各方收益均为博弈所获得收益或转发成功的收益R,只是消耗的资金成本不同。I型节点因部署防御措施消耗成本CD,I型节点最终收益记为R‑CD。II型节点因进行一次交易消耗资金CR。II型节点最终收益记为R‑CR。
[0077] II型节点采取合作策略,而I型节点分别采用合作、不合作和防御策略时,I型节点收益分别是R‑CR、0和R‑CD;II型节点收益为R‑CR、‑CR、R‑CR。因为假定R>CD>CA,R>CR>CA,所以R‑CR>0,R‑CD>0,使得双方的最大收益均大于0,符合收益最大化要求。
[0078] ②当II型节点采取攻击策略时,博弈双方的收益分析如表4.2所示。
[0079] 表4.2II型节点采取攻击策略时博弈双方的收益分析
[0080]
[0081] (合作,攻击):I型节点由于选择合作策略被II型节点成功攻击而不能顺利完成交易转发操作。I型节点没有成功转发的收益,只有受到攻击时的亏损L,其最终收益为‑L。II型节点由于攻击成功,则获得收益RA,此外转发交易需要一定的成本CR,因此最终收益为RA‑CR。
[0082] (不合作,攻击):I型节点由于不合作被II型节点成功攻击而不能顺利完成交易转发操作。I型节点没有转发成功的收益,只有受到攻击时的亏损L,其最终收益为‑L。II型节点的攻击对于不合作的I型节点来说并不成功,不能获得攻击成功的收益RA,且攻击活动需要一定的成本CA,因此II型节点I型节点最终收益为‑CA。
[0083] (防御,攻击):I型节点由于采取防御策略,使得II型节点只有P的成功率攻击成功。在攻击成功的情况下,I型节点获得转发成功的收益R,但部署防御措施需要防御成本CD且I型节点在II型节点攻击成功时有损失L,则I型节点在攻击成功率为P的情况下,损失资金为P×L,因此其最终收益为R‑CD‑P×L。II型节点的攻击对采取防御策略的I型节点不成功,不能获得攻击成功的收益RA,且攻击活动需要一定的成本CA,因此II型节点最终收益为‑CA。
[0084] II型节点采取攻击策略,而I型节点分别采用合作、不合作和防御策略时,I型节点收益分别是‑L、‑L和R‑CD‑P×L。按照收益最大化要求,且使得I型节点采取防御策略是有效,要求R‑CD‑P×L≥0,即:
[0085] R≥CD+P×L (3)
[0086] ③当II型节点采取不合作策略时,博弈双方的收益分析如表4.3所示。
[0087] 表4.3II型节点采取不合作策略时博弈双方的收益分析
[0088]
[0089] (合作,不合作):I型节点由于II型节点不与之合作转发而不能顺利完成转发操作。I型节点没有转发成功的收益,只有进行一次交易所消耗的资金CR,因此其最终收益为‑CR。II型节点由于不合作,既无损失也无收益,因此II型节点最终收益为0;(不合作,不合作):双方不同意进行交易转发,双方收益均为0;(防御,不合作):I型节点虽采取防御策略,但II型节点由于不合作,I型节点没有成功转发的收益,只有部署防御措施所需的成本CD,因此其最终收益为‑CD。II型节点由于不合作,既无损失也无收益,因此II型节点最终收益为0。
[0090] II型节点采取不合作策略,而I型节点分别采用合作、不合作和防御策略时,I型节点收益分别是‑CR、0、‑CD;II型节点收益为0、0和0。表4.3的最大收益为0。
[0091] 由表4.1~表4.3可知,由于I型节点和II型节点的策略空间均为三个,为了平衡I型节点和II型节点之间的利益关系,因此为博弈双方各自构建一个3×3的收益矩阵,I型节点收益矩阵记为A=[aij]3×3,II型节点收益矩阵记为B=[bij]3×3,其中i∈{1,2,3},j∈{1,2,3},aij表示采取i策略的I型节点在与采取j策略的II型节点进行博弈时I型节点所获得的收益,bij表示采取i策略的I型节点在与采取j策略的II型节点进行博弈时II型节点所获得的收益。
[0092] 根据博弈双方收益分析表4.1,表4.2和表4.3,将I型节点和II型节点的收益矩阵分别记为A和B,可分别得出:
[0093]
[0094]
[0095] 在通道网络中,应该找到保持所有节点处于一个动态均衡状态的条件;否则,如果网络不稳定将会影响网络正常运行和安全。因此,通道网络动态演化博弈模型的创建目标是找到保持动态稳定均衡的条件。
[0096] 演化稳定策略(Evolutionary stable strategy简称ESS)和复制动态是演化博弈论最核心的概念,ESS表明演化博弈的稳定状态,复制动态表明达到这个稳定状态的收敛过程。ESS仅是一个局部的稳定策略,在随机环境中不能构成判断演化稳定的充分条件。为了更好地描述动态的演化过程,把演化博弈理论中的静态概念与动态过程统一起来,本申请利用演化均衡(Evolutionary Equilibrium)的概念,把演化博弈理论中的静态概念与动态过程统一起来。复制动态方程可以保证ESS为演化均衡。复制动态方程的一般形式如下:
[0097]
[0098] 式(6)中,PE为该策略的期望收益,PA为该策略所对应的策略空间中总体的平均收益。zk为节点所选策略k的比例:
[0099] zk=Nk/M (7)
[0100] 式(7)中,Nk为策略空间中选择策略k的节点数量,M为该策略空间中总节点数量。0≤Nk≤M。Nk=0时,表示没有节点选择策略k。Nk=M时,表示所有节点都选择策略k。
[0101] 通道网络中I型节点和II型节点分别有各自的策略空间。记Ni为I型节点的策略空间中选择策略i的节点数量且i∈{1,2,3}, 为I型节点策略空间中总节点数量,且 记I型节点采取合作、不合作以及防御策略的比例分别为x1,x2, x3:
[0102]
[0103] 式(8)中,可知 记I型节点在某一时刻策略的比例分布集合为X:
[0104] X={xi|i∈{1,2,3}} (9)
[0105] 记Nj为II型节点的策略空间中选择策略j的节点数量且j∈{1,2,3}, 为II型节点策略空间中总节点数量, 且 记II型节点采取合作、攻击以及不合作策略的比例分别为y1,y2,y3:
[0106]
[0107] 式(10)中,可知0≤yj≤1且 记II型节点在某一时刻策略的比例分布集合为Y:
[0108] Y={yj|j∈{1,2,3}} (11)
[0109] 根据演化博弈的复制动态理论,可以得到I型节点和II型节点各自复制动态方程如下:I型节点选择策略i的期望收益由式(4)、(9)、(10)可得:
[0110]
[0111] aij为I型节点收益矩阵A的矩阵元素,I型节点的平均收益由式(8)、(9)、(12)可得:
[0112]
[0113] I型节点的复制动态方程为:
[0114]
[0115] 将式(12)、(13)代入式(14)可得复制动态方程的具体形式如式(15)所示:
[0116]
[0117] (2)II型节点复制动态方程
[0118] II型节点选择策略j的期望收益由式(5)、(8)、(11)可得:
[0119]
[0120] bij为II型节点收益矩阵B的矩阵元素,II型节点的平均收益由式(10)、(11)、(16)可得:
[0121]
[0122] II型节点的复制动态方程如式(18)所示:
[0123]
[0124] 将式(16)、(17)代入式(18)可得:
[0125]
[0126] 由式(15)和式(19),分别计算出x1,x2,x3,y1,y2,y3的复制动态方程。
[0127] 以 表示I型节点采用策略i时参与者比例随时间的变化率,其中i∈S1。由式(4)收益矩阵和式(15)分别计算出x1,x2,x3其复制动态方程为:
[0128]
[0129]
[0130]
[0131] 以 表示II型节点采用策略j时参与者比例随时间的变化率,其中j∈S2。由式(5)收益矩阵和式(19)分别计算出y1,y2,y3其复制动态方程为:
[0132]
[0133]
[0134]
[0135] 复制动态方程可以保证具有局部动态稳定性的ESS表现出均衡与动态的选择过程之间的关系和收敛过程。但由于复制动态是非线性的,很难求出唯一的解。因此,演化博弈就从对均衡的求解转向对均衡稳定性的分析,而稳定性对于延长网络的生命周期至关重要。
[0136] 根据演化博弈理论,由式(20)~(25)构成I型节点和II型节点的通道网络复制动态系统,因此,在I型节点和II型节点通道网络复制动态系统的解曲线上任意一点(X,Y)都对应着演化博弈的一个混合策略((x1,x2,x3),(y1,y2,y3))。对于动态演化博弈模型,可由式(20)~(25)计算可能的均衡点,((x1,x2,x3),(y1,y2,y3))取值如表5.1所示:
[0137] 表5.1动态演化博弈模型均衡点
[0138]
[0139] 证明在CD>CR条件下,均衡点((1,0,0),(1,0,0))是唯一的ESS,表示在该点所有I型节点和II型节点均愿意选择合作策略,如定理1所示,。定理1:均衡点((1,0,0),(1,0,0))是通道网络复制动态系统式(20)~(25)唯一的ESS的充要条件是CD>CR。
[0140] (1)存在性证明
[0141] 欲使点((1,0,0),(1,0,0))是通道系统式(20)~(25)的ESS的充要条件为Trace J<0且Det J>0[27]。其中矩阵J是演化博弈的雅可比矩阵(Jacobian Matrix),Trace J定义为矩阵J主对角线上元素的和,Det J定义为矩阵J的行列式。雅可比矩阵记为
[0142]
[0143] 由式(20)~(25)代入式(26),可得到通道系统相对应的雅可比矩阵。将点((1,0,0),(1,0,0))代入系统雅可比矩阵J,可得:
[0144] 矩阵J的迹为:Trace J=5CR‑CD‑5R+RA,
[0145] 矩阵J的行列式为:Det J=(CR‑R)4(R‑RA)(CD‑CR),
[0146] ∵R>RA,
[0147] 若CD>CR,
[0148] ∴Trace J=5CR‑CD‑5R+RA
[0149] <5CR‑CR‑5R+RA
[0150] =4CR‑5R+RA
[0151] <4CR‑5R+R
[0152] =4(CR‑R)<0,
[0153] ∵R>RA,
[0154] 若CD>CR,
[0155] ∴Det J>0,
[0156] 注意:当CD=CR时,Det J=0,不满足ESS的充要条件中的Det J>0的要求。故CD≠CR。
[0157] 因此,当CD>CR时,点((1,0,0),(1,0,0))是通道网络复制动态系统的一个ESS。
[0158] (2)唯一性证明
[0159] 由式(20)~(25)计算可能的均衡点如表5.1所示共9个。要证明点((1,0,0),(1,0,0))的唯一性,根据逆向思维,只要证明除点((1,0,0),(1,0,0))外,其他8个点不是ESS,即可说明点((1,0,0),(1,0,0))的唯一性。
[0160] ∵当CD>CR时,
[0161] 1)对于点((1,0,0),(0,1,0)),((1,0,0),(0,0,1)),((0,1,0),(1,0,0)),((0,1,0),((0,1,0)),((0,1,0),(0,0,1)),((0,0,1),(0,0,1)),Det J=0,不满足ESS的充要条件即Trace J<0且Det J>0,
[0162] ∴以上6个均衡点不是ESS;
[0163] 2)对于点((0,0,1),(1,0,0)),
[0164] Trace J=3CD+2CR‑CA‑5R,
[0165] Det J=(CR‑R)2(CR‑R)2(R‑CR+CA)(CR‑CD),其中,
[0166] ∵R>CR,CD>CR,
[0167] ∴R‑CR+CA>0,CR‑CD<0,则Det J<0,不满足ESS的充要条件即Trace J<0且Det J>0,[0168] ∴点((0,0,1),(1,0,0))不是ESS;
[0169] 3)对于点((0,0,1),(0,1,0)),
[0170] Trace J=3CD‑CR+3CA‑2L‑2R+3P×L,
[0171] Det J=CA2(CD–L–R+P×L)2(CD+P×L‑R)(R‑CR+CA),其中,
[0172] ∵R≥CD+P×L见式(3),且R>CR,
[0173] ∴CD+P×L–R<0,R‑CR+CA>0,则Det J≤0,不满足ESS的充要条件即Trace J<0且Det J>0,
[0174] ∴点((0,0,1,0,1,0))不是ESS;
[0175] 因此,当CD>CR时,点((1,0,0),(1,0,0))是通道网络复制动态系统唯一的ESS。
[0176] 以上存在性和唯一性的证明,证明了点((1,0,0),(1,0,0))是通道网络复制动态系统式(20)~(25)唯一的ESS的充要条件是CD>CR。要使得CD>CR,那么就意味着要降低节点执行一次交易所需成本,或者提高I型节点部署防御策略所需要的成本,使得执行一次交易所需成本大于I型节点部署防御策略的成本。这样I型节点就能根据不同防御策略的防御成本,合理地选择部署防御策略与否,这样可以有效地降低开销,使得自身在整个通道网络中的生命周期更长。
[0177] 证明在CD
[0178] 定理2:((0,0,1),(1,0,0))是通道网络复制动态系统唯一的ESS的充要条件是CD
[0179] (1)存在性证明
[0180] 点((0,0,1),(1,0,0))是通道系统ESS的充要条件为Trace J<0且Det J>0。由式(20)~(25)代入式(26)可得到通道系统相对应的雅可比矩阵。将点((0,0,1),(1,0,0))代入系统雅可比矩阵J,可得:
[0181] 矩阵J的迹为:Trace J=3CD+2CR‑CA‑5R,
[0182] 矩阵J的行列式为:Det J=(CD‑R)2(CR‑R)2(CR‑CD)(R‑CR+CA),
[0183] ∵R>RA,R>CR,
[0184] 若CD
[0185] ∴Trace J=3CD+2CR‑CA‑5R
[0186] <3CR+2CR‑CA‑5R
[0187] =5CR‑5R‑CA
[0188] =5(CR‑R)‑CA
[0189] <0,
[0190] 又∵R>CR,CA>0,∴R‑CR+CA>0,Det J>0,
[0191] 注意:当CD=CR时,Det J=0,不满足ESS的充要条件中的Det J>0的要求。故CD≠CR。
[0192] 因此,当CD
[0193] (2)唯一性证明
[0194] 由式(20)~(25)计算可能的均衡点如表5.1所示共9个。要证明点((0,0,1),(1,0,0))的唯一性,根据逆向思维,只要证明除点((0,0,1),(1,0,0))外,其他8个点不是ESS,即可说明点((0,0,1),(1,0,0))的唯一性。
[0195] ∵当CD
[0196] 1)对于点((1,0,0),(0,1,0)),((1,0,0),(0,0,1)),((0,1,0),(1,0,0)),((0,1,0),(0,1,0)),((0,1,0),(0,0,1)),((0,0,1),(0,0,1)),Det J=0,不满足ESS的充要条件即Trace J<0且Det J>0,
[0197] ∴以上6个均衡点不是ESS;
[0198] 2)对于点((1,0,0),(1,0,0)),
[0199] Trace J=5CR‑CD‑5R+RA,
[0200] Det J=(CR‑R)4(R‑RA)(CD‑CR),其中,
[0201] ∵R>CA,CD>CR,
[0202] ∴Det J<0,不满足ESS的充要条件即Trace J<0且Det J>0,
[0203] ∴点((1,0,0),(1,0,0))不是ESS;
[0204] 3)对于点((0,0,1),(0,1,0)),
[0205] Trace J=3CD‑CR+3CA‑2L‑2R+3P×L,
[0206] Det J=CA2(CD–L–R+P×L)2(CD+P×L‑R)(R‑CR+CA),其中,
[0207] ∵R≥CD+P×L见式(3),且R>CR,
[0208] ∴CD+P×L–R<0,R‑CR+CA>0,则Det J≤0,不满足ESS的充要条件即Trace J<0且Det J>0,
[0209] ∴点((0,0,1),(0,1,0))不是ESS;
[0210] 因此,当CD
[0211] 以上存在性和唯一性的证明,证明了点((0,0,1),(1,0,0))是通道网络复制动态系统式(20)~(25)唯一的ESS的充要条件是CD
[0212] 根据定理1和定理2,当I型节点部署防御策略所需要的成本大于节点进行一次转发交易所需成本时,演化博弈结束后,通道网络中所有I型节点都会采取合作策略且所有II型节点都会采取合作策略。然而,当I型节点部署防御策略所需要的成本小于节点进行一次转发交易所需成本时,演化博弈结束后,通道网络中所有I型节点都会采取防御策略且所有II型节点都会采取合作策略。
[0213] 当前的区块链通道交易过程中,需要交易双方节点的合作,如果一方节点不愿意协作将导致通道关闭,导致双方节点要切换到区块链上实现交易操作且花费较长时间来完成交易验证。因此在通道网络中进行交易时,需要保证通道网络的稳态以保证交易顺利完成。基于有限理性和生物进化过程的“复制动态”机制,将通道网络中节点交易建模为动态演化博弈模型,该模型设计一种基于演化博弈的通道网络动态防御机制,该机制在I型节点的策略空间上增加一个防御策略,并考虑在部署防御策略的情况下II型节点攻击的成本与成功率,该防御机制可帮助I型节点以一定的概率抵抗II型节点的攻击行为。该模型的节点具有有限理性的进化学习能力,能够根据攻击者的不同攻击策略,动态调整各自策略来达到有效防御。
[0214] 因在真实场景下节点不协作行为的随机性,为了验证申请的通道网络在真实场景下的性能优势,开发一个仿真框架模拟闪电网络和具有攻防策略的动态演化博弈通道网络,结果表明具有动态防御机制的通道网络具有较好的交易传输成功率和较低的时延,仿真过程具体如下:
[0215] (1)实验环境:1)电脑配置:Windows8六十四位操作系统,包括Intel Core i5处理器、CPU2.80GHz和8G内存;2)环境配置:采用MTLAB2018b工具来进行仿真动态演化博弈模型的博弈过程与结果。
[0216] (2)实验参数:由于节点交易收益以及成本等参数的衡量标准不同,因此将所有研究参数进行标准化处理,取值都在[0,1]内。具体实验参数设计如表6.1所示:
[0217] 表6.1实验参数表
[0218]
[0219] 表6.1中,为测试不同防御成本对系统达到ESS速度的影响,当CD>CR时,根据式(3)R≥CD+P×L,CD取值分别为0.42,0.44和0.46以测试不同防御成本对系统达到ESS速度的影响,其他情况下CD取值为0.46。当CD6.1中,R、RA、CR、CA的取值满足R>RA,R>CD>CA,R>CR>CA的要求。
[0220] 演化博弈中的节点是有限理性的,在受到攻击后的损失与成功进行博弈并完成交易收益相同,因此取L=1;为了测试II型节点的不同攻击成功率对系统达到ESS速度的影响,在满足式(3)R≥CD+P×L的条件下,取值分别为0.1,0.2和0.4,其他情况下取值为0.5。
[0221] (3)其他参数说明
[0222] 1)仿真时间(Time(s))
[0223] 演化博弈达到演化均衡所需的仿真时间,即通道网络复制动态系统收敛于ESS点所需的时间。
[0224] 2)节点所选策略的比例(Node ratio(%))
[0225] 在I型节点和II型节点通道网络复制动态系统的解曲线上,仿真点(X,Y)所对应着演化博弈的一个组合策略((x1,x2,x3),(y1,y2,y3)),即I型节点和II型节点所采取策略的比例分布情况。计算见式(8)和式(10)。在演化博弈初始状态,按照表6.2中7个不同的组合策略,I型节点和II型节点选择各自策略来进行博弈实验。具体组合策略的设置如表6.2所示:
[0226] 表6.2节点所选策略的比例参数表
[0227]
[0228]
[0229] (4)性能分析指标
[0230] 1)稳定性:I型节点与II型节点均衡的稳定性取决于二者在演化博弈中策略选择的收益大小比较,在达到ESS时的两方总体中个体仍然会不断地变化,即内部不断变化而总体不变的过程。
[0231] 2)收敛性:系统是否能达到ESS以及达到ESS所需的时间长短,用Time(s)表示。即所需时间越短,收敛性越好。
[0232] 在复制动态下,达到ESS即为演化均衡,而达到演化均衡时通道网络中节点和通道仍然会在不断地变化。为研究通道网络内部的不断变化对整个通道网络的影响过程和影响结果,根据式(20)~(25)建立仿真模型。根据不同的实验目的,给定一个组合策略(X,Y)=((x1,x2,x3),(y1,y2,y3))的初始值,将x1,x2,x3,y1,y2,y3代入式(20)~(25)建模成的复制动态系统表达式,博弈过程反映在仿真图像上为x1,x2,x3,y1,y2,y3各自对应的节点所选策略的比例Node ratio(%),即图像纵坐标。根据策略比例的变化,观察博弈过程,分析通道网络动态演化博弈模型的稳定性。当CD>CR时,模型的动态演化模型的博弈结果是(合作,合作)组合策略。
[0233] I型节点初始状态采取防御策略与否的系统演化稳定性分析具体如下:
[0234] (1)CD取0.46。当选择策略1进行演化博弈时,通道网络博弈过程见图2,图2为CD>CR且I型节点都没有采取防御策略时,模型演化稳定状态分析图;图2可知,当通道网络中的I型节点都没有采取防御策略时,II型节点为了使自身利益最大化而选择攻击策略,I型节点则一直选择合作策略,经过几次博弈后,II型节点经过演化学习进而也选择了合作策略以减少自身损失,网络最终收敛到双方都合作的稳定状态。
[0235] (2)CD取0.46。当选择策略2进行演化博弈时,通道网络博弈过程见图3,图3为CD>CR且I型节点部分采取防御策略时,系统演化稳定状态分析图,由图3可知,当通道网络中有部分I型节点采取防御措施时,I型节点采取防御策略,II型节点经过一段时间的演化学习,观察到I型节点采取了防御策略,为了使自身利益最大化而选择合作策略。I型节点经过一段时间的演化学习,发现II型节点都采取合作策略后,也为了自身利益最大化放弃防御策略转而选择合作策略,网络最终收敛到双方都合作的稳定状态。说明在CD>CR时,I型节点采取防御措施与否对网络复制动态系统的博弈演化策略没有影响。
[0236] 初始比例对系统收敛性的影响的探索具体如下:
[0237] 为研究I型节点与II型节点分别都部署合作策略的初始比例对系统收敛性的影响,由理论1和6.2.1节通道网络复制动态系统的稳定性分析得知,组合策略(合作,合作)是系统的ESS。在此基础上进一步考虑,对于通道网络节点选择合作策略的不同初始比例,博弈双方是否仍能维持稳定状态以及对于模型收敛性的影响。CD取0.46,图4(a)为采用策略3时初始比例对系统收敛性的影响图,图4(b)为采用策略4时初始比例对系统收敛性的影响图,图4(c)为采用策略5时初始比例对系统收敛性的影响图,由图4(a)和图4(b)可知,当I型节点采取合作策略的初始比例越高时,模型收敛性就越快;由图4(b)和图4(c)可知,当II型节点采取合作策略的初始比例越高时,模型收敛性收敛性就越快。
[0238] 成本对系统收敛性的影响的探索具体如下:
[0239] 为研究I型节点部署防御策略的成本对系统收敛性的影响,现根据ESS稳定性分析改变I型节点部署防御策略的成本CD参数的值进行仿真分析。当CD>CR时,系统的ESS是组合策略组合策略(合作,合作),为简化仿真图形,在仿真图形中只显示I型节点采取合作策略和II型节点采取合作策略的演化过程。在演化博弈过程中,当采用策略2、CD>CR、1/3的I型节点部署防御策略的成本分别为0.42、0.44和0.46时,成本对系统达到ESS速度的影响如图5所示,由图5可知,当CD>CR时,在三种不同防御成本博弈情况下,节点部署防御策略的成本对系统收敛性有明显影响。随着防御成本增加,I型节点达到稳定合作状态的速度增加,II型节点达到稳定合作状态的速度不变,且系统整体达到ESS的速度增加,即系统收敛性提高。在博弈过程中,部分I型节点采取防御策略,II型节点观察到I型节点采取防御策略,为使自身利益最大化而采取合作策略;而此刻I型节点观察到II型节点采取合作策略,为使自身利益最大化则放弃防御策略转而采取合作策略。经过演化博弈,系统最终会收敛到一个ESS的稳定状态。在该状态下,I型节点和II型节点均采取合作策略,并均能获得最大化的收益,无论是一个节点还是多个节点都没有动机偏离最大化的收益。因此I型节点部署防御策略的成本越高,系统达到ESS的速度越快,即系统收敛性越好。
[0240] 攻击成功率对系统收敛性的影响的探索具体如下:
[0241] 为研究II型节点不同的攻击成功率对系统收敛性的影响,现根据ESS稳定性分析改变II型节点攻击成功率P参数的值来进行仿真分析。CD取0.46。在演化博弈过程中,当采用策略2、CD>CR、1/3的II型节点攻击的成功率分别为0.1、0.2和0.4时,攻击成功率对系统收敛性的影响如图6所示,由图6可知,当CD>CR时,在三种不同攻击成功率博弈情况下,II型节点攻击成功率对系统收敛性有影响。随着攻击成功率的增加,I型节点达到稳定合作状态的速度增加,II型节点达到稳定合作状态的速度不变,且系统整体达到ESS的速度增加,即系统收敛性提高。博弈过程的分析同6.2.3节,最终,I型节点为使自身利益最大化会放弃防御策略转而采取合作策略。在防御成本大于交易成本的情况下,攻击成功率越高,系统达到ESS的速度越快,即系统收敛性越好。
[0242] 基于式(20)~(25)建模成的复制动态系统,根据不同的实验目的,给定一个混合策略(X,Y)=((x1,x2,x3),(y1,y2,y3))的初始值,将x1,x2,x3,y1,y2,y3代入复制动态系统表达式,博弈过程反映在仿真图像上为x1,x2,x3,y1,y2,y3各自对应的节点所选策略的比例Node ratio(%),即图像纵坐标。根据策略比例的变化,观察博弈过程,分析通道网络动态演化博弈模型的稳定性。当CD
[0243] I型节点初始状态采取防御策略与否的系统演化稳定性分析
[0244] (1)CD取0.3。当选择策略1进行演化博弈时,通道网络博弈过程见图7,图7为CD
[0245] (2)CD取0.3。当选择策略2进行演化博弈时,通道网络博弈过程见图8,图8为CD
CR还是CD[0246] 策略的初始比例对系统收敛性的影响的探究具体如下:
[0247] 为研究I型节点与II型节点分别部署防御策略和合作策略的初始比例对系统收敛性的影响,由理论2和节通道网络复制动态系统的稳定性分析得知,组合策略(防御,合作)是模型的ESS。在此基础上进一步考虑,对于通道网络I型节点选择防御策略以及II型节点选择合作策略的不同初始比例,博弈双方是否仍能维持稳定状态以及对于模型达到ESS速度的影响。CD取0.3。图9(a)为采用策略3时初始比例对模型收敛性的影响,图9(b)为采用策略6时初始比例对模型收敛性的影响,图9(c)为采用策略7时初始比例对模型收敛性的影响,由图9(a)和9(b)可知,当I型节点采取防御策略的初始比例越高时,系统收敛性就越快;由图9(b)和图9(c)可知,当II型节点采取合作策略的初始比例越高时,系统收敛性就越快。 基于上述分析可知,无论是CD>CR还是CD
[0248] 成本对系统收敛性影响的探究具体如下:
[0249] 为研究I型节点部署防御策略的成本对系统收敛性的影响,现根据ESS稳定性分析改变I型节点部署防御策略的成CD参数的值来进行仿真分析。当CD
[0250] 基于上述分析可知,无论是CD>CR还是CD
[0251] 攻击成功率对系统收敛性的影响的探究具体如下:
[0252] 为研究II型节点不同的攻击成功率对系统收敛性的影响,现根据ESS稳定性分析改变II型节点攻击成功率P参数的值来进行仿真分析。CD取0.3。在演化博弈过程中,当采用策略2、CD
[0253] 基于上述分析可知,无论是CD>CR还是CD
[0254] 由定理1可知,当CD>CR时,均衡点((1,0,0),(1,0,0))是通道网络复制动态系统的一个ESS。由定理2可知,当CD
[0255] 1)稳定性分析:通道网络经过演化博弈,具有攻击行为的II型节点放弃攻击转而采取合作策略;且I型节点采取合作策略(当CD>CR时)或防御策略(当CD
[0256] 因在真实场景下节点不协作行为的随机性,需进一步验证本专利的通道网络在真实场景下,特别是在节点不协作行为的情况下的性能优势。为此,本文开发了一个仿真框架来模拟Lightning网络和具有防御策略的演化博弈通道网络。具体网络配置如下:
[0257] (1)网络拓扑:生成1000个节点组成的随机无向拓扑图;其中,从1000个节点中随机抽取100个II型节点,整个模拟时间为40000秒;
[0258] (2)路由协议:路由协议主要包含2类:基于最大流算法和基于Landmark算法。基于最大流算法要求节点保存着全网的通道图,并利用经典最大流算法,如Push‑Relabel等算法寻找到目标点的可行支付路径;基于landmark算法主要包括Flare,Landmark Routing等方案。当前的2类方案中,基于最大流方案存储开销和运行成本过大,基于Landmark的方案中虽然不需要节点存储整个网络图,但其寻路的成功率取决于选取信标点集的方式和大小,并且无法保证寻找到的路径是否为最优路径,更重要的是没有提供一种承担恶意行为的解决方案。对于每一个交易请求,利用Epidemic路由协议,采用泛洪(Flooding)机制,只要有机会,就将消息传递给邻居节点,即所有节点将消息传递给所有邻居结点。设置本文模型中节点的缓冲区足够大,Epidemic路由协议可保证通道网络动态演化博弈模型中节点路由信息的公平性,使得每个节点被选择的概率很高,降低低利用率的节点对网络性能的影响,实验分析如下。
[0259] (1)交易成功率(Transaction success ratio简记为TR)
[0260] 交易平均传输成功率为成功发送到目标节点的交易消息数量与总交易消息数量:TR=RM/TM,其中,RM为成功发送到目标节点的交易消息数量,TM为总交易消息数量。
[0261] 节点的不协作行为对交易成功率的影响如图12所示,图12反映出当采用策略2及攻击成功率P=0.5时,在不同的通道网络配置下,节点不协作行为对交易平均传输率的影响。在Lightning网络中,由于网络中存在II型节点且网络中缺乏安全措施,不协作行为导致交易平均传输成功率下降。对于具有防御策略的演化博弈通道网络可以使得I型节点在一定概率上抵御不同的攻击行为,使网络达到稳定的协作状态,因此网络中交易平均传输率增加。
[0262] (2)平均消息传输时延(Transaction transmission delay简记为TD)
[0263] TD为根节点(交易请求方)生成交易请求消息到目标节点接收消息之间的平均时间,即交易完成时间与交易初始时间的差值:TD=TC‑TS,其中,TC为交易完成时间,TS为交易开始时间。节点的不协作行为对平均消息传输时延的影响如图13所示,图13反映出当采用策略2及攻击成功率P=0.5时,在不同的通道网络配置下,节点不协作行为对平均交易传输时延的影响。在通道网络中,总会有包括II型节点在内的交易,这种情况下的交易路由,将导致更长的交易时延;而对于具有防御策略的演化博弈通道网络,可通过防御机制和演化博弈过程使网络达到稳定协作状态,并以此来缓解不协作节点对交易时延的影响。
[0264] 上面结合附图对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。