盲专网 - 一种区块链环境下通道网络稳态演化博弈方法

序号	法律状态公告日	法律状态	法律状态信息
1	2021-11-26	授权
2	2020-06-30	实质审查的生效	IPC(主分类): H04L 29/06 专利申请号: 202010053929.6 申请日: 2020.01.17
3	2020-06-05	公开

背景技术

[0002] 基于区块链的加密货币(如比特币、以太坊)的安全性部分来自于区块数据的广泛复制，需要以有限的可伸缩性为代价。提高加密货币规模的一个主要方法是将重点放在通过使用点对点支付通道将交易从区块链上移到链下，交易方可以通过通道进行大量的交易转移并最终在区块链上结算净收益，以减少交易确认的延迟。虽然基于通道网络的离链支付速度很快，但是如果有一方退出交易并关闭了该通道，都将会导致双方需要将该笔交易的每项操作提交到链上进行处理，而链上交易不仅需要花费大量的交易费，同时也需要较长的交易确认时间(有时可能长达数小时)。巨大的经济支出和时间成本，让通道成为攻击者的攻击目标。

[0003] 通道通过链接形成通道网络，双方的交易通常都可以通过通道网络进行传输。攻击者可对通道网络发动攻击，如路由攻击。另外通道网络中的节点也可能成为被攻击的对象，被攻击者俘获，这些内部节点可能会从通道内部发动攻击，可能会严重影响通道网络的性能，甚至使得整个网络瘫痪。因此，有效防范内部节点的攻击行为，可提高通道网络的稳定性和安全性，有助于通道中的交易能快速顺利完成。本文基于演化博弈思想，从经济学的角度深入分析通道网络中节点获利的动机，在节点的策略空间上设计攻防策略以有效提高通道网络的稳定性和安全性。

[0004] Giulio Malavolta和Pedro Moreno‑Sanchez等人提出了通道的概念，大量交易可以在链下进行，减少了对区块链链上交易的依赖现有的通道主要分为两大类：支付通道和状态通道，具有各自的交易类型。

[0005] (1)支付通道：支付通道旨在建立直接的点对点支付，允许双方私下维护和更新双方账本。每笔交易不需要写在区块链账户上，同时可以在任何时候都能在其区块链中提取合法的资金。支付通道包括Spilman支付通道、Lightning网络、双工微支付通道等。

[0006] 1)Spilman支付通道：Jeremy Spilman首次提出了基于比特币系统的通道支付协议。该协议实现了交易的即时确认，其特点是在通道的支付过程中，交易接收方的金额始终是增长的。接收方只向区块链公布通道内的最新状态，否则接收方金额会受到损失。该通道支付协议只支持单向支付，满足单一用户向商家支付的场景。

[0007] 2)Lightning网络：该通道网络是最早的通过支付通道形成支付网络，以提升区块链交易吞吐量。Lightning网络主要包含两个合约：序列到期可撤销合约(Recoverable Sequence Maturity Contract简称RSMC)和哈希时间锁合约(Hashed Timelock Contract简称HTLC)两种新的交易类型。RSMC主要实现了双人双向的支付通道，使得通道双方可以在交易不上链的情况下即时确认交易。HTLC则实现了系统内任意两个节点的转账可以通过一条双向支付通道来实现。在Lightning网络方案中存在着效率及可用性不足的缺陷，特别是在在其双向支付通道协议中，受比特币系统脚本的限制，为了防止通道某一方作恶，另一方需要存储对方在之前的每一轮交互的惩罚交易，而伴随着高频交易持续的发生，存储这些交易的代价将会越来越大，给用户带来极大的负担。

[0008] 3)双工微支付通道：该通道网络解决了上述两种通道网络的问题，为基于比特币的数字支付实现了高扩展性。由于使用了Lightning网络的HTLC，保证了在双工微支付信道网络上的传输是安全的，且支付是不能被恢复的。但是也只保证了传输过程的安全性，参与方是否有恶意行为则无法保证。

[0009] (2)状态通道：与只支持用户间离链支付的支付通道网络不同，状态通道网络还允许执行任意复杂的智能合约。状态通道包括Sprites通道和Revive通道等通道。

[0010] 1)Sprites通道：Miller等人提出了Sprites的方案，对Lightning网络方案效率方面进行了改进，解决跨通道支付不成功时用户所消耗的时间成本过大的问题。

[0011] 2)Revive通道：Rami Khalil和Arthur Gervais提出了Revive通道，实现了通道支付网络中的可持久化机制，使支付网络中的交易参与者能够安全地在支付通道之间转移余额。但是在Revive通道的安全分析中，只考虑了诚实的参与者在再平衡(Rebalancing)通道资金的过程中不会损失任何资金，却并未考虑不诚实参与者的恶意行为。

[0012] 通道网络通过将大量交易离线处理，同时将区块链作为仲裁平台，处理通道交易过程中的异常情况，如双方对通道的状态有分歧等，其间接地提升了系统的交易吞吐量。有了通道技术如支付通道和状态通道，通道网络中相互连接的节点可能会达到数以万计甚至百万计，因此需要在去中心化的通道网络中寻找由交易发送者到接收方的、可实现稳定快速交易的交易路径。从已有的通道路径选择工作Flare，Landmark Routing等方案可以发现：节点需要获得路由选择过程的全部信息，如果各节点都愿意协作，在不考虑网络中节点的动态加入或退出的情况下，通过一次路由算法就能找到支付通路但不能确定为最优路径。但实际应用中，通道网络存在着被攻击的问题，尤其是从通道内部的节点发起攻击行为，内部攻击通常会严重影响通道网络的性能，甚至会使得整个网络瘫痪，而且内部节点的攻击比外部节点的攻击更难防范，同时传统的签名确认在内部攻击时面临着失效的问题。因此，有必要在内部攻击发生的情况下，对通道网络的稳定性和安全性进行分析。

[0013] 通道网络的相关设置如下：通道是由多个通道和节点构成，且每个节点都具有交易转发功能，将通道网络中的节点按其行为进行分类，分为I型节点和II型节点定义如下：I型节点是由通道网络中具有防御行为的参与者组成的；II型节点是由通道网络中具有攻击行为的参与者组成的。注意：I型和II型节点均具有合作行为和不合作行为。两个节点之间可以借助其他节点建立多个通道。

[0014] 常用的通道交易过程可分为3个阶段：1)初始阶段，双方建立通道；2)支付阶段，通道双方完成交易，且更新通道状态；3)关闭通道阶段，双方关闭通道，赎回通道中自己的资金。通道网络概况图如图1所示。

[0015] 由图1可知，通道网络使交易发起方能够通过中间节点进行交易，如节点b可通过节点d和节点e发送交易给节点f。其中节点b到节点d的通道、节点d到节点e的通道和节点e到节点f的通道都有足够的资金供转发交易。节点b还可以通过节点c和e或者通过节点a、d和e到达节点f。这些节点有可能是具有攻击行为的II型节点，对通道中的交易转发和完成产生不利影响。因此，需要对通道网络稳态演化进行分析，以提高网络的稳定性和安全性。对通道稳定性和安全性进行分析，面临问题如下：

[0016] (1)在通道网络中，一般不存在中央节点，因此很难实现集中控制和监管；

[0017] (2)通道创建需要交易方各自存入一定金额的抵押品到一个多签名地址，交易时金额被锁定，如何使通道交易成功率达到最大化尤为重要；

[0018] (3)由于通道网络的特点，网络可能是稀疏的，很少有机会通过直接连接来完成交易，因此单纯隔离II型节点的方法是不适合的，需要充分利用这些II型节点；

[0019] (4)通道网络中节点的加入退出，使得通道网络拓扑结构不断变化。

实施方案

[0062] 下面对照附图，通过对实施例的描述，对本发明的具体实施方式作进一步详细的说明，以帮助本领域的技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。

[0063] 构建基于通道网络的动态演化博弈模型，需要考虑博弈分析的三个基本要素：参与者、策略空间和收益矩阵。

[0064] 博弈的参与者分别由两类不同的节点集合构成：一类是由I型节点构成的节点集合，可通过转发一笔交易来获得收益；另一类是由II型节点构成的节点集合，可通过发动攻击或转发交易来获得收益。

[0065] 对于I型节点来说，有合作、不合作和防御三种策略，I型节点的策略空间记为：

[0066] S1∈{1,2,3} (1)

[0067] 其中，1表示I型节点采取合作策略，采用合作策略的节点将同意进行交易转发；2表示采取不合作策略，采用不合作策略的节点将拒绝进行交易转发；3表示采取防御策略；采用防御策略的节点将防御II型节点实施的恶意不合作和攻击。

[0068] 对于II型节点来说，有合作、攻击和不合作三种策略，II型节点I型节点的策略空间记为：

[0069] S2∈{1,2,3} (2)

[0070] 其中，1表示II型节点采取合作策略，采用合作策略的节点将同意进行交易转发；2表示采取攻击策略，采用攻击策略的节点将对I型节点实施恶意不合作和攻击行为并以此来获利；3表示采取不合作策略。采用不合作策略的节点将拒绝进行交易转发。

[0071] 根据通道网络的特点，对I型节点和II型节点双方的收益参数进行如下定义：R(Reward)：表示双方在一次博弈中所获得的收益，可以是节点成功转发一次交易所获得的收益；CD(Cost of defense)：表示I型节点采取防御策略所需的成本，可以是资金的消耗；RA(Reward of attack)：表示II型节点成功进行一次攻击活动所获得的收益，可以是获得资金的收益，假定R>RA；CA(Cost of attack)：表示II型节点进行攻击活动所需的成本，可以是攻击时消耗的资金以及被发现时受到相关法律制裁等；CR(Cost of relay)：表示节点进行一次交易所需的成本，可以是资金的消耗；L(Loss)：表示I型节点在受到攻击时的损失；P(Probability)：表示I型节点采取防御策略的情况下，攻击方攻击成功的成功率；在I型节点和II型节点双方的收益参数中，R>CD>CA，R>CR>CA。

[0072] 演化博弈的前提是博弈中的每个参与者在决策阶段是有限理性的，即参与者是为了追求收益最大化而进行策略选择。有限理性的博弈参与者的自私或利他行可使得博弈双方群体的利益达到最大化。即一个参与者群体或不同参与者群体之间如果只有自私行为或只有利他行为都不是收益最大化的最优策略，只有在某些方面自私而在某些方面利他也就是自私行为和利他行为达到一定比例的时候才能达到群体利益的最大化，也称最优策略。因此本专利的前提假设是要求每个节点在给定各自策略空间中，以期望收益最大化为目的进行策略选择。博弈双方节点在不知道彼此策略的情况下，按II型节点策略，博弈双方的收益分析分为以下三大类情况。

[0073] ①当II型节点采取合作策略时，I型节点采用合作、不合作、防御策略时，I型节点和II型节点之间的博弈组合策略包括：(合作，合作)、(不合作，合作)和(防御，合作)三种情况。博弈双方的收益分析如表4.1所示。

[0074] 表4.1II型节点采取合作策略时博弈双方的收益分析

[0075]

[0076] (合作，合作)：双方同意进行交易，各方收益均为博弈所获得收益或节点成功转发一次交易的收益R减去转发一次交易所需的成本CR。因此I型节点最终收益为R‑CR，II型节点最终收益为R‑CR；(不合作，合作)：I型节点不合作，I型节点既无损失也无收益，最终收益为0。II型节点由于I型节点不与之合作转发交易而不能顺利完成转发操作，因此没有转发成功的收益，只有进行一次交易所消耗的资金CR。II型节点最终收益记为‑CR；(防御，合作)：I型节点因采取防御措施而进行交易，双方达成合作。各方收益均为博弈所获得收益或转发成功的收益R，只是消耗的资金成本不同。I型节点因部署防御措施消耗成本CD，I型节点最终收益记为R‑CD。II型节点因进行一次交易消耗资金CR。II型节点最终收益记为R‑CR。

[0077] II型节点采取合作策略，而I型节点分别采用合作、不合作和防御策略时，I型节点收益分别是R‑CR、0和R‑CD；II型节点收益为R‑CR、‑CR、R‑CR。因为假定R>CD>CA，R>CR>CA，所以R‑CR>0，R‑CD>0，使得双方的最大收益均大于0，符合收益最大化要求。

[0078] ②当II型节点采取攻击策略时，博弈双方的收益分析如表4.2所示。

[0079] 表4.2II型节点采取攻击策略时博弈双方的收益分析

[0080]

[0081] (合作，攻击)：I型节点由于选择合作策略被II型节点成功攻击而不能顺利完成交易转发操作。I型节点没有成功转发的收益，只有受到攻击时的亏损L，其最终收益为‑L。II型节点由于攻击成功，则获得收益RA，此外转发交易需要一定的成本CR，因此最终收益为RA‑CR。

[0082] (不合作，攻击)：I型节点由于不合作被II型节点成功攻击而不能顺利完成交易转发操作。I型节点没有转发成功的收益，只有受到攻击时的亏损L，其最终收益为‑L。II型节点的攻击对于不合作的I型节点来说并不成功，不能获得攻击成功的收益RA，且攻击活动需要一定的成本CA，因此II型节点I型节点最终收益为‑CA。

[0083] (防御，攻击)：I型节点由于采取防御策略，使得II型节点只有P的成功率攻击成功。在攻击成功的情况下，I型节点获得转发成功的收益R，但部署防御措施需要防御成本CD且I型节点在II型节点攻击成功时有损失L，则I型节点在攻击成功率为P的情况下，损失资金为P×L，因此其最终收益为R‑CD‑P×L。II型节点的攻击对采取防御策略的I型节点不成功，不能获得攻击成功的收益RA，且攻击活动需要一定的成本CA，因此II型节点最终收益为‑CA。

[0084] II型节点采取攻击策略，而I型节点分别采用合作、不合作和防御策略时，I型节点收益分别是‑L、‑L和R‑CD‑P×L。按照收益最大化要求，且使得I型节点采取防御策略是有效，要求R‑CD‑P×L≥0，即：

[0085] R≥CD+P×L (3)

[0086] ③当II型节点采取不合作策略时，博弈双方的收益分析如表4.3所示。

[0087] 表4.3II型节点采取不合作策略时博弈双方的收益分析

[0088]

[0089] (合作，不合作)：I型节点由于II型节点不与之合作转发而不能顺利完成转发操作。I型节点没有转发成功的收益，只有进行一次交易所消耗的资金CR，因此其最终收益为‑CR。II型节点由于不合作，既无损失也无收益，因此II型节点最终收益为0；(不合作，不合作)：双方不同意进行交易转发，双方收益均为0；(防御，不合作)：I型节点虽采取防御策略，但II型节点由于不合作，I型节点没有成功转发的收益，只有部署防御措施所需的成本CD，因此其最终收益为‑CD。II型节点由于不合作，既无损失也无收益，因此II型节点最终收益为0。

[0090] II型节点采取不合作策略，而I型节点分别采用合作、不合作和防御策略时，I型节点收益分别是‑CR、0、‑CD；II型节点收益为0、0和0。表4.3的最大收益为0。

[0091] 由表4.1～表4.3可知，由于I型节点和II型节点的策略空间均为三个，为了平衡I型节点和II型节点之间的利益关系，因此为博弈双方各自构建一个3×3的收益矩阵，I型节点收益矩阵记为A＝[aij]3×3，II型节点收益矩阵记为B＝[bij]3×3，其中i∈{1,2,3}，j∈{1,2,3}，aij表示采取i策略的I型节点在与采取j策略的II型节点进行博弈时I型节点所获得的收益，bij表示采取i策略的I型节点在与采取j策略的II型节点进行博弈时II型节点所获得的收益。

[0092] 根据博弈双方收益分析表4.1，表4.2和表4.3，将I型节点和II型节点的收益矩阵分别记为A和B，可分别得出：

[0093]

[0094]

[0095] 在通道网络中，应该找到保持所有节点处于一个动态均衡状态的条件；否则，如果网络不稳定将会影响网络正常运行和安全。因此，通道网络动态演化博弈模型的创建目标是找到保持动态稳定均衡的条件。

[0096] 演化稳定策略(Evolutionary stable strategy简称ESS)和复制动态是演化博弈论最核心的概念，ESS表明演化博弈的稳定状态，复制动态表明达到这个稳定状态的收敛过程。ESS仅是一个局部的稳定策略，在随机环境中不能构成判断演化稳定的充分条件。为了更好地描述动态的演化过程，把演化博弈理论中的静态概念与动态过程统一起来，本申请利用演化均衡(Evolutionary Equilibrium)的概念，把演化博弈理论中的静态概念与动态过程统一起来。复制动态方程可以保证ESS为演化均衡。复制动态方程的一般形式如下：

[0097]

[0098] 式(6)中，PE为该策略的期望收益，PA为该策略所对应的策略空间中总体的平均收益。zk为节点所选策略k的比例：

[0099] zk＝Nk/M (7)

[0100] 式(7)中，Nk为策略空间中选择策略k的节点数量，M为该策略空间中总节点数量。0≤Nk≤M。Nk＝0时，表示没有节点选择策略k。Nk＝M时，表示所有节点都选择策略k。

[0101] 通道网络中I型节点和II型节点分别有各自的策略空间。记Ni为I型节点的策略空间中选择策略i的节点数量且i∈{1,2,3}，为I型节点策略空间中总节点数量，且记I型节点采取合作、不合作以及防御策略的比例分别为x1，x2，
x3：

[0102]

[0103] 式(8)中，可知记I型节点在某一时刻策略的比例分布集合为X：

[0104] X＝{xi|i∈{1,2,3}} (9)

[0105] 记Nj为II型节点的策略空间中选择策略j的节点数量且j∈{1,2,3}，为II型节点策略空间中总节点数量，且记II型节点采取合作、攻击以及不合作策略的比例分别为y1，y2，y3:

[0106]

[0107] 式(10)中，可知0≤yj≤1且记II型节点在某一时刻策略的比例分布集合为Y：

[0108] Y＝{yj|j∈{1,2,3}} (11)

[0109] 根据演化博弈的复制动态理论，可以得到I型节点和II型节点各自复制动态方程如下：I型节点选择策略i的期望收益由式(4)、(9)、(10)可得:

[0110]

[0111] aij为I型节点收益矩阵A的矩阵元素，I型节点的平均收益由式(8)、(9)、(12)可得:

[0112]

[0113] I型节点的复制动态方程为:

[0114]

[0115] 将式(12)、(13)代入式(14)可得复制动态方程的具体形式如式(15)所示：

[0116]

[0117] (2)II型节点复制动态方程

[0118] II型节点选择策略j的期望收益由式(5)、(8)、(11)可得：

[0119]

[0120] bij为II型节点收益矩阵B的矩阵元素，II型节点的平均收益由式(10)、(11)、(16)可得:

[0121]

[0122] II型节点的复制动态方程如式(18)所示：

[0123]

[0124] 将式(16)、(17)代入式(18)可得：

[0125]

[0126] 由式(15)和式(19)，分别计算出x1，x2，x3，y1，y2，y3的复制动态方程。

[0127] 以表示I型节点采用策略i时参与者比例随时间的变化率，其中i∈S1。由式(4)收益矩阵和式(15)分别计算出x1，x2，x3其复制动态方程为：

[0128]

[0129]

[0130]

[0131] 以表示II型节点采用策略j时参与者比例随时间的变化率，其中j∈S2。由式(5)收益矩阵和式(19)分别计算出y1，y2，y3其复制动态方程为：

[0132]

[0133]

[0134]

[0135] 复制动态方程可以保证具有局部动态稳定性的ESS表现出均衡与动态的选择过程之间的关系和收敛过程。但由于复制动态是非线性的，很难求出唯一的解。因此，演化博弈就从对均衡的求解转向对均衡稳定性的分析，而稳定性对于延长网络的生命周期至关重要。

[0136] 根据演化博弈理论，由式(20)～(25)构成I型节点和II型节点的通道网络复制动态系统，因此，在I型节点和II型节点通道网络复制动态系统的解曲线上任意一点(X,Y)都对应着演化博弈的一个混合策略((x1,x2,x3),(y1,y2,y3))。对于动态演化博弈模型，可由式(20)～(25)计算可能的均衡点，((x1,x2,x3),(y1,y2,y3))取值如表5.1所示：

[0137] 表5.1动态演化博弈模型均衡点

[0138]

[0139] 证明在CD>CR条件下，均衡点((1,0,0),(1,0,0))是唯一的ESS，表示在该点所有I型节点和II型节点均愿意选择合作策略，如定理1所示，。定理1：均衡点((1,0,0),(1,0,0))是通道网络复制动态系统式(20)～(25)唯一的ESS的充要条件是CD>CR。

[0140] (1)存在性证明

[0141] 欲使点((1,0,0),(1,0,0))是通道系统式(20)～(25)的ESS的充要条件为Trace J<0且Det J>0[27]。其中矩阵J是演化博弈的雅可比矩阵(Jacobian Matrix)，Trace J定义为矩阵J主对角线上元素的和，Det J定义为矩阵J的行列式。雅可比矩阵记为

[0142]

[0143] 由式(20)～(25)代入式(26)，可得到通道系统相对应的雅可比矩阵。将点((1,0,0),(1,0,0))代入系统雅可比矩阵J，可得：

[0144] 矩阵J的迹为：Trace J＝5CR‑CD‑5R+RA，

[0145] 矩阵J的行列式为：Det J＝(CR‑R)4(R‑RA)(CD‑CR)，

[0146] ∵R>RA，

[0147] 若CD>CR，

[0148] ∴Trace J＝5CR‑CD‑5R+RA

[0149] <5CR‑CR‑5R+RA

[0150] ＝4CR‑5R+RA

[0151] <4CR‑5R+R

[0152] ＝4(CR‑R)<0，

[0153] ∵R>RA，

[0154] 若CD>CR，

[0155] ∴Det J>0，

[0156] 注意：当CD＝CR时，Det J＝0，不满足ESS的充要条件中的Det J>0的要求。故CD≠CR。

[0157] 因此，当CD>CR时，点((1,0,0),(1,0,0))是通道网络复制动态系统的一个ESS。

[0158] (2)唯一性证明

[0159] 由式(20)～(25)计算可能的均衡点如表5.1所示共9个。要证明点((1,0,0),(1,0,0))的唯一性，根据逆向思维，只要证明除点((1,0,0),(1,0,0))外，其他8个点不是ESS，即可说明点((1,0,0),(1,0,0))的唯一性。

[0160] ∵当CD>CR时，

[0161] 1)对于点((1,0,0),(0,1,0))，((1,0,0),(0,0,1))，((0,1,0),(1,0,0))，((0,1,0),((0,1,0))，((0,1,0),(0,0,1))，((0,0,1),(0,0,1))，Det J＝0，不满足ESS的充要条件即Trace J<0且Det J>0，

[0162] ∴以上6个均衡点不是ESS；

[0163] 2)对于点((0,0,1),(1,0,0))，

[0164] Trace J＝3CD+2CR‑CA‑5R，

[0165] Det J＝(CR‑R)2(CR‑R)2(R‑CR+CA)(CR‑CD)，其中，

[0166] ∵R>CR，CD>CR，

[0167] ∴R‑CR+CA>0，CR‑CD<0，则Det J<0，不满足ESS的充要条件即Trace J<0且Det J>0，[0168] ∴点((0,0,1),(1,0,0))不是ESS；

[0169] 3)对于点((0,0,1),(0,1,0))，

[0170] Trace J＝3CD‑CR+3CA‑2L‑2R+3P×L，

[0171] Det J＝CA2(CD–L–R+P×L)2(CD+P×L‑R)(R‑CR+CA)，其中，

[0172] ∵R≥CD+P×L见式(3)，且R>CR，

[0173] ∴CD+P×L–R<0，R‑CR+CA>0，则Det J≤0，不满足ESS的充要条件即Trace J<0且Det J>0，

[0174] ∴点((0,0,1,0,1,0))不是ESS；

[0175] 因此，当CD>CR时，点((1,0,0),(1,0,0))是通道网络复制动态系统唯一的ESS。

[0176] 以上存在性和唯一性的证明，证明了点((1,0,0),(1,0,0))是通道网络复制动态系统式(20)～(25)唯一的ESS的充要条件是CD>CR。要使得CD>CR，那么就意味着要降低节点执行一次交易所需成本，或者提高I型节点部署防御策略所需要的成本，使得执行一次交易所需成本大于I型节点部署防御策略的成本。这样I型节点就能根据不同防御策略的防御成本，合理地选择部署防御策略与否，这样可以有效地降低开销，使得自身在整个通道网络中的生命周期更长。

[0177] 证明在CD

[0178] 定理2：((0,0,1),(1,0,0))是通道网络复制动态系统唯一的ESS的充要条件是CD

[0179] (1)存在性证明

[0180] 点((0,0,1),(1,0,0))是通道系统ESS的充要条件为Trace J<0且Det J>0。由式(20)～(25)代入式(26)可得到通道系统相对应的雅可比矩阵。将点((0,0,1),(1,0,0))代入系统雅可比矩阵J，可得：

[0181] 矩阵J的迹为：Trace J＝3CD+2CR‑CA‑5R，

[0182] 矩阵J的行列式为：Det J＝(CD‑R)2(CR‑R)2(CR‑CD)(R‑CR+CA)，

[0183] ∵R>RA，R>CR，

[0184] 若CD

[0185] ∴Trace J＝3CD+2CR‑CA‑5R

[0186] <3CR+2CR‑CA‑5R

[0187] ＝5CR‑5R‑CA

[0188] ＝5(CR‑R)‑CA

[0189] <0，

[0190] 又∵R>CR，CA>0，∴R‑CR+CA>0，Det J>0，

[0191] 注意：当CD＝CR时，Det J＝0，不满足ESS的充要条件中的Det J>0的要求。故CD≠CR。

[0192] 因此，当CD

[0193] (2)唯一性证明

[0194] 由式(20)～(25)计算可能的均衡点如表5.1所示共9个。要证明点((0,0,1),(1,0,0))的唯一性，根据逆向思维，只要证明除点((0,0,1),(1,0,0))外，其他8个点不是ESS，即可说明点((0,0,1),(1,0,0))的唯一性。

[0195] ∵当CD

[0196] 1)对于点((1,0,0),(0,1,0))，((1,0,0),(0,0,1))，((0,1,0),(1,0,0))，((0,1,0),(0,1,0))，((0,1,0),(0,0,1))，((0,0,1),(0,0,1))，Det J＝0，不满足ESS的充要条件即Trace J<0且Det J>0，

[0197] ∴以上6个均衡点不是ESS；

[0198] 2)对于点((1,0,0),(1,0,0))，

[0199] Trace J＝5CR‑CD‑5R+RA，

[0200] Det J＝(CR‑R)4(R‑RA)(CD‑CR)，其中，

[0201] ∵R>CA，CD>CR，

[0202] ∴Det J<0，不满足ESS的充要条件即Trace J<0且Det J>0，

[0203] ∴点((1,0,0),(1,0,0))不是ESS；

[0204] 3)对于点((0,0,1),(0,1,0))，

[0205] Trace J＝3CD‑CR+3CA‑2L‑2R+3P×L，

[0206] Det J＝CA2(CD–L–R+P×L)2(CD+P×L‑R)(R‑CR+CA)，其中，

[0207] ∵R≥CD+P×L见式(3)，且R>CR，

[0208] ∴CD+P×L–R<0，R‑CR+CA>0，则Det J≤0,不满足ESS的充要条件即Trace J<0且Det J>0，

[0209] ∴点((0,0,1),(0,1,0))不是ESS；

[0210] 因此，当CD

[0211] 以上存在性和唯一性的证明，证明了点((0,0,1),(1,0,0))是通道网络复制动态系统式(20)～(25)唯一的ESS的充要条件是CD

[0212] 根据定理1和定理2，当I型节点部署防御策略所需要的成本大于节点进行一次转发交易所需成本时，演化博弈结束后，通道网络中所有I型节点都会采取合作策略且所有II型节点都会采取合作策略。然而，当I型节点部署防御策略所需要的成本小于节点进行一次转发交易所需成本时，演化博弈结束后，通道网络中所有I型节点都会采取防御策略且所有II型节点都会采取合作策略。

[0213] 当前的区块链通道交易过程中，需要交易双方节点的合作，如果一方节点不愿意协作将导致通道关闭，导致双方节点要切换到区块链上实现交易操作且花费较长时间来完成交易验证。因此在通道网络中进行交易时，需要保证通道网络的稳态以保证交易顺利完成。基于有限理性和生物进化过程的“复制动态”机制，将通道网络中节点交易建模为动态演化博弈模型，该模型设计一种基于演化博弈的通道网络动态防御机制，该机制在I型节点的策略空间上增加一个防御策略，并考虑在部署防御策略的情况下II型节点攻击的成本与成功率，该防御机制可帮助I型节点以一定的概率抵抗II型节点的攻击行为。该模型的节点具有有限理性的进化学习能力，能够根据攻击者的不同攻击策略，动态调整各自策略来达到有效防御。

[0214] 因在真实场景下节点不协作行为的随机性，为了验证申请的通道网络在真实场景下的性能优势，开发一个仿真框架模拟闪电网络和具有攻防策略的动态演化博弈通道网络，结果表明具有动态防御机制的通道网络具有较好的交易传输成功率和较低的时延，仿真过程具体如下：

[0215] (1)实验环境：1)电脑配置：Windows8六十四位操作系统，包括Intel Core i5处理器、CPU2.80GHz和8G内存；2)环境配置：采用MTLAB2018b工具来进行仿真动态演化博弈模型的博弈过程与结果。

[0216] (2)实验参数：由于节点交易收益以及成本等参数的衡量标准不同，因此将所有研究参数进行标准化处理，取值都在[0,1]内。具体实验参数设计如表6.1所示：

[0217] 表6.1实验参数表

[0218]

[0219] 表6.1中，为测试不同防御成本对系统达到ESS速度的影响，当CD>CR时，根据式(3)R≥CD+P×L，CD取值分别为0.42，0.44和0.46以测试不同防御成本对系统达到ESS速度的影响，其他情况下CD取值为0.46。当CD6.1中，R、RA、CR、CA的取值满足R>RA，R>CD>CA，R>CR>CA的要求。

[0220] 演化博弈中的节点是有限理性的，在受到攻击后的损失与成功进行博弈并完成交易收益相同，因此取L＝1；为了测试II型节点的不同攻击成功率对系统达到ESS速度的影响，在满足式(3)R≥CD+P×L的条件下，取值分别为0.1，0.2和0.4，其他情况下取值为0.5。

[0221] (3)其他参数说明

[0222] 1)仿真时间(Time(s))

[0223] 演化博弈达到演化均衡所需的仿真时间，即通道网络复制动态系统收敛于ESS点所需的时间。

[0224] 2)节点所选策略的比例(Node ratio(％))

[0225] 在I型节点和II型节点通道网络复制动态系统的解曲线上，仿真点(X,Y)所对应着演化博弈的一个组合策略((x1,x2,x3),(y1,y2,y3))，即I型节点和II型节点所采取策略的比例分布情况。计算见式(8)和式(10)。在演化博弈初始状态，按照表6.2中7个不同的组合策略，I型节点和II型节点选择各自策略来进行博弈实验。具体组合策略的设置如表6.2所示：

[0226] 表6.2节点所选策略的比例参数表

[0227]

[0228]

[0229] (4)性能分析指标

[0230] 1)稳定性：I型节点与II型节点均衡的稳定性取决于二者在演化博弈中策略选择的收益大小比较，在达到ESS时的两方总体中个体仍然会不断地变化，即内部不断变化而总体不变的过程。

[0231] 2)收敛性：系统是否能达到ESS以及达到ESS所需的时间长短，用Time(s)表示。即所需时间越短，收敛性越好。

[0232] 在复制动态下，达到ESS即为演化均衡，而达到演化均衡时通道网络中节点和通道仍然会在不断地变化。为研究通道网络内部的不断变化对整个通道网络的影响过程和影响结果，根据式(20)～(25)建立仿真模型。根据不同的实验目的，给定一个组合策略(X,Y)＝((x1,x2,x3),(y1,y2,y3))的初始值，将x1，x2，x3，y1，y2，y3代入式(20)～(25)建模成的复制动态系统表达式，博弈过程反映在仿真图像上为x1，x2，x3，y1，y2，y3各自对应的节点所选策略的比例Node ratio(％)，即图像纵坐标。根据策略比例的变化，观察博弈过程，分析通道网络动态演化博弈模型的稳定性。当CD>CR时，模型的动态演化模型的博弈结果是(合作，合作)组合策略。

[0233] I型节点初始状态采取防御策略与否的系统演化稳定性分析具体如下：

[0234] (1)CD取0.46。当选择策略1进行演化博弈时，通道网络博弈过程见图2，图2为CD>CR且I型节点都没有采取防御策略时，模型演化稳定状态分析图；图2可知，当通道网络中的I型节点都没有采取防御策略时，II型节点为了使自身利益最大化而选择攻击策略，I型节点则一直选择合作策略，经过几次博弈后，II型节点经过演化学习进而也选择了合作策略以减少自身损失，网络最终收敛到双方都合作的稳定状态。

[0235] (2)CD取0.46。当选择策略2进行演化博弈时，通道网络博弈过程见图3，图3为CD>CR且I型节点部分采取防御策略时，系统演化稳定状态分析图，由图3可知，当通道网络中有部分I型节点采取防御措施时，I型节点采取防御策略，II型节点经过一段时间的演化学习，观察到I型节点采取了防御策略，为了使自身利益最大化而选择合作策略。I型节点经过一段时间的演化学习，发现II型节点都采取合作策略后，也为了自身利益最大化放弃防御策略转而选择合作策略，网络最终收敛到双方都合作的稳定状态。说明在CD>CR时，I型节点采取防御措施与否对网络复制动态系统的博弈演化策略没有影响。

[0236] 初始比例对系统收敛性的影响的探索具体如下：

[0237] 为研究I型节点与II型节点分别都部署合作策略的初始比例对系统收敛性的影响，由理论1和6.2.1节通道网络复制动态系统的稳定性分析得知，组合策略(合作，合作)是系统的ESS。在此基础上进一步考虑，对于通道网络节点选择合作策略的不同初始比例，博弈双方是否仍能维持稳定状态以及对于模型收敛性的影响。CD取0.46，图4(a)为采用策略3时初始比例对系统收敛性的影响图，图4(b)为采用策略4时初始比例对系统收敛性的影响图，图4(c)为采用策略5时初始比例对系统收敛性的影响图，由图4(a)和图4(b)可知，当I型节点采取合作策略的初始比例越高时，模型收敛性就越快；由图4(b)和图4(c)可知，当II型节点采取合作策略的初始比例越高时，模型收敛性收敛性就越快。

[0238] 成本对系统收敛性的影响的探索具体如下：

[0239] 为研究I型节点部署防御策略的成本对系统收敛性的影响，现根据ESS稳定性分析改变I型节点部署防御策略的成本CD参数的值进行仿真分析。当CD>CR时，系统的ESS是组合策略组合策略(合作，合作)，为简化仿真图形，在仿真图形中只显示I型节点采取合作策略和II型节点采取合作策略的演化过程。在演化博弈过程中，当采用策略2、CD>CR、1/3的I型节点部署防御策略的成本分别为0.42、0.44和0.46时，成本对系统达到ESS速度的影响如图5所示，由图5可知，当CD>CR时，在三种不同防御成本博弈情况下，节点部署防御策略的成本对系统收敛性有明显影响。随着防御成本增加，I型节点达到稳定合作状态的速度增加，II型节点达到稳定合作状态的速度不变，且系统整体达到ESS的速度增加，即系统收敛性提高。在博弈过程中，部分I型节点采取防御策略，II型节点观察到I型节点采取防御策略，为使自身利益最大化而采取合作策略；而此刻I型节点观察到II型节点采取合作策略，为使自身利益最大化则放弃防御策略转而采取合作策略。经过演化博弈，系统最终会收敛到一个ESS的稳定状态。在该状态下，I型节点和II型节点均采取合作策略，并均能获得最大化的收益，无论是一个节点还是多个节点都没有动机偏离最大化的收益。因此I型节点部署防御策略的成本越高，系统达到ESS的速度越快，即系统收敛性越好。

[0240] 攻击成功率对系统收敛性的影响的探索具体如下：

[0241] 为研究II型节点不同的攻击成功率对系统收敛性的影响，现根据ESS稳定性分析改变II型节点攻击成功率P参数的值来进行仿真分析。CD取0.46。在演化博弈过程中，当采用策略2、CD>CR、1/3的II型节点攻击的成功率分别为0.1、0.2和0.4时，攻击成功率对系统收敛性的影响如图6所示，由图6可知，当CD>CR时，在三种不同攻击成功率博弈情况下，II型节点攻击成功率对系统收敛性有影响。随着攻击成功率的增加，I型节点达到稳定合作状态的速度增加，II型节点达到稳定合作状态的速度不变，且系统整体达到ESS的速度增加，即系统收敛性提高。博弈过程的分析同6.2.3节，最终，I型节点为使自身利益最大化会放弃防御策略转而采取合作策略。在防御成本大于交易成本的情况下，攻击成功率越高，系统达到ESS的速度越快，即系统收敛性越好。

[0242] 基于式(20)～(25)建模成的复制动态系统，根据不同的实验目的，给定一个混合策略(X,Y)＝((x1,x2,x3),(y1,y2,y3))的初始值，将x1，x2，x3，y1，y2，y3代入复制动态系统表达式，博弈过程反映在仿真图像上为x1，x2，x3，y1，y2，y3各自对应的节点所选策略的比例Node ratio(％)，即图像纵坐标。根据策略比例的变化，观察博弈过程，分析通道网络动态演化博弈模型的稳定性。当CD

[0243] I型节点初始状态采取防御策略与否的系统演化稳定性分析

[0244] (1)CD取0.3。当选择策略1进行演化博弈时，通道网络博弈过程见图7，图7为CD

[0245] (2)CD取0.3。当选择策略2进行演化博弈时，通道网络博弈过程见图8，图8为CDCR还是CD

[0246] 策略的初始比例对系统收敛性的影响的探究具体如下：

[0247] 为研究I型节点与II型节点分别部署防御策略和合作策略的初始比例对系统收敛性的影响，由理论2和节通道网络复制动态系统的稳定性分析得知，组合策略(防御，合作)是模型的ESS。在此基础上进一步考虑，对于通道网络I型节点选择防御策略以及II型节点选择合作策略的不同初始比例，博弈双方是否仍能维持稳定状态以及对于模型达到ESS速度的影响。CD取0.3。图9(a)为采用策略3时初始比例对模型收敛性的影响，图9(b)为采用策略6时初始比例对模型收敛性的影响，图9(c)为采用策略7时初始比例对模型收敛性的影响，由图9(a)和9(b)可知，当I型节点采取防御策略的初始比例越高时，系统收敛性就越快；由图9(b)和图9(c)可知，当II型节点采取合作策略的初始比例越高时，系统收敛性就越快。
基于上述分析可知，无论是CD>CR还是CD

[0248] 成本对系统收敛性影响的探究具体如下：

[0249] 为研究I型节点部署防御策略的成本对系统收敛性的影响，现根据ESS稳定性分析改变I型节点部署防御策略的成CD参数的值来进行仿真分析。当CD

[0250] 基于上述分析可知，无论是CD>CR还是CD

[0251] 攻击成功率对系统收敛性的影响的探究具体如下：

[0252] 为研究II型节点不同的攻击成功率对系统收敛性的影响，现根据ESS稳定性分析改变II型节点攻击成功率P参数的值来进行仿真分析。CD取0.3。在演化博弈过程中，当采用策略2、CD

[0253] 基于上述分析可知，无论是CD>CR还是CD

[0254] 由定理1可知，当CD>CR时，均衡点((1,0,0),(1,0,0))是通道网络复制动态系统的一个ESS。由定理2可知，当CD

[0255] 1)稳定性分析：通道网络经过演化博弈，具有攻击行为的II型节点放弃攻击转而采取合作策略；且I型节点采取合作策略(当CD>CR时)或防御策略(当CD

[0256] 因在真实场景下节点不协作行为的随机性，需进一步验证本专利的通道网络在真实场景下，特别是在节点不协作行为的情况下的性能优势。为此，本文开发了一个仿真框架来模拟Lightning网络和具有防御策略的演化博弈通道网络。具体网络配置如下：

[0257] (1)网络拓扑：生成1000个节点组成的随机无向拓扑图；其中，从1000个节点中随机抽取100个II型节点，整个模拟时间为40000秒；

[0258] (2)路由协议：路由协议主要包含2类：基于最大流算法和基于Landmark算法。基于最大流算法要求节点保存着全网的通道图，并利用经典最大流算法，如Push‑Relabel等算法寻找到目标点的可行支付路径；基于landmark算法主要包括Flare，Landmark Routing等方案。当前的2类方案中，基于最大流方案存储开销和运行成本过大，基于Landmark的方案中虽然不需要节点存储整个网络图，但其寻路的成功率取决于选取信标点集的方式和大小，并且无法保证寻找到的路径是否为最优路径，更重要的是没有提供一种承担恶意行为的解决方案。对于每一个交易请求，利用Epidemic路由协议，采用泛洪(Flooding)机制，只要有机会，就将消息传递给邻居节点，即所有节点将消息传递给所有邻居结点。设置本文模型中节点的缓冲区足够大，Epidemic路由协议可保证通道网络动态演化博弈模型中节点路由信息的公平性，使得每个节点被选择的概率很高，降低低利用率的节点对网络性能的影响，实验分析如下。

[0259] (1)交易成功率(Transaction success ratio简记为TR)

[0260] 交易平均传输成功率为成功发送到目标节点的交易消息数量与总交易消息数量：TR＝RM/TM，其中，RM为成功发送到目标节点的交易消息数量，TM为总交易消息数量。

[0261] 节点的不协作行为对交易成功率的影响如图12所示，图12反映出当采用策略2及攻击成功率P＝0.5时，在不同的通道网络配置下，节点不协作行为对交易平均传输率的影响。在Lightning网络中，由于网络中存在II型节点且网络中缺乏安全措施，不协作行为导致交易平均传输成功率下降。对于具有防御策略的演化博弈通道网络可以使得I型节点在一定概率上抵御不同的攻击行为，使网络达到稳定的协作状态，因此网络中交易平均传输率增加。

[0262] (2)平均消息传输时延(Transaction transmission delay简记为TD)

[0263] TD为根节点(交易请求方)生成交易请求消息到目标节点接收消息之间的平均时间，即交易完成时间与交易初始时间的差值：TD＝TC‑TS，其中，TC为交易完成时间，TS为交易开始时间。节点的不协作行为对平均消息传输时延的影响如图13所示，图13反映出当采用策略2及攻击成功率P＝0.5时，在不同的通道网络配置下，节点不协作行为对平均交易传输时延的影响。在通道网络中，总会有包括II型节点在内的交易，这种情况下的交易路由，将导致更长的交易时延；而对于具有防御策略的演化博弈通道网络，可通过防御机制和演化博弈过程使网络达到稳定协作状态，并以此来缓解不协作节点对交易时延的影响。

[0264] 上面结合附图对本发明进行了示例性描述，显然本发明具体实现并不受上述方式的限制，只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进，或未经改进将本发明的构思和技术方案直接应用于其它场合的，均在本发明的保护范围之内。

附图说明

[0049] 图1为本发明实施例提供的通道网络设置的结构示意图；

[0050] 图2为本发明实施例提供的在CD>CR且I型节点都没有采取防御策略时，模型稳定性分析图；

[0051] 图3为本发明实施例提供的在CD>CR且I型节点部分采取防御策略时，模型稳定性分析图；

[0052] 图4为本发明实施例提供的初始比例对模型收敛性的影响图，其中(a)为策略3，(b)为策略4，(c)为策略5；

[0053] 图5为本发明实施例提供的成本对模型收敛性的影响图；

[0054] 图6为本发明实施例提供的攻击成功率对模型收敛性的影响图；

[0055] 图7为本发明实施例提供的CD

[0056] 图8为CD

[0057] 图9为本发明实施例提供的初始比例对模型收敛性的影响图，其中(a)为策略3，(b)为策略6，(c)为策略7；

[0058] 图10为本发明实施例提供的成本对模型收敛性的影响图；

[0059] 图11为本发明实施例提供的攻击成功率对模型收敛性的影响图；

[0060] 图12为本发明实施例提供的节点的不协作行为对交易成功率的影响图；

[0061] 图13为本发明实施例提供的节点的不协作行为对交易传输时延的影响图。

1区块链网络中添加节点的方法及区块链系统 2一种面向多区块链平台的区块链网络节点服务装置 3一种区块链测评机器人 4基于区块链的消防机器人 5分布式区块链移动通讯系统 6一种基于区块链的硬盘装置 7基于区块链的活动管理方法 8基于区块链运算设备的散热架 9一种用于区块链的安全处理机 10一种基于链式结构的区块链物流识别系统

有效性	有效专利	专利类型	发明专利
申请号	CN202010053929.6	申请日	2020-01-17
公开/公告号	CN111245857B	公开/公告日	2021-11-26
授权日	2021-11-26	预估到期日	2040-01-17
申请年	2020年	公开/公告年	2021年
缴费截止日
分类号	H04L29/06 、H04L12/24 、H04L29/08	主分类号	H04L29/06
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	1
权利要求数量	2	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2019.10.24黄健明,张恒巍.基于随机演化博弈模型的网络防御策略选取方法《.电子学报》.2018,(第9期),第2222-2228页. Dongwei Guo,Qingyao Wang,MingguangYu.Intelligent Strategy and AverageRevenue Ascension in Repeated Game《.20124th International Conference onIntelligent Human-Machine Systems andCybernetics》.2012,第177-180页. 黄健明,张恒巍.基于改进复制动态演化博弈模型的最优防御策略选取《.通信学报》.2018,第39卷(第1期),第170-182页. 黄健明,张恒巍,王晋东,黄世锐.基于攻防演化博弈模型的防御策略选取方法《.通信学报》.2017,第38卷(第1期),第168-176页.;
引用专利	WO2019202437A	被引证专利
专利权维持	2	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人	安徽师范大学	第一申请人	安徽师范大学
专利权人	安徽师范大学	当前专利权人	安徽师范大学
发明人	张佩云、李晨曦、汪丽翠、章一磊、张捷	第一发明人	张佩云
地址	安徽省芜湖市弋江区花津南路安徽师范大学	邮编	241000
申请人数量	1	发明人数量	5
申请人所在省	安徽省	申请人所在市	安徽省芜湖市

首页 > 专利 > 安徽师范大学 > 一种区块链环境下通道网络稳态演化博弈方法专利详情

一种区块链环境下通道网络稳态演化博弈方法 0 0

技术领域

背景技术

发明内容

实施方案

附图说明