[0004] 本发明人针对上述问题及技术需求,提出了一种多无人机系统的最小能量控制方法,在不考虑外界环境的影响,通过前馈设计的集中式范数优化点对点迭代学习控制律更加实用;以跟踪时间点为变量,通过集中式范数优化点对点迭代学习控制与坐标下降方法相结合,在满足跟踪要求的同时,实现最小能量的目的。但是集中式的控制方法会对中央控制器有很大的负担,并且响应速度较慢,于是采用ADMM(Alternating Direction Method of Multipliers,交替方向乘子算法)实现分布式的控制方法,即分布式范数优化点对点迭代学习控制;以跟踪时间点为变量,通过分布式范数优化点对点迭代学习控制与坐标下降方法相结合,在满足跟踪要求的同时,实现最小能量的目的。
[0005] 本发明的技术方案如下:
[0006] 一种多无人机系统的最小能量控制方法,包括如下步骤:
[0007] 第一步、建立多无人机系统的动态模型:
[0008] 动态模型采用传递函数表示,描述了单个无人机系统竖直方向的位移z和直流电动机输入电压Uz的转化关系。首先列写系统微分方程组;通过拉氏变换将微分方程组转换为等价的代数方程组,并根据代数方程组画出系统结构图;通过结构图简化,或消去代数方程组的中间变量,获得所需的输出量拉氏变换与输入量拉氏变换之比,即系统的传递函数。建立如式(1)所示的实际物理模型:
[0009]
[0010] 其中,s为复数,kn,ωn,ζ为根据实验数据所得的常数值,且分别取kn=775.3207,ωn=4.5994和ζ=0.7218。
[0011] 因此,动态模型可以采用式(2)动力学方程表示:
[0012]
[0013] 其中,
[0014] 第二步、构建多无人机系统的离散状态空间方程:
[0015] 对于式(2)所示的连续系统模型,进行离散化处理,选取满足香农采样定理采样周期Ts,得到第i个(1≤i≤S)无人机系统的离散状态空间方程为:
[0016]
[0017] 式中t和k分别代表采样时间和批次,批次过程的运行周期为T;在每个重复过程周期内,对于时间点t∈[0,T]取N个采样点; 和 分别是第i个无人机系统的离散状态空间系统在第k批次t时刻的输入、输出和状态向量,三者具有相同的维度;Ai,Bi,Ci为每个无人机线性离散系统的各个参数矩阵,且满足CiBi≠0,并且假设每个无人机系统在每个批次的初始状态一致,令xi,k(0)=0;
[0018] 第三步、建立多无人机系统的提升模型:
[0019] 针对式(3)形式的线性离散系统,将其离散状态空间方程转换为时间序列的输入输出矩阵模型:
[0020] yi,k=Giui,k (4)
[0021] 其中:
[0022]
[0023] ui,k=[ui,k(0)T,ui,k(1)T,...,ui,k(N‑1)T]T
[0024] yi,k=[yi,k(1)T,yi,k(2)T,...,yi,k(N)T]T
[0025] 是时间序列上的输入输出传递矩阵;输入输出的内积及相关的诱导范数定义为:
[0026]
[0027]
[0028] 其中,v(τ)为输入Hilbert空间上的向量,权矩阵R和Q为适当维度的实正定矩阵。
[0029] 定义所有无人机系统的输入、输出向量:
[0030]
[0031]
[0032] 第四步、提出点对点迭代学习控制设计框架:
[0033] 选取在运行过程中的当前运行批次中的M个跟踪时间点,定义为ti,i=1,...,M,跟踪时间点分布定义为Γ:
[0034] Γ=[t1,t2,...,tM]T∈Θ (9)
[0035] 其中:
[0036]
[0037] 点对点的参考轨迹rp是从完整的参考轨迹r中提取的,表示为:
[0038] rp=[r(t1)T,r(t2)T,...,r(tM)T]T (11)
[0039] 第i个无人机点对点的输出信号 和跟踪误差 与式(11)有同样的表达式:
[0040]
[0041]
[0042] 为了将一个信号转换为其点对点形式,引入一个转换矩阵 为M行N列的p分块矩阵,使得r=Ψr, 当第m个采样时刻tm为关键跟踪时间点时,
转换矩阵第m行的所有N个元素除了n=t时为单位矩阵(l×l)其余全是零矩阵,Ψ的表达式为:
[0043]
[0044] 其中,Ψmn为转换矩阵Ψ中的第m行第n列的元素;
[0045] 基于式(4),推导出第i个无人机的提升模型为:
[0046]
[0047] 其中, 基于式(15),拓展到多无人机系统的提升模型为:
[0048]
[0049] 其中, 定义所有无人机系统的点对点跟踪目标、点对点误差向量分别为:
[0050] Rp=[(rp)T,(rp)T,...,(rp)T]T (17)
[0051]
[0052] 第五步、建立多无人机系统的网络拓扑结构模型:
[0053] 用图结构 来表示网络拓扑,节点的集合 边的集合第i个无人机的邻接节点的集合 无人机之间的通信
情况用邻接矩阵 表示,其中:
[0054]
[0055] 在多无人机系统的网络拓扑结构模型中,只有有限个数的无人机可以直接获取点p对点的参考轨迹r ,其他无人机则通过邻接无人机获取跟踪信息。用对角矩阵P来表示第i无人机能否直接获取点对点的参考轨迹,它的元素pii表示为:
[0056]
[0057] 第六步、提出点对点迭代学习控制的最小能量问题设计框架:
[0058] 选择控制能量作为目标代价函数:
[0059]
[0060] 最小能量的设计目的是迭代地寻找一个输入信号Uk,相应的输出Yk,以及一个跟踪时间点分布Γk,满足:
[0061]
[0062] 其中,Y*表示准确地经过点对点的参考轨迹Rp,同时U*,Γ*是如下问题的优化解:
[0063]
[0064] 通过先优化输入信号U,再优化跟踪时间点分布Γ,将优化问题(23)分为两个优化问题:
[0065]
[0066]
[0067] 其中,U*(Γ)是优化问题(24)的解析解;由于目标代价函数(21)是凸函数,所以可*以保证解析解U(Γ)是唯一的全局最优解。
[0068] 第七步、设计多无人机系统的集中式点对点迭代学习最小能量控制算法:
[0069] 为了满足实际工业问题设计要求,此处考虑了多无人机系统的拓扑通信结构、点对点跟踪误差及控制信号批次间变化,设计如下全局性能指标:
[0070] Jk+1(U)=q1||LEp||2+q2||PEp||2+q3||U‑Uk||2 (26)
[0071] 其中, 数q1,q2,q3表示权重。通过优化这个性能指标函数(26),得到分布式的点对点迭代学习控制律为:
[0072]
[0073] 其中, IMS是维度为MS×MS的单位矩阵。
[0074] 根据控制律(27),为了获取稳态控制输入,令k→∞,并且初始的输入信号U0=0,则:
[0075]
[0076] 为了解决优化问题(24),引入Language乘子λ,构造Language函数:
[0077]
[0078] 令U*(Γ)为Language函数的全局最优解,则:
[0079]
[0080] 将 代入式(30),则:
[0081]
[0082] 当且仅当 不等式(31)成立,并且满足跟踪条件则有:
[0083]
[0084] 由范数优化迭代学习控制律生成的稳态控制输入U∞就是优化问题(24)的全局最*优解U(Γ);
[0085] 将优化问题(24)的全局最优解表达式(28)代入优化问题(25),则有:
[0086]
[0087] 由于集合Θ在离散系统中是有限的,令初始跟踪时间点分布为Γ0,所以优化问题(33)通过坐标下降法解决,表达式为:
[0088]
[0089] 其中 表示坐标下降的次数;每个跟踪时间点经过函数更新:
[0090]
[0091] 其中 是如下优化问题的解:
[0092]
[0093] 基于式(34)生成的序列{h(Γj)},向下收敛到极限h*;
[0094] 给定线性离散时不变系统,初始跟踪时间点分布Γ0以及集合Θ,点对点的参考轨p迹R ,选定权矩阵 和 趋近于零的常数ε>0和δ>0,则集中式点对点迭代学习最小能量控制算法设计包括:
[0095] 步骤7.1:初始跟踪时间点分布为Γ0时,执行范数优化迭代学习控制律(27)直到*系统收敛,即 记录稳态控制输入U(Γ0)以及初始控制能量
[0096] 步骤7.2:执行坐标下降法(34),令j→j+1;
[0097] 步骤7.3:令跟踪时间点分布Γ=Γj时,执行范数优化迭代学习控制律(27)直到*系统收敛,即 记录稳态控制输入U (Γj)以及相应的控制能量
[0098] 步骤7.4:重复执行步骤7.2和步骤7.3,直到|h(Γj)‑h(Γj‑1)|<δ|h(Γj‑1)|;
[0099] 步骤7.5:记录最优跟踪时间点分布Γ*以及相应的最小能量
[0100] 第八步、设计多无人机系统的分布式点对点迭代学习控制算法:
[0101] 利用ADMM实现对多无人机系统的分布式控制,式(26)等价于:
[0102]
[0103] 是第i个无人机的局部性能指标,定义为:
[0104]
[0105] 其中, 是将第i个无人机和邻接无人机的输入作为局部变量。
[0106] 比如说 则
[0107] ADMM用于优化以下优化问题:
[0108]
[0109] 其中, 是局部变量, 表示全局变量, 表示一个将全局变量映射到对应维度全局变量的矩阵,全局变量的组成部分zi对应于局部变量 的组成部分对于优化问题(39),构造增广拉格朗日函数为:
[0110]
[0111] ADMM采用三个步骤通过迭代求解,定义为:
[0112]
[0113]
[0114]
[0115] 其中,o∈[1,...,S], 表示局部变量 中ui出现的次数, 表示含有ui的局部变量 的编号集合。ADMM的目的就是通过迭代的方法,在第k+1批次优化局部变量 得到控制输入ui,以迫近于性能指标函数(26)的解析解,即集中式的控制律(27)。
[0116] 给定线性离散时不变系统,对角矩阵P和拉普拉斯矩阵L,各个无人机的点对点跟p踪轨迹r ,权重参数q1,q2,q3,最大ILC迭代次数kmax,最大ADMM迭代次数υmax,步长ρ,设置初始ILC迭代次数k=0,初始ADMM迭代次数υ=0,初始计数i=0,则分布式点对点迭代学习控制算法设计包括:
[0117] 步骤8.1:设置i=i+1,分别执行优化步骤(41)(42)(43)最小化 直至i=S;
[0118] 步骤8.2:设置υ=υ+1,重复执行步骤8.1,直至υ=υmax,从优化局部 变量中提取ui,k+1;
[0119] 步骤8.3:设置k=k+1,重复执行步骤8.2,直至k=kmax;
[0120] 步骤8.4:获取每个无人机的最优输入ui,kmax;
[0121] 第九步、设计多无人机系统的分布式点对点迭代学习最小能量控制算法:
[0122] 多无人机系统的最优控制,就是优化性能指标函数(26),可以直接获取解析解,即集中式控制律(27)。利用ADMM实现分布式控制,优化等价的性能指标函数(39),通过迭代的方式,迫近集中式的解析解。
[0123] 在集中式控制中,由范数优化迭代学习控制律生成的稳态控制输入U∞就是优化问*题(24)的全局最优解U(Γ)。那么在分布式控制中,改写优化问题(24)和(25):
[0124]
[0125]
[0126] 其中, 是优化问题(44)的解析解。可以得到,只要经过足够的ADMM迭代次数,则最终分布式迭代学习控制的稳态输入ui,∞就是优化问题(44)的全局最优解[0127] 优化问题(45)同样通过坐标下降法解决,表达式为:
[0128]
[0129] 其中 表示坐标下降的次数;每个跟踪时间点经过函数更新:
[0130]
[0131] 其中 是如下优化问题的解:
[0132]
[0133] 给定线性离散时不变系统,初始跟踪时间点分布Γ0以及集合Θ,对角矩阵P和拉p普拉斯矩阵L,各个无人机的点对点跟踪轨迹r ,权重参数q1,q2,q3,最大ILC迭代次数kmax,最大ADMM迭代次数υmax,步长ρ,设置初始ILC迭代次数k=0,初始ADMM迭代次数υ=0,初始计数i=0,趋近于零的常数ε>0和δ>0,则分布式点对点迭代学习最小能量控制算法设计包括:
[0134] 步骤9.1:初始跟踪时间点分布为Γ0时,执行分布式点对点迭代学习控制算法步骤8.1到步骤8.4直到系统收敛,即 记录稳态控制输入 以及初始控制能量
[0135] 步骤9.2:执行坐标下降法(46),令j→j+1;
[0136] 步骤9.3:令跟踪时间点分布Γ=Γj时,执行分布式点对点迭代学习控制算法步骤8.1到步骤8.4直到系统收敛,即 记录稳态控制输入 以及相应的控制能量
[0137] 步骤9.4:重复执行步骤9.2和步骤9.3,直到|h*(Γj)‑h*(Γj‑1)|<δ|h*(Γj‑1)|;
[0138] 步骤9.5:记录最优跟踪时间点分布Γ*以及相应的最小能量
[0139] 本发明的有益技术效果是:
[0140] 本申请公开了针对具有重复运动特征和线性化模型的多无人机系统,将该多无人机系统作为被控对象,分别提出集中式与分布式控制方法,并且针对点对点跟踪任务中能量损耗问题,将范数优化点对点迭代学习控制与坐标下降方法相结合,提出了点对点迭代学习控制的最小能量问题设计框架,并在该框架下设计可实现的迭代学习控制算法,通过坐标下降方法改变跟踪时间点的分布从而减少系统能量损耗。