多刚体系统的分布式协同控制
发布时间:2022-04-08 
 1 引言 
        多智能体系统凭借在计算机网络、社会网络、智能交通、航空航天等领域的应用前景,已成为近二十年来控制领域的研究热点之一[1]。多刚体系统是一类由自身具备刚体动力学的智能体所组成的多智能体系统。在实际中有着广泛应用,多卫星系统、多机器人系统都可以用多刚体系统来建模[3]。特别是近年来,无人自主飞行器,自动驾驶车辆,自主小卫星等技术的快速发展,催生出大量能够被建模成多刚体系统的应用场景,如多无人机飞行表演,多卫星组网等,使得对多刚体系统的协同控制问题受到广泛关注。近年来,华东理工大学信息学院能源化工过程智能制造教育部重点实验室唐漾教授和其博士后金鑫等在传统的多刚体系统协同控制基础上,针对网络通信资源受限、有向图网络以及时变通信拓扑等问题开展了一系列研究工作,提出了基于事件驱动的多刚体系统协同控制方法,相关科研成果发表在控制领域顶级或者权威学术期刊上,包括 Automatica 2020, 122, 109245; IEEE TAC 2021; IEEE TCST 2021; IEEE TCAS1 2021; IEEE TNSE 2019, 7(3), 1007-1018,部分成果有力支撑了上海市自然科学奖一等奖。
 
       刚体是在外力作用下,形状和大小不发生改变的理想物理模型,一个完整的刚体运动描述包含平移运动和旋转运动的描述两个部分,针对平移运动,可以用欧几里德空间中的三维向量来完整描述;对于旋转运动,不能在欧几里德空间中被全局唯一的表达[4]。刚体旋转运动的这一性质造成了刚体自身动力学的本质非线性。此外,刚体动力学与刚体自身物理参数如质量和惯量紧密相关,然而在实际中这些物理参数往往具备高度不确定性,造成了刚体动力学的不确定性。因此,针对多刚体系统的分布式控制研究相比于一般多智能体系统更有挑战。在多刚体系统的分布式控制当中,刚体之间的信息交互往往通过无线通信网络实现,使得多刚体系统可视为一个物理层与信息层紧密耦合的网络化系统,其中每个刚体的控制器更新、传感器的采样以及数据采样、存储、传输都会占用网络的通信资源。随着网络规模的逐渐扩大,通信资源的消耗也会随之急剧增加,如何高效的利用网络通信资源是一个网络化分布式控制系统当中亟待解决的关键问题。现有的多刚体系统分布式控制协议大多尚未考虑网络通信资源的有效利用,使用的是连续时间的通信协议。区别于连续时间的分布式控制协议,基于事件驱动采样机制的分布式控制协议摒弃了连续数据采样和通信的要求,通过人为设计的非周期采样时刻来减少控制动作的更新次数以及信息传输次数,因此大大提高了资源的利用效率[5]。基于事件驱动的采样控制方式在多智能体领域中受到了广泛关注,然而,现有的文献结果大多是考虑了简单的智能体动态模型[6]。考虑到刚体运动学的非欧性,动力学模型的非线性以及强耦合性,给基于事件驱动的多刚体分布式控制协议设计和分析带来了困难。
 
       基于上述分析,本文主要介绍基于事件驱动的多刚体系统分布式协同控制方面研究的相关成果,包括在事件驱动下的姿态同步控制和欧拉-拉格朗日系统协同控制,最后,给出了对多刚体协同控制研究内容进行总结并对未来的研究内容作了一些展望。
 
2 欧拉-拉格朗日系统协同控制
 
       欧拉-拉格朗日系统是从能量的角度来对刚体动力学进行描述的数学模型。当对刚体本身建立坐标系和进行受力分析十分困难时,如机械臂这类对象,则可以用欧拉-拉格朗日方程来建模其动力学。此外,实际中的刚体对象往往存在物理参数的不确定性问题,例如机械臂的惯量和质量信息一般会随着末端抓取对象的改变而改变,多机器人系统的物理参数大多都异质的并且实际中也会发生变化。这些不确定的物理参数在协同控制的设计当中如果不加以考虑,往往会导致协同控制的失败。另一方面,由于欧拉-拉格朗日系统固有的非线性动力学和处理采样数据机制方面的困难, 仅有很少的文献关注解决基于事件驱动的欧拉-拉格朗日系统协同控制问题。需要指出的是,针对欧拉-拉格朗日系统动力学的智能体,由于存在刚体非线性动力学与网络通信拓扑之间的耦合,设计事件驱动协议和条件是一项非常有挑战的工作。
 
2.1 欧拉-拉格朗日动力学模型

欧拉-拉格朗日方程是建立在拉格朗日分析力学上的动力学方程,是牛顿-欧拉方程的推广。欧拉-拉格朗日方程基于更一般的广义位置、速度和加速度,不依赖坐标系的选取。考虑个欧拉-拉格朗日系统组成的多刚体系统如下

其中

表示广义坐标, 表示控制力矩,表示惯性矩阵, 表示离心力/科式力向量, 表示重力向量。针对欧拉-拉格朗日模型(1), 有下列三个重要的性质[7]:

P.1    矩阵 具有反对称性。

P.2    惯性矩阵 是对称正定矩阵, 且满足 , 其中 和 是两个正常数, 离心力/科氏力矩阵范数满足 , 其中是一个正常数。重力向量满足, 其中是正常数。

P.3    对于任意向量, 存在一个线性回归矩阵,  满足 , 其中 是描述欧拉-拉格朗日系统物理参数的向量。

2.2 基于事件驱动的欧拉-拉格朗日系统编队控制

多刚体系统的编队控制问题在多无人机编队,机械臂的协同控制等都有着广泛应用。然而现有的多智能体编队控制研究大多采用二阶积分器模型,难以反映刚体模型的非线性动力学特性[8,9]。基于模型(1),多刚体系统的编队控制问题在于寻找一个分布式编队协议
 

和一个事件驱动条件,使得所有的刚体位置能形成一个给定的理想编队队形。

图片

图 1:编队队形向量示意图

该理想队形用一个时变向量表示。为了设计这样一个时变编队控制协议,首先给定参考速度信号如下,

其中

是每个刚体的期望速度估计。由于最后形成的编队可能是时变的,因此需要对刚体的期望速度进行估计。

上式中的

分别表示刚体的触发时刻,是两个正参数增益。基于(3)和(4),定义滑模变量,可以设计协同控制律如下

其中(5})的第一项是基于模型(1)的线性回归,第二项是误差反馈。参数

是欧拉-拉格朗日系统的不确定物理参数向量的估计,(6)是对不确定参数的自适应估计。

此外,为了确定每个刚体的触发时刻,给出如下的事件驱动条件。首先定义和。对于智能体来说,假定触发时刻,且定义 。则下一次触发时刻可由下式确定

其中

 和是两个需要在证明中进一步确定的正实数,函数 是一个正函数满足  当 。根据(7)可知,为了实现基于事件驱动的编队控制,每个智能体可以选择不同的门限函数。从而可以看出所设计的事件驱动条件(7)的灵活性。此外,门限函数是用来排除事件驱动机制的奇诺现象问题。需要注意的是,每个智能体在检查判断事件驱动条件(7)时,不需要与邻居连续的通信。主要由于在事件驱动条件(7)中,智能体仅仅需要知道自己的状态信息,即位置信息和速度信息。

通过建立四旋翼无人机的欧拉-拉格朗日模型,编队控制协议(5),(6)和事件驱动条件(7)可以用来实现四旋翼无人机的编队控制[10]。基于内外环的级联控制策略,将PD控制算法应用于高频的姿态控制,而将事件驱动编队控制协议应用于外环的位置控制,可以设计针对四旋翼飞行器的编队控制算法。通过GPS和Xbee通信模块,四旋翼无人机的编队实验结果如下图所示。

图片

图2 四旋翼无人机的编队控制

2.3 欧拉-拉格朗日系统的有限时间事件驱动协同控制

由于在对抗不确定性和干扰方面的良好性质,最近关于有限时间稳定性的研究得到了广泛关注。大多数文献都是基于不连续的控制策略和非光滑分析[11]。文献[12]通过终端滑模的控制方法,研究了网络化的多欧拉-拉格朗日系统的有限时间一致性问题。在文献[13]中,基于一种非光滑的滑模面技术,对网络化的欧拉-拉格朗日系统的有限时间编队控制问题进行了研究。尽管如此,上述提到的基于滑模控制的多欧拉-拉格朗日系统有限时间一致性结果 主要的局限性在于由不连续的符号函数所造成的抖振现象。为了解决这个问题,连续的螺旋算法是可行的方法之一[13]。基于高阶滑模系统和齐次性的方法,基于螺旋控制的方法可以产生连续的控制信号,还具有包括有限时间收敛和对外部干扰的抑制等优势。然而,大多数螺旋控制算法仅仅针对简单的线性积分器系统,其结果不能直接运用到多智能体系统当中。此外,鉴于欧拉-拉格朗日系统的本质非线性,怎样使用螺旋滑模技术实现欧拉-拉格朗日系统的有限时间一致和抗外界干扰是一个很有挑战的问题。

考虑由个智能体组成的多欧拉-拉格朗日系统如下式,

其中,

 表示外部扰动向量满足 和, 其中 是扰动的上界和扰动的导数上界。对于有限时间一致性问题,即找到一个控制力矩输入,使得欧拉-拉格朗日系统的状态在有限时间内趋于一致。

首先,通过设计如下基于事件驱动的有限时间一致性协议,

使得每个刚体的中间变量在有限时间内趋于一致。其中 

 是针对每个拉格朗日系统设计的中间变量,满足 是基于自适应律 (10)更新的自适应分布式增益。,  是满足 的常数, 是之后需要确定的正参数。协议的增益自适应律 (10)的提出受到了在完全分布式自适应事件驱动一致性协议研究的启发。为了避免在一致性协议的设计当中使用到拓扑的全局信息,例如拓扑图拉普拉斯矩阵的特征值等。这在通信拓扑的规模变大的时候是很难实现的。

此外,为了确定触发时刻,对于智能体,定义协同测量误差和动态变量 为

其中

 和 是在后面证明中的确定的正常数。对于第个智能体,事件驱动时刻 由下面的事件驱动条件确定,

其中

 

是一个正常数。在上述有限时间协议和事件触发条件的作用下,可以证明会在有限时间内趋于一致。根据上述结果,基于螺旋滑模控制的有限时间一致性算法如下。

首先,同样引入滑模辅助变量

其中

 是一个正增益, 是一个常数满足。然后,控制力矩可设计如下, 当 ,其中 和是待确定的正常数。当,

其中

是待确定的正增益参数。文献[14]证明了控制算法(16)能实现欧拉-拉格朗日系统的有限时间一致。文献[14,10]中的控制协议设计都是建立在欧拉-拉格朗日系统模型信息已知的基础上设计的,然而实际条件下会存在模型信息未知的情况。文献[15]基于强化学习策略,研究了模型信息未知下多刚体系统的最优一致性问题。设计了基于事件驱动的策略迭代算法,得到了多刚体系统的最优一致性协议。

3 多刚体系统的姿态同步

多刚体的姿态同步主要在航空航天领域的有着广泛应用。例如美国宇航局的达尔文计划, 需要将多个深空干涉仪将组成姿态一致的编队来完成深空探测任务[16]。另一方面, 由于姿态的表征空间是一个非欧氏空间, 使得多刚体系统的同步协议设计和理论分析变得十分困难。

3.1 刚体姿态表征及其运动学

表示世界坐标系,,  表示刚体的局部坐标系。每个刚体的姿态相对于世界坐标系 可表示为一个三维旋转矩阵, 其中。

令I表示世界坐标系,Fi,i=1,...,N表示刚体i的局部坐标系。每个刚体的姿态相对于世界坐标系I可表示为一个三维旋转矩阵RiSO(3),其中SO(3)={R∈R3×3:RR=I3,det(R)=1}。

Br(I3)={RiSO(3):d(Ri,I3)<r}表示局部覆盖半径为rSO(3),其中d(Ri,I3)示旋转矩阵Ri和单位矩阵I3SO(3)上的黎曼距离。开球Br(0)={xiR3:xi<r}R3中的开子集。值得一提的是,如果r=π,Br(I3)可几乎全局覆盖SO(3)。且Bπ(I3)SO(3)上的最大凸集[17]。任何局部姿态表征可以被定义为一个微分同胚映射f:Br(I3)  π(03),表示为f(Ri)=g(θi)ui,其中g:(r,r)R是一个增函数[17]。在集合Bπ(I3)

图片

图 3:刚体世界坐标系和局部坐标系

 

对应于旋转矩阵Ri的旋转向量u和旋转角度θi可用对数映射计算

 

下表列举了一些现有文献常用的局部姿态表征方法和对应的微分同胚映射。令wi表示机体

 

坐标系

f=g(θ)u

r

r

映射

轴角

g(θ=θ

π

π

对数映射

罗德里格斯参数

g(θ)=tan(θ)

2

π

+

日晷映射

修正的罗德里格斯参数

g(θ)=tan(θ)

4

π

1

二阶Cayley变换

表 1:局部姿态表征

局部坐标系的角速度向量,并且为需要设计的控制输入。基于旋转矩阵的姿态运动学

其中 

为局部姿态表征,则基于局部姿态表征的运动学可统一写为

其中

 相对于的导数。

3.2 基于事件驱动的姿态同步

现有的姿态同步控制协议都是基于连续时间的控制协议,意味着刚体之间的需要维持高频率的通信。然而,在深空环境中,通信距离遥远,通信环境不可靠,使用基于连续时间通信的分布式协议会带来通信成本高和通信资源浪费等问题。事件驱动控制是一种基于采样数据的控制方式,它只在有限的时刻对控制器进行跟新,因此能大大减少传感器采样的次数。在多刚体系统的协同控制当中,引入事件驱动的采样方式,能有效减少刚体之间的通信次数,从而降低通信成本,缓解通信资源的消耗。然而,由于姿态本身表征的复杂性,运动学的本质非线性,很少有基于事件驱动的姿态同步控制研究结果。

文献[18]基于局部参数化的姿态表征,研究了基于事件驱动的多刚体系统姿态同步问题。假设个刚体组成的多智能体系统,每个刚体的姿态为。刚体可以获得邻居的绝对姿态信息或者相对姿态信息。此外,定义刚体的事件驱动时刻,基于参数化姿态表征的运动学模型(20),事件驱动姿态同步协议可写为


其中

 表示测量函数,分别是刚体和邻居在驱动时刻的绝对姿态。

协议(21)是在绝对姿态测量下的事件驱动姿态同步协议,在相对姿态测量下的姿态同步协议可表示为

其中

是刚体在驱动时刻与邻居的相对姿态。为了确定刚体的事件驱动时刻,需要设计事件驱动条件

其中,

表示采样的测量误差,是驱动条件的门限函数。基于事件驱动的姿态同步协同控制框图如图4所示。

 

图片

图 4:基于事件驱动的姿态同步协同控制框图

同控制图如图4所示。

首先,在绝对姿态的测量下,文献[19]给出的姿态同步协议如下

其中

是刚体姿态的日晷映射投影。

图片

 

图 5:日晷投影

事件驱动的条件设计为

 

其中 , 

是待定的正参数。

通过日晷投影,上的姿态被一一映射到欧式平面上。

对于相对姿态的情况,文献[18]给出了事件驱动姿态同步协议如下

基于相对姿态,定义采样测量误差向量为

为了尽可能减小事件触发的次数,文献[18]结合了基于动态变量的事件触发条件,

其中

动态变量定义为

其中

, 

结合事件驱动姿态同步协议(26)和条件(28),文献[18]给出了在局部姿态空间内的姿态同步结果。

进一步的,文献[19],基于指数映射研究了具有固定时间收敛性能的事件驱动姿态同步协议,定量分析了事件触发间隔与收敛速率之间的关系。基于逻辑变量和事件触发的混合策略,[20]研究了信息物理环境下多刚体网络的全局姿态同步问题。设计的基于四元数和逻辑变量的混合控制策略是为了克服无界紧流形上的拓扑约束,其中二进制逻辑变量可以根据相邻刚体的相对测量来确定转矩方向,进而实现姿态的全局同步控制。事件触发条件中,结合二进制逻辑变量的重置来产生离散的通信时刻,而且分布式触发策略使得在这些离散时刻只有控制输入的相应部分被更新,大大节省了通讯和计算资源。在刚体动力学知识完备的前提下,同时考虑不确定性和外部扰动,并且分别分析了标准情况和鲁棒情况。

4 小结

多刚体系统的协同控制研究无论是在理论上还是在实际上都有着十分重要的研究意义。本文从两类不同的刚体动力学模型基础上,介绍了基于事件驱动的多刚体系统协同控制的主要研究成果以及研究方法。论文的主要作者为华东理工大学博士后金鑫和唐漾教授,研究工作还得到了国家高层次人才计划、国家自然科学基金、上海市优秀学术带头人计划的资金支持。

参考文献

[1] R. Olfati-Saber, J. A. Fax, and R. M. Murray, “Consensus and cooperation in networked multi-agent systems,” Proceedings of the IEEE, vol. 95, no. 1, pp. 215–233, 2007.

[2] W. Ren and Y. Cao, Distributed coordination of multi-agent networks: emergent problems, models, and issues.      Springer, 2011, vol.  1.

[3] R. Featherstone, “Robot dynamics algorithms,” Annexe Thesis Digitisation Project 2016 Block 5, 1984.

[4]  N. A. Chaturvedi, A. K. Sanyal, and N. H. McClamroch, “Rigid-body attitude   control,”IEEE Control Systems Magazine, vol. 31, no. 3, pp. 30–51, 2011. 

[5] C. Nowzari, E. Garcia, and J. Cort´es, “Event-triggered communication and control of networked systems for multi-agent consensus,” Automatica, vol. 105, pp. 1–27, 2019.

[6] D. V. Dimarogonas, E. Frazzoli, and K. H. Johansson, “Distributed event-triggered control for multi-agent systems,” IEEE Transactions on Automatic Control, vol. 57, no. 5, pp. 1291–1297, 2011.

[7] H. Wang, “Flocking of networked uncertain euler–lagrange systems on directed  graphs,”Automatica, vol. 49, no. 9, pp. 2774–2779,  2013. 

[8] X. Dong and G. Hu, “Time-varying formation tracking for linear multiagent systems with multiple leaders,” IEEE Transactions on Automatic Control, vol. 62, no. 7, pp. 3658–3664, 2017.

[9] S. Zuo, Y. Song, F. L. Lewis, and A. Davoudi, “Time-varying output formation con- tainment of general linear homogeneous and heterogeneous multiagent systems,” IEEE Transactions on Control of Network Systems, vol. 6, no. 2, pp. 537–548, 2018.

[10] X. Jin, Y. Tang, Y. Shi, W. Zhang, and W. Du, “Event-triggered formation control for a class of uncertain euler-lagrange systems: Theory and experiment,” IEEE Transactions on Control Systems Technology, 2021.

[11] J. Cort´es, “Finite-time convergent gradient flows with applications to motion coordina- tion,” Automatica, 2005.

[12] Z. Meng, W. Ren, and Z. You, “Distributed finite-time attitude containment control for multiple rigid bodies,” Automatica, vol. 46, no. 12, pp. 2092–2099, 2010.

[13] M. Ghasemi and S. G.Nersesov, “Finite-time coordination in multiagent systems using sliding mode control approach,” Automatica, vol. 50, no. 4, pp. 1209–1216, 2014.

[14] X. Jin, W. Du, W. He, L. Kocarev, Y. Tang, and J. Kurths, “Twisting-based finite-time consensus for euler–lagrange systems with an event-triggered strategy,” IEEE Transac- tions on Network Science and Engineering, vol. 7, no. 3, pp. 1007–1018, 2019.

[15] S. Wang, X. Jin, S. Mao, A. V. Vasilakos, and Y. Tang, “Model-free event-triggered op- timal consensus control of multiple euler-lagrange systems via reinforcement learning,” IEEE Transactions on Network Science and Engineering, vol. 8, no. 1, pp. 246–258, 2020.

[16] D. Izzo and L. Pettazzi, “Equilibrium shaping: distributed motion planning for satellite swarm,” in Proc. 8th Intern. Symp. on Artificial Intelligence, Robotics and  Automation in space, vol. 25.    Citeseer, 2005.

[17] J. Thunberg, J. Goncalves, and X. Hu, “Consensus and formation control on se (3) for switching topologies,” Automatica, vol. 66, pp. 109–121, 2016.

[18] X. Jin, Y. Shi, Y. Tang, and X. Wu, “Event-triggered attitude consensus with  absolute and relative attitude measurements,” Automatica, vol. 122, p. 109245, 2020.

[19] X. Jin, Y. Shi, Y. Tang, H. Werner, and J. Kurths, “Event-triggered fixed-time attitude consensus with fixed and switching topologies,” IEEE Transactions on Automatic Con- trol, 2021.

[20] D. Zhang, Y. Tang, X. Jin, and J. Kurths, “Quaternion-based attitude synchronization with event-based communication strategy,” IEEE Transactions on Circuits and Systems I: Regular Papers, 2021.