欧拉-拉格朗日方程是建立在拉格朗日分析力学上的动力学方程,是牛顿-欧拉方程的推广。欧拉-拉格朗日方程基于更一般的广义位置、速度和加速度,不依赖坐标系的选取。考虑个欧拉-拉格朗日系统组成的多刚体系统如下
其中
表示广义坐标, 表示控制力矩,表示惯性矩阵, 表示离心力/科式力向量, 表示重力向量。针对欧拉-拉格朗日模型(1), 有下列三个重要的性质[7]:
P.1 矩阵 具有反对称性。
P.2 惯性矩阵 是对称正定矩阵, 且满足 , 其中 和 是两个正常数, 离心力/科氏力矩阵范数满足 , 其中是一个正常数。重力向量满足, 其中是正常数。
P.3 对于任意向量, 存在一个线性回归矩阵, 满足 , 其中 是描述欧拉-拉格朗日系统物理参数的向量。
2.2 基于事件驱动的欧拉-拉格朗日系统编队控制
和一个事件驱动条件,使得所有的刚体位置能形成一个给定的理想编队队形。
图 1:编队队形向量示意图
该理想队形用一个时变向量表示。为了设计这样一个时变编队控制协议,首先给定参考速度信号如下,
其中
是每个刚体的期望速度估计。由于最后形成的编队可能是时变的,因此需要对刚体的期望速度进行估计。
上式中的
和分别表示刚体和的触发时刻,和是两个正参数增益。基于(3)和(4),定义滑模变量,可以设计协同控制律如下
其中(5})的第一项是基于模型(1)的线性回归,第二项是误差反馈。参数
是欧拉-拉格朗日系统的不确定物理参数向量的估计,(6)是对不确定参数的自适应估计。
其中
和是两个需要在证明中进一步确定的正实数,函数 是一个正函数满足 当 。根据(7)可知,为了实现基于事件驱动的编队控制,每个智能体可以选择不同的门限函数。从而可以看出所设计的事件驱动条件(7)的灵活性。此外,门限函数是用来排除事件驱动机制的奇诺现象问题。需要注意的是,每个智能体在检查判断事件驱动条件(7)时,不需要与邻居连续的通信。主要由于在事件驱动条件(7)中,智能体仅仅需要知道自己的状态信息,即位置信息和速度信息。
图2 四旋翼无人机的编队控制
由于在对抗不确定性和干扰方面的良好性质,最近关于有限时间稳定性的研究得到了广泛关注。大多数文献都是基于不连续的控制策略和非光滑分析[11]。文献[12]通过终端滑模的控制方法,研究了网络化的多欧拉-拉格朗日系统的有限时间一致性问题。在文献[13]中,基于一种非光滑的滑模面技术,对网络化的欧拉-拉格朗日系统的有限时间编队控制问题进行了研究。尽管如此,上述提到的基于滑模控制的多欧拉-拉格朗日系统有限时间一致性结果 主要的局限性在于由不连续的符号函数所造成的抖振现象。为了解决这个问题,连续的螺旋算法是可行的方法之一[13]。基于高阶滑模系统和齐次性的方法,基于螺旋控制的方法可以产生连续的控制信号,还具有包括有限时间收敛和对外部干扰的抑制等优势。然而,大多数螺旋控制算法仅仅针对简单的线性积分器系统,其结果不能直接运用到多智能体系统当中。此外,鉴于欧拉-拉格朗日系统的本质非线性,怎样使用螺旋滑模技术实现欧拉-拉格朗日系统的有限时间一致和抗外界干扰是一个很有挑战的问题。
其中,
表示外部扰动向量满足 和, 其中 是扰动的上界和扰动的导数上界。对于有限时间一致性问题,即找到一个控制力矩输入,使得欧拉-拉格朗日系统的状态在有限时间内趋于一致。
首先,通过设计如下基于事件驱动的有限时间一致性协议,
使得每个刚体的中间变量在有限时间内趋于一致。其中
是针对每个拉格朗日系统设计的中间变量,满足, 是基于自适应律 (10)更新的自适应分布式增益。, 是满足 的常数, 是之后需要确定的正参数。协议的增益自适应律 (10)的提出受到了在完全分布式自适应事件驱动一致性协议研究的启发。为了避免在一致性协议的设计当中使用到拓扑的全局信息,例如拓扑图拉普拉斯矩阵的特征值等。这在通信拓扑的规模变大的时候是很难实现的。
此外,为了确定触发时刻,对于智能体,定义协同测量误差和动态变量 为
其中
, , 和 是在后面证明中的确定的正常数。对于第个智能体,事件驱动时刻 由下面的事件驱动条件确定,
是一个正常数。在上述有限时间协议和事件触发条件的作用下,可以证明会在有限时间内趋于一致。根据上述结果,基于螺旋滑模控制的有限时间一致性算法如下。
首先,同样引入滑模辅助变量
其中
是一个正增益, 是一个常数满足。然后,控制力矩可设计如下, 当 ,其中 和是待确定的正常数。当,
其中
和是待确定的正增益参数。文献[14]证明了控制算法(16)能实现欧拉-拉格朗日系统的有限时间一致。文献[14,10]中的控制协议设计都是建立在欧拉-拉格朗日系统模型信息已知的基础上设计的,然而实际条件下会存在模型信息未知的情况。文献[15]基于强化学习策略,研究了模型信息未知下多刚体系统的最优一致性问题。设计了基于事件驱动的策略迭代算法,得到了多刚体系统的最优一致性协议。
令I表示世界坐标系,Fi,i=1,...,N表示刚体i的局部坐标系。每个刚体的姿态相对于世界坐标系I可表示为一个三维旋转矩阵Ri∈SO(3),其中SO(3)={R∈R3×3:R⊤R=I3,det(R)=1}。
令Br(I3)={Ri∈SO(3):d(Ri,I3)<r}表示局部覆盖半径为r的SO(3),其中d(Ri,I3)表示旋转矩阵Ri和单位矩阵I3在SO(3)上的黎曼距离。开球Br′(0)={xi∈R3:∥xi∥<r′}表示R3中的开子集。值得一提的是,如果r=π,Br(I3)可几乎全局覆盖SO(3)。且Bπ(I3)是SO(3)上的最大凸集[17]。任何局部姿态表征可以被定义为一个微分同胚映射f:Br(I3)→ π(03),表示为f(Ri)=g(θi)ui,其中g:(−r,r)→R是一个增函数[17]。在集合Bπ(I3)中,
图 3:刚体世界坐标系和局部坐标系
对应于旋转矩阵Ri的旋转向量ui 和旋转角度θi可用对数映射计算
下表列举了一些现有文献常用的局部姿态表征方法和对应的微分同胚映射。令wi表示机体
坐标系 |
f=g(θ)u |
r |
r′ |
映射 |
轴角 |
g(θ) =θ |
π |
π |
对数映射 |
罗德里格斯参数 |
g(θ)=tan(θ) 2 |
π |
+∞ |
日晷映射 |
修正的罗德里格斯参数 |
g(θ)=tan(θ) 4 |
π |
1 |
二阶Cayley变换 |
表 1:局部姿态表征
局部坐标系的角速度向量,并且为需要设计的控制输入。基于旋转矩阵的姿态运动学为
其中
。
令
为局部姿态表征,则基于局部姿态表征的运动学可统一写为
其中
是 相对于的导数。
3.2 基于事件驱动的姿态同步
文献[18]基于局部参数化的姿态表征,研究了基于事件驱动的多刚体系统姿态同步问题。假设个刚体组成的多智能体系统,每个刚体的姿态为。刚体可以获得邻居, 的绝对姿态信息或者相对姿态信息。此外,定义刚体的事件驱动时刻,基于参数化姿态表征的运动学模型(20),事件驱动姿态同步协议可写为
其中
表示测量函数,和分别是刚体和邻居在驱动时刻的绝对姿态。
协议(21)是在绝对姿态测量下的事件驱动姿态同步协议,在相对姿态测量下的姿态同步协议可表示为
其中
是刚体在驱动时刻与邻居的相对姿态。为了确定刚体的事件驱动时刻,需要设计事件驱动条件
其中,
表示采样的测量误差,是驱动条件的门限函数。基于事件驱动的姿态同步协同控制框图如图4所示。
图 4:基于事件驱动的姿态同步协同控制框图
同控制图如图4所示。
首先,在绝对姿态的测量下,文献[19]给出的姿态同步协议如下
其中
是刚体姿态的日晷映射投影。
图 5:日晷投影
事件驱动的条件设计为
其中 ,
是待定的正参数。
通过日晷投影,上的姿态被一一映射到欧式平面上。
对于相对姿态的情况,文献[18]给出了事件驱动姿态同步协议如下
基于相对姿态,定义采样测量误差向量为
为了尽可能减小事件触发的次数,文献[18]结合了基于动态变量的事件触发条件,
其中
。
动态变量定义为
其中
, , , 。
结合事件驱动姿态同步协议(26)和条件(28),文献[18]给出了在局部姿态空间内的姿态同步结果。
多刚体系统的协同控制研究无论是在理论上还是在实际上都有着十分重要的研究意义。本文从两类不同的刚体动力学模型基础上,介绍了基于事件驱动的多刚体系统协同控制的主要研究成果以及研究方法。论文的主要作者为华东理工大学博士后金鑫和唐漾教授,研究工作还得到了国家高层次人才计划、国家自然科学基金、上海市优秀学术带头人计划的资金支持。
[1] R. Olfati-Saber, J. A. Fax, and R. M. Murray, “Consensus and cooperation in networked multi-agent systems,” Proceedings of the IEEE, vol. 95, no. 1, pp. 215–233, 2007.
[2] W. Ren and Y. Cao, Distributed coordination of multi-agent networks: emergent problems, models, and issues. Springer, 2011, vol. 1.
[3] R. Featherstone, “Robot dynamics algorithms,” Annexe Thesis Digitisation Project 2016 Block 5, 1984.
[4] N. A. Chaturvedi, A. K. Sanyal, and N. H. McClamroch, “Rigid-body attitude control,”IEEE Control Systems Magazine, vol. 31, no. 3, pp. 30–51, 2011.
[5] C. Nowzari, E. Garcia, and J. Cort´es, “Event-triggered communication and control of networked systems for multi-agent consensus,” Automatica, vol. 105, pp. 1–27, 2019.
[6] D. V. Dimarogonas, E. Frazzoli, and K. H. Johansson, “Distributed event-triggered control for multi-agent systems,” IEEE Transactions on Automatic Control, vol. 57, no. 5, pp. 1291–1297, 2011.
[7] H. Wang, “Flocking of networked uncertain euler–lagrange systems on directed graphs,”Automatica, vol. 49, no. 9, pp. 2774–2779, 2013.
[8] X. Dong and G. Hu, “Time-varying formation tracking for linear multiagent systems with multiple leaders,” IEEE Transactions on Automatic Control, vol. 62, no. 7, pp. 3658–3664, 2017.
[9] S. Zuo, Y. Song, F. L. Lewis, and A. Davoudi, “Time-varying output formation con- tainment of general linear homogeneous and heterogeneous multiagent systems,” IEEE Transactions on Control of Network Systems, vol. 6, no. 2, pp. 537–548, 2018.
[10] X. Jin, Y. Tang, Y. Shi, W. Zhang, and W. Du, “Event-triggered formation control for a class of uncertain euler-lagrange systems: Theory and experiment,” IEEE Transactions on Control Systems Technology, 2021.
[11] J. Cort´es, “Finite-time convergent gradient flows with applications to motion coordina- tion,” Automatica, 2005.
[12] Z. Meng, W. Ren, and Z. You, “Distributed finite-time attitude containment control for multiple rigid bodies,” Automatica, vol. 46, no. 12, pp. 2092–2099, 2010.
[13] M. Ghasemi and S. G.Nersesov, “Finite-time coordination in multiagent systems using sliding mode control approach,” Automatica, vol. 50, no. 4, pp. 1209–1216, 2014.
[14] X. Jin, W. Du, W. He, L. Kocarev, Y. Tang, and J. Kurths, “Twisting-based finite-time consensus for euler–lagrange systems with an event-triggered strategy,” IEEE Transac- tions on Network Science and Engineering, vol. 7, no. 3, pp. 1007–1018, 2019.
[15] S. Wang, X. Jin, S. Mao, A. V. Vasilakos, and Y. Tang, “Model-free event-triggered op- timal consensus control of multiple euler-lagrange systems via reinforcement learning,” IEEE Transactions on Network Science and Engineering, vol. 8, no. 1, pp. 246–258, 2020.
[16] D. Izzo and L. Pettazzi, “Equilibrium shaping: distributed motion planning for satellite swarm,” in Proc. 8th Intern. Symp. on Artificial Intelligence, Robotics and Automation in space, vol. 25. Citeseer, 2005.
[17] J. Thunberg, J. Goncalves, and X. Hu, “Consensus and formation control on se (3) for switching topologies,” Automatica, vol. 66, pp. 109–121, 2016.
[18] X. Jin, Y. Shi, Y. Tang, and X. Wu, “Event-triggered attitude consensus with absolute and relative attitude measurements,” Automatica, vol. 122, p. 109245, 2020.
[19] X. Jin, Y. Shi, Y. Tang, H. Werner, and J. Kurths, “Event-triggered fixed-time attitude consensus with fixed and switching topologies,” IEEE Transactions on Automatic Con- trol, 2021.
[20] D. Zhang, Y. Tang, X. Jin, and J. Kurths, “Quaternion-based attitude synchronization with event-based communication strategy,” IEEE Transactions on Circuits and Systems I: Regular Papers, 2021.