IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

切换拓扑下动态事件触发多智能体系统固定时间一致性

已有 1471 次阅读 2023-7-5 15:57 |系统分类:博客资讯

引用本文

 

孙梦薇, 任璐, 刘剑, 孙长银. 切换拓扑下动态事件触发多智能体系统固定时间一致性. 自动化学报, 2023, 49(6): 12951305 doi: 10.16383/j.aas.c211123

Sun Meng-Wei, Ren Lu, Liu Jian, Sun Chang-Yin. Dynamic event-triggered fixed-time consensus control of multi-agent systems under switching topologies. Acta Automatica Sinica, 2023, 49(6): 12951305 doi: 10.16383/j.aas.c211123

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c211123

 

关键词

 

多智能体系统,固定时间一致性,动态事件触发控制,切换拓扑 

 

摘要

 

针对有扰动的一阶非线性多智能体系统在切换拓扑下的实际固定时间平均一致性问题, 提出了基于动态事件触发机制的固定时间一致性协议. 该一致性协议在节约更多资源的情况下, 使多智能体系统以更快的速度达到一致. 相对于有限时间一致性控制算法, 固定时间一致性控制算法的收敛时间不依赖于初始状态, 并且可以通过选择合适的控制器参数设定相应的收敛时间上界. 通过设计一个包含双曲正切函数的测量误差, 证明系统不存在Zeno行为. 由于内部动态变量的引入, 大量不必要的触发被取消, 从而节省能量损耗. 最后, 通过仿真实验验证算法的可行性和有效性.

 

文章导读

 

近年来, 多智能体系统协同控制问题吸引了大量的关注, 其在机器人编队、智能电网等实际系统中都有广泛的应用. 一致性问题作为协同控制问题的基础, 得到了深度的探讨. 多智能体系统的一致性问题的主要任务是设计控制器, 通常称为一致性协议, 使系统中所有的智能体趋于一个相同的状态. 类似地, 平均一致性问题是通过设计一致性协议使所有智能体的状态趋于它们初始状态的平均值.

 

收敛速度是衡量一个控制器性能的重要标准, 过去针对多智能体系统一致性控制问题的研究多数是建立在渐近一致的基础上的[6-11], 即收敛时间是无穷大的. 文献[10]研究高阶非线性多智能体系统的一致性追踪问题, 设计了一个鲁棒的最小复杂度控制率. 文献[11]针对高阶严格反馈形式的异构多智能体系统, 提出了一个新的分布式输出反馈控制算法, 在减少通讯负担和简化算法的情况下, 使系统在预设的稳态和瞬态性能下实现一致. 在实际应用中, 无限的收敛时间往往不能满足要求. 因此, 研究者们提出了有限时间一致性[12-15]. 在文献[12], 作者首次研究了一阶多智能体系统的有限时间一致性问题. 文献[13]通过使用符号函数和分数阶函数对一阶积分器系统设计了一个分布式的有限时间控制器. 文献[14]通过非奇异终端滑模控制, 针对扰动有界的二阶多智能体系统设计了能在有限时间内收敛的一致性跟踪算法. 文献[15]针对时变的通讯拓扑, 设计了分布式一致性协议.

 

尽管如此, 上述有限时间一致性算法对收敛时间上界的估计依赖初始条件, 多智能体间的初始状态相差越大, 收敛时间越长. 并且, 对于实际系统, 往往不能在运行前获得它的初始状态. 因此, 研究者们又提出了固定时间一致性[16-21]. 固定时间一致性的收敛时间不依赖于初始状态, 在实际的应用中有更加现实的意义. 文献[16-17]设计了针对固定拓扑下的一阶多智能体系统的分布式一致性协议. 文献[18]解决了一阶非线性多智能体系统的固定时间一致性追踪问题. 文献[19]针对切换拓扑下的固定时间平均一致性问题展开了研究. 切换拓扑是指多智能体系统的通讯网络是变化的. 在实际应用中, 由于智能体位置的变化、传感器传输距离限制、信号干扰和人为设定等原因, 智能体间的通讯时断时连. 例如, 在几个搭载着最大传输距离为5 m的传感器的智能小车系统中, 最远的两辆小车距离6 m, 无法通讯, 但随着一致性协议的采用, 这两辆小车间的距离缩短到5 m, 通讯连接建立. 文献[20] 通过设计固定时间扰动观测器和引入正弦补偿函数, 解决了含非匹配扰动的二阶多智能体系统的固定时间一致性追踪问题. 文献[21]通过设计固定时间分布式观测器完成高阶积分器多智能体系统的固定时间一致性追踪.

 

然而, 上述的控制算法需要控制器连续更新, 这是建立在有足够的计算资源的假设上的, 往往是不实际的, 特别是当智能体的数量庞大时. 为了解决这一问题, 事件触发机制引起了研究者们的关注. 其原因是它可以在节省大量不必要的通讯和计算资源的同时保证多智能体系统实现一致[22]. 与传统的时间触发机制[23-24]相比, 事件触发机制下的触发取决于一个与系统测量量有关的触发条件, 而不是固定的采样时间. 只有当触发条件满足时, 才对当前的系统状态进行采样并更新控制器, 其他时刻的控制量与它最近一次的触发时刻相同. 文献[25]首先针对一阶系统设计了一个集中式的事件触发一致性协议使多智能体系统可以渐近获得平均一致性, 接着将它扩展到了分布式的控制. 文献[26]对一般线性系统设计一个分布式的事件触发渐近一致性控制协议. 文献[27]将事件触发机制运用到了有限时间稳定上. 文献[28-37]基于事件触发机制实现固定时间一致性. 在文献[28], 作者设计的控制器和事件触发机制可以使一阶多智能体系统实现固定时间一致, 同时设计了一个可以避免连续通讯的触发函数. 文献[29]通过事件触发机制实现了符号图下一阶多智能体系统的固定时间二分一致性. 文献[30]则对二阶多智能体系统, 实现避免连续通讯的事件触发机制下的固定时间一致性. 文献[31]采用了反步法, 对多个子群组成的二阶多智能体系统设计固定时间事件触发一致性策略, 通过设置比例参数, 获得比例一致. 文献[32]针对有扰动的输入时延系统, 提出了一个固定时间事件触发一致性协议. 文献[33]针对带有输入时延的二阶多智能体系统, 通过反步法, 设计了一个令真实速度在固定时间内追踪到虚拟速度的控制器, 从而保证其在事件触发机制下实现实际固定时间一致. 文献[34-35]研究有领导者的情况下的事件触发固定时间一致性控制. 文献[36]解决了带有输入时延的线性多智能体系统的固定时间一致性问题. 针对更为宽松的拓扑条件, 文献[37]通过设计一个新的李雅普诺夫函数 (Lyapunov function), 证明了其提出的控制器和触发机制使切换拓扑下的多智能体系统实现固定时间平均一致.

 

最近, 又有研究者提出了动态事件触发机制[38]. 不同于静态事件触发, 动态事件触发机制不仅取决于系统的状态, 还依赖于一个额外的内部动态变量(Internal dynamic variable). 这个动态变量是时变的且导数具有可调的参数, 所以触发机制会随时间动态地改变, 从而减少触发次数. 文献[39]将动态事件触发机制拓展到了多智能体系统, 证明其可以使多智能体系统以指数形式实现平均一致性. 但是由于只能获得渐近一致, 收敛速度慢, 难以满足实际系统的需求. 因此, 文献[40]在固定时间一致性控制中加入了动态事件触发机制. 上述文献[28-37]中设计的基于事件触发机制的固定时间一致性控制均没有引入动态参数, 因此会引起多余的触发, 造成不必要的能源损耗. 在实际系统中, 由于智能体间的通讯常常会因自身或环境的因素发生改变, 切换拓扑更符合实际. 文献[28-36, 39-40]均没有考虑切换拓扑的情况, 通讯条件不具一般性.

 

针对这些问题, 本文为切换拓扑下含有界扰动的一阶非线性多智能体系统, 设计基于动态事件触发机制的固定时间平均一致性协议. 本文的创新点主要包含以下几点. 1) 本文提出了新的动态事件触发机制, 相比于静态的事件触发[28-37], 它通过引入一个额外的动态变量来随时间调整触发机制, 减少事件触发的次数和能源的损耗. 2) 不同于针对固定拓扑的一致性问题分析[28-36, 39-40], 本文解决了更具一般性的切换拓扑下的固定时间一致性问题. 由于李雅普诺夫函数不再与拉普拉斯矩阵有关, 通过李雅普诺夫稳定性理论和代数图论, 首先证明多智能体系统在固定拓扑下可以实现实际固定时间平均一致, 再将结果扩展到切换拓扑下. 3) 在测量误差中用双曲正切函数取代符号函数, 利用其可导性证明不存在Zeno行为. 就作者所知, 目前研究切换拓扑下基于动态事件触发的非线性多智能体系统固定时间一致性的结果是极少的. 最后, 通过仿真实例验证所提供的控制器和触发机制在收敛时间和节约资源方面的优越性.

 1  多智能体系统的切换拓扑

 2  多智能体系统动态事件触发下的系统状态变化、触发时刻、动态变量变化

 3  多智能体系统动态事件触发机制下的误差变化

 

本文提出了一个可以在切换拓扑下实现多智能体系统实际固定时间平均一致性的基于动态事件触发机制的控制协议, 并通过李雅普诺夫稳定性理论证明了它的有效性. 同时, 通过证明连续的两个触发时刻的时间差大于一个正数, 说明不存在Zeno行为. 未来的工作包括将固定时间动态事件触发机制拓展到高阶的多智能体系统中.

 

作者简介

 

孙梦薇

安徽大学物质科学与信息技术研究院博士研究生. 主要研究方向为多智能体系统, 固定时间控制和事件触发控制. E-mail: q21101014@stu.ahu.edu.cn

 

任璐

安徽大学人工智能学院讲师. 2021年获得东南大学控制科学与工程博士学位. 主要研究方向为多智能体系统一致性控制, 复杂动态网络同步. 本文通信作者. E-mail: penny_lu@ahu.edu.cn

 

刘剑

东南大学自动化学院副研究员. 分别于2015, 2020年获得北京科技大学学士和博士学位. 主要研究方向为多智能体系统, 非线性控制, 事件触发控制和固定时间控制. E-mail: bkliujian@163.com

 

孙长银

东南大学自动化学院教授. 1996年获得四川大学应用数学专业理学学士学位. 分别于2001, 2004年获得东南大学电子工程专业硕士和博士学位. 主要研究方向为智能控制, 飞行器控制, 模式识别和优化理论. E-mail: cysun@seu.edu.cn



https://blog.sciencenet.cn/blog-3291369-1394151.html

上一篇:一种空间几何角度最大化的随机增量学习模型及应用
下一篇:智能电网虚假数据注入攻击弹性防御策略的拓扑优化
收藏 IP: 222.131.247.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-22 18:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部