博文

基于折扣广义值迭代的智能最优跟踪及应用验证

已有 1072 次阅读 2022-1-24 15:55 |系统分类:博客资讯

王鼎, 赵明明, 哈明鸣, 乔俊飞. 基于折扣广义值迭代的智能最优跟踪及应用验证. 自动化学报, 2022, 48(1): 182−193

(Wang Ding, Zhao Ming-Ming, Ha Ming-Ming, Qiao Jun-Fei. Intelligent optimal tracking with application verifications via discounted generalized value iteration. Acta Automatica Sinica, 2022, 48(1): 182−193)

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210658?viewType=HTML

设计一种基于折扣广义值迭代的智能算法，用于解决一类复杂非线性系统的最优跟踪控制问题。通过选取合适的初始值，值迭代过程中的代价函数将以单调递减的形式收敛到最优代价函数。基于单调递减的值迭代算法，在不同折扣因子的作用下，讨论了迭代跟踪控制律的可容许性和误差系统的渐近稳定性。为了促进算法的实现，建立一个数据驱动的模型网络用于学习系统动态信息，同时构造评判网络和执行网络用于近似迭代代价函数和计算迭代跟踪控制律。值得注意的是，我们提出了新颖的停止准则来保证迭代跟踪控制律的有效性。这种停止准则包含两个条件，一个条件用来保证迭代跟踪控制律的可用性，这有利于评估误差系统的渐近稳定性；而另一个条件用来确保跟踪控制律的近似最优性。最后，通过包括污水处理在内的两个应用实例验证了本文提出的近似最优跟踪控制方法的可行性和有效性。

针对未知非仿射系统的跟踪控制问题，单调递减的代价函数收敛过程如图1所示。当迭代指标时，条件成立，停止准则中的近似最优性条件得到满足。