|
引用本文
马乐乐, 刘向杰, 高福荣. 迭代学习模型预测控制研究现状与挑战. 自动化学报, 2022, 48(6): 1385-1401 doi: 10.16383/j.aas.c210818 Ma Le-Le, Liu Xiang-Jie, Gao Fu-Rong. Status and challenges of iterative learning model predictive control. Acta Automatica Sinica, 2022, 48(6): 1385-1401 doi: 10.16383/j.aas.c210818 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210818?viewType=HTML 文章简介 关键词 迭代学习模型预测控制, 二维预测模型, 控制律迭代优化, 复杂非线性系统, 快速系统, 变工况系统 摘 要 历经20多年的发展, 迭代学习模型预测控制在理论和应用方面都取得了长足的进步. 但由于批次工业过程复杂多样、结构各异、精细化程度较高, 现有的迭代学习模型预测控制理论仍面临着巨大挑战. 本文简要回顾了迭代学习模型预测控制理论的产生及发展, 阐述了二维预测模型、控制律迭代优化及二维稳定性等基本理论问题; 分析了现有方法在理论及应用方面的局限性, 说明了迭代学习模型预测控制在迭代建模、高效优化、变工况适应等方面面临的难点问题, 提出了可行的解决方案. 简要综述了近年来迭代学习模型预测控制理论和应用层面的发展动态, 指出了研究复杂非线性系统、快速系统、变工况系统对进一步完善其理论体系和拓宽其应用前景的意义, 展望了成品质量控制和动态经济控制等重要的未来研究方向. 引 言 在现代智能制造业中, 批次生产方式占据越来越重要的地位, 多用于生产具有高附加值的精细化产品, 广泛分布在化工、冶金等传统重工业领域和生物制药、人工智能、半导体制造等高新工业领域. 批次生产过程通常具有特定的加工顺序, 并通过重复操作批量获得同种产品, 其控制目标通常为在有限时间区间内重复跟踪设定运行轨迹. 批次过程的本质特性明显区别于连续过程, 可以归纳为“多样产品”、“重复运行”、“时段切换”和“变换指标”四个方面. 自上世纪90年代起, 由于产品种类增多、市场需求变化加快导致批次生产方式愈受青睐, 批次过程控制也逐渐成为一项独立的研究课题. 总体来说, 批次过程控制研究历经了连续过程控制方法、迭代学习控制(Iterative learning control, ILC)和迭代学习模型预测控制(Iterative learning model predictive control, ILMPC)三个阶段, 图1显示了其发展历程. 图 1 批次过程控制发展历程 上世纪90年代, 依托于连续过程控制理论的飞速发展, 衍生了第一代批次过程控制技术. 其核心思想是将批次过程视为有限时间内的连续过程, 采用成熟的连续过程控制技术对批次过程进行时域控制, 控制手段从传统的比例−积分(Proportion integration, PI)控制策略逐步发展至模型预测控制(Model predictive control, MPC)、模糊控制、神经网络控制等先进控制方法. 但是连续过程控制方法没有考虑批次过程“多重时变”的特有性质, 难以解决实际批次过程的高精度轨迹跟踪问题. 批次过程的动态变化具有双向性: 沿时间方向, 批次过程的设定值是时变的, 需要在每个采样点跟踪不同的目标值; 沿批次方向, 各批次执行重复的生产任务, 需要利用积累的控制经验不断提高跟踪性能. 这种特殊的控制目标和控制结构激发了众多学者去探索基于迭代学习的批次过程控制方法. 迭代学习控制提出于上世纪80年代, 最早应用于机器人控制. 它对同一轨迹进行重复跟踪, 以前一迭代次序中输出信号与给定目标的偏差修正下一迭代次序的控制信号, 从而逐步提高系统的跟踪性能, 最终实现有限区间上的完全跟踪. ILC的迭代控制结构与批次过程重复操作的特点高度契合, 能够实现批次过程高精度轨迹跟踪的控制目标. 因此, 从上世纪90年代中期开始, ILC在批次过程控制中获得了广泛关注. 韩国学者Lee最早将ILC应用于聚合反应器控制, 采用基于反馈的ILC沿批次更新学习律, 提高系统跟踪精度; 随后, Lee等结合最优学习律, 提出基于二次型指标的Q-ILC (Quadratic-criterion-based ILC, Q-ILC)策略, 显著提高了ILC在批次过程中的学习性能. Lee在发表于Control Engineering Practice的论文中系统综述了ILC应用于批次过程的几种形式, 并集中讨论了实际应用中需要解决的问题. 基于Lee的研究工作, 后人针对批次过程的时滞、参数不确定性、随机干扰等问题, 构造了鲁棒ILC策略; 针对批次过程的初态偏移及变参考轨迹等问题, 提出了改进的自适应ILC策略; 此外, ILC还与模糊规则、神经网络和数据驱动等技术结合, 利用批次过程数据同时实施建模和控制. 基于ILC的控制方法融合了批次过程有限时间重复操作的特点, 沿迭代轴建立了批次间的控制关系, 其产生和发展标志着批次过程控制正式独立于连续过程控制, 形成了适应批次过程特性的迭代控制结构. ILC的应用将批次过程控制从时域引入迭代域, 但是无论是传统连续过程控制方法还是基于ILC的批次过程控制方法, 其控制信号只作用于一个维度. 在时域上, ILC是典型的开环控制, 不具备抗实时干扰能力, 无法保证系统的闭环稳定性和鲁棒性. 根据ILC的控制结构, 当前批次出现的干扰和偏差直到下一批次才能被处理, 导致批次过程的时域跟踪性能下降. 因此, 将ILC算法与成熟的时域控制技术结合成为了批次过程控制研究的新方向. 文献[32-33]尝试将ILC算法与传统比例−积分−微分(Proportion integration differentiation, PID)控制策略结合, 利用ILC沿批次进行设定点迭代学习. 但是PID控制只适用于调节问题, 而批次过程的设定值是时变的, PID控制无法满足批次过程高精度轨迹跟踪的控制要求. MPC能够根据系统模型预测未来的状态及输出, 在当前时刻的滚动时域优化中直接采用时变的设定值轨迹作为目标输出, 因而在轨迹跟踪控制方面具有突出优势. 将ILC与MPC结合不仅能保留ILC的批次学习能力, 同时可以大大提高时域闭环跟踪性能, 由此形成的迭代学习模型预测控制(ILMPC)标志着批次过程控制进入二维(Two-dimensional, 2D)控制时代, 其算法结构如图2所示. ILC根据历史数据以批次为单位更新全区间控制律, MPC在各批次内通过预测未来系统状态和输出进行滚动时域优化获得当前时刻的控制信号. 图 2 迭代学习模型预测控制结构 加拿大学者Bone于1995年在Automatica期刊上首次提出将ILC与广义预测控制(Generalized predictive control, GPC)结合, 利用ILC的学习能力改善GPC在重复性干扰下的控制效果, 形成了ILMPC算法的雏形; 韩国学者Lee于1999年在AIChE Journal发表的论文中结合ILC和模型算法控制(Model algorithm control, MAC)建立了批次模型预测控制(Batch model predictive control, BMPC)策略, 并首次将ILMPC算法应用于间歇反应器控制; 2000年, Lee在IEEE Transactions on Automatic Control期刊上对BMPC的收敛性进行了严格的理论证明, 将ILMPC的理论研究推向新的高度; 文献[39-40]在BMPC的基础上, 令ILC和MPC分别作用于批次方向和时间方向, 形成经典的两段式ILMPC (Two-stage ILMPC)控制架构. 历经20多年的发展, ILMPC已经成为批次过程控制领域的主流方法. 本文将在分析现有成熟的迭代学习模型预测控制理论的基础上, 指出其面临的挑战, 综述该领域的研究动态, 并展望迭代学习模型预测控制的未来研究方向. 本文的结构框架及主要内容如图3所示. 图 3 结构及主要内容 作者简介 马乐乐 华北电力大学控制与计算机工程学院讲师. 2016年于华北电力大学获自动化专业学士学位. 2021年于华北电力大学获控制理论与控制工程专业博士学位. 主要研究方向为迭代学习模型预测控制理论及其应用. E-mail: malele@ncepu.edu.cn 刘向杰 华北电力大学控制与计算机工程学院教授. 1989年获东北大学自控系工业电气自动化专业学士学位. 1997年获东北大学自动化研究中心博士学位. 主要研究方向为先进控制策略在电力生产过程中的应用. 本文通信作者. E-mail: liuxj@ncepu.edu.cn 高福荣 香港科技大学化学与生物分子工程学系讲座教授. 1985年获得中国石油大学自动化专业学士学位. 1989年和1993年在加拿大麦吉尔大学获得硕士和博士学位. 主要研究方向为过程检测与故障诊断, 批次过程控制, 高分子材料加工及优化. E-mail: kefgao@ust.hk 相关文章 [1] 卢静宜, 曹志兴, 高福荣. 批次过程控制——回顾与展望. 自动化学报, 2017, 43(6): 933-943. doi: 10.16383/j.aas.2017.c170131 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c170131?viewType=HTML [2] 陆宁云, 王福利, 高福荣, 王姝. 间歇过程的统计建模与在线监测. 自动化学报, 2006, 32(3): 400-410 http://www.aas.net.cn/article/id/15815?viewType=HTML [3] 赵春晖, 王福利, 姚远, 高福荣. 基于时段的间歇过程统计建模、在线监测及质量预报. 自动化学报, 2010, 36(3): 366-374 doi: 10.3724/SP.J.1004.2010.00366 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00366?viewType=HTML [4] 池荣虎, 侯忠生, 黄彪. 间歇过程最优迭代学习控制的发展:从基于模型到数据驱动. 自动化学报, 2017, 43(6): 917-932. doi: 10.16383/j.aas.2017.c170086 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c170086?viewType=HTML [5] 柴天佑. 复杂工业过程运行优化与反馈控制. 自动化学报, 2013, 39(11): 1744-1757 doi: 10.3724/SP.J.1004.2013.01744 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01744?viewType=HTML [6] 马乐乐, 刘向杰. 非线性快速批次过程高效迭代学习预测函数控制. 自动化学报, 2022, 48(2): 515-530. doi: 10.16383/j.aas.c190621 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190621?viewType=HTML [7] 何德峰, 韩平, 王青松. 有界扰动下约束非线性系统鲁棒经济模型预测控制. 自动化学报, 2022, 48(2): 572-581. doi: 10.16383/j.aas.c190879 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190879?viewType=HTML [8] 马乐乐, 刘向杰. 变参考轨迹下的鲁棒迭代学习模型预测控制. 自动化学报, 2019, 45(10): 1933-1945. doi: 10.16383/j.aas.c180681 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180681?viewType=HTML [9] 杨亚茹, 李少远. 切换非线性系统全局优化运行的经济预测控制. 自动化学报, 2017, 43(6): 1017-1027. doi: 10.16383/j.aas.2017.c170112 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c170112?viewType=HTML [10] 何德峰. 约束非线性系统稳定经济模型预测控制. 自动化学报, 2016, 42(11): 1680-1690. doi: 10.16383/j.aas.2016.c150234 http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150234?viewType=HTML [11] 孙明轩, 李芝乐, 朱胜. 多变量非线性系统的变阶采样迭代学习控制. 自动化学报, 2013, 39(7): 1027-1036. doi: 10.3724/SP.J.1004.2013.01027 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01027?viewType=HTML [12] 吴敏, 陈诗桓, 佘锦华, 何勇, 中野道雄. 基于二维混合模型的改进型重复控制系统保性能设计方法. 自动化学报, 2009, 35(1): 54-64. doi: 10.3724/SP.J.1004.2009.00054 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2009.00054?viewType=HTML [13] 张国银, 杨智, 谭洪舟. 一类非线性系统非切换解析模型预测控制方法研究. 自动化学报, 2008, 34(9): 1148-1157. doi: 10.3724/SP.J.1004.2008.01147 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2008.01147?viewType=HTML [14] 吴敏, 兰永红, 佘锦华. 基于二维混合模型的重复控制系统设计新方法. 自动化学报, 2008, 34(9): 1208-1214. doi: 10.3724/SP.J.1004.2008.01208 http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2008.01208?viewType=HTML [15] 张日东, 王树青, 李平. 基于支持向量机的非线性系统预测控制. 自动化学报, 2007, 33(10): 1066-1073. doi: 10.1360/aas-007-1066 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-1066?viewType=HTML [16] 王洪瑞, 陈志旺, 李建雄. 非线性系统参数自适应直接广义预测控制. 自动化学报, 2007, 33(10): 1110-1114. doi: 10.1360/aas-007-1110 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-1110?viewType=HTML [17] 邹涛, 王昕, 李少远. 基于混合逻辑的非线性系统多模型预测控制. 自动化学报, 2007, 33(2): 188-192. doi: 10.1360/aas-007-0188 http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0188?viewType=HTML [18] 宋召青, 毛剑琴, 戴邵武. 未知相对度非线性系统的一阶D型迭代学习控制. 自动化学报, 2005, 31(4): 555-561. http://www.aas.net.cn/cn/article/id/13325?viewType=HTML [19] 刘山, 吴铁军. 基于小波逼近的非线性系统鲁棒迭代学习控制. 自动化学报, 2004, 30(2): 270-276. http://www.aas.net.cn/cn/article/id/16308?viewType=HTML [20] 李柠, 李少远, 席裕庚. MIMO系统的多模型预测控制. 自动化学报, 2003, 29(4): 516-523. http://www.aas.net.cn/cn/article/id/13921?viewType=HTML [21] 熊智华, 王雄, 徐用懋. 复杂非线性系统的多神经网络预测控制. 自动化学报, 2000, 26(增刊B): 6-10. http://www.aas.net.cn/cn/article/id/16553?viewType=HTML [22] 孙明轩, 黄宝健, 张学智. 非线性系统的PD型迭代学习控制. 自动化学报, 1998, 24(5): 711-714. http://www.aas.net.cn/cn/article/id/16789?viewType=HTML [23] 皮道映, 孙优贤. 离散非线性时变系统开闭环PI型迭代学习控制律及其收敛性. 自动化学报, 1998, 24(5): 636-639. http://www.aas.net.cn/cn/article/id/16822?viewType=HTML [24] 席裕庚, 王凡. 非线性系统预测控制的多模型方法. 自动化学报, 1996, 22(4): 456-461. http://www.aas.net.cn/cn/article/id/17156?viewType=HTML [25] 曾南, 应行仁. 非线性系统迭代学习算法. 自动化学报, 1992, 18(2): 168-176. http://www.aas.net.cn/cn/article/id/14496?viewType=HTML
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-4 04:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社