|
引用本文
王敏, 林梓欣, 王聪, 杨辰光. 基于外环速度补偿的封闭机器人确定学习控制. 自动化学报, 2023, 49(9): 1904−1914 doi: 10.16383/j.aas.c220575
Wang Min, Lin Zi-Xin, Wang Cong, Yang Chen-Guang. Deterministic learning of manipulators with closed architecture based on outer-loop speed compensation control. Acta Automatica Sinica, 2023, 49(9): 1904−1914 doi: 10.16383/j.aas.c220575
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220575
关键词
确定学习,速度补偿控制,神经网络,封闭机器人
摘要
针对未开放力矩控制接口的一类封闭机器人系统, 提出一种基于外环速度补偿的确定学习控制方案. 该控制方案考虑机器人受到未知动力学影响, 且具有未知内环比例积分(Proportional-integral, PI)速度控制器. 首先, 利用宽度径向基函数(Radial basis function, RBF)神经网络对封闭机器人的内部未知动态进行逼近, 设计外环自适应神经网络速度控制指令. 在实现封闭机器人稳定控制的基础上, 结合确定学习理论证明了宽度RBF神经网络的学习能力, 提出基于确定学习的高精度速度控制指令. 该控制方案能够保证被控封闭机器人系统的所有信号最终一致有界且跟踪误差收敛于零的小邻域内. 在所提控制方案中, 通过引入外环补偿控制思想和宽度神经网络动态增量节点方式, 减小了设备计算负荷, 提高了速度控制下机器人的运动性能, 解决了市场上封闭机器人系统难以设计力矩控制的难题, 实现了不同工作任务下的高精度控制. 最后数值系统仿真结果和UR5机器人实验结果验证了该方案的有效性.
文章导读
近年来, 机器人在工程应用和日常生活中发挥着越来越重要的作用, 被广泛应用于空间探测、焊接、装配、医疗等领域, 相关技术也越来越受到科研人员重视[1-3]. 在机器人控制领域, 其控制目标之一就是实现机器人对特定任务轨迹的跟踪. 多自由度机器人作为一个高度耦合的非线性多输入多输出系统[4], 主要控制难点在于机器人工作环境任务多变, 在外界扰动、负载变化、参数测量不精确等因素影响下, 机器人系统精确建模难度较大, 使得比例积分微分(Proportional-integral-derivative, PID)控制等经典控制算法难以满足机器人控制的精度要求. 针对机器人系统存在部分参数不确定或测量不准确的问题, 一些学者结合鲁棒控制、滑模控制等思想, 提出了许多有效的自适应控制算法[5-7]. 当机器人系统存在不可建模动态时, 一些学者结合神经网络的非线性函数逼近特性, 提出了大量的自适应神经网络控制方案, 保证了机器人在多变环境下的高性能控制[8-12].
值得注意的是, 上述控制方案大多数都是基于力矩进行控制器设计, 其方案有效性主要是通过数值系统仿真进行验证, 鲜有在实际机器人上进行实验和应用. 造成上述现象的原因是, 当前市面上大部分工业/商业机器人并不开放力矩接口, 而是采用速度/位置控制. 这些封闭机器人采用标准的内外环控制结构, 其中外环为运动学环, 内环为动力学环, 内环控制的采样速率一般比外环要快得多, 且普遍认为其内环控制使用速度比例积分(Proportional-integral, PI)控制器或位置PID控制器[13]. 封闭机器人的这些性质, 导致用户一般只能对其进行简单的运动学控制[14], 从而使得机器人难以应对多变的个性化产品加工. 针对这类具有内外环结构的机器人的控制问题, 部分学者提出了解决方案. 文献[5, 15]在研究具有未知动力学和未知运动学的机械臂控制时, 提出了适当的自适应控制器. 文献[16]研究了一类具有关节速度反馈内环的机器人任务空间控制问题, 提出了一种基于模型的内环关节速度控制器通用结构[17]. 注意到, 上述控制方案中跟踪误差的收敛依赖于内环速度控制器的修改或再设计, 并不是常见的速度PI控制器或位置PID控制器, 对于具有不可修改内环的工业/商业机器人而言, 这些控制方案也难以实现应用. 进一步, 一些学者提出了预校正方案[18], 这些预校正方案的有效性验证主要是通过直观解释和实验结果进行的, 并没有进行严格理论分析. 针对封闭机器人控制存在的上述问题, 文献[19]在考虑机器人具有可以线性参数化的未知动力学和运动学且内环控制器参数未知和不可修改的背景下, 设计了一类外环自适应速度补偿控制器, 保证了机器人系统的稳定性和误差收敛. 该方案需要计算动力学和运动学回归矩阵, 这两个矩阵随着机械臂关节增多, 计算的复杂度呈指数倍增长. 此外, 实际机器人系统由于受到阻尼以及摩擦力等影响, 存在本质的非线性. 因此, 如何提出简单有效的封闭机器人控制方案, 既能实现封闭力矩的补偿控制, 又能精确建模未知非线性仍是一个开放性的问题.
众所周知, 神经网络是建模未知非线性的有效方法[20]. 然而, 现有的大部分自适应神经网络控制并没有充分利用神经网络的学习能力, 即使是处理相同的任务也需要对神经网络进行重复训练, 该过程耗时长、计算资源消耗大、暂态阶段的控制性能也较差. 因此, 如何实现神经网络在控制过程中的学习和经验知识再利用是一个很有意义的课题[21]. 对此, 文献[22]提出确定学习理论, 解决了神经网络对未知动态的学习问题. 该理论证明了沿着回归轨迹的径向基函数(Radial basis function, RBF)神经网络满足持续激励(Persistent excitation, PE)条件, 进一步结合线性时变系统指数稳定性证明了神经网络权值的精确收敛. 基于该理论, 文献[23]引入动态面技术, 解决了自适应神经网络在严格反馈系统中的学习问题. 近年来, 确定学习理论也已被广泛应用于机器人编队控制[24]、心肌缺血早期诊断[25]、水面无人船控制[26]等领域, 在机械臂控制领域也有相关工作[27]. 然而, 现有基于确定学习的控制方案仍是基于力矩进行设计的, 无法在封闭的工业/商业机器人上直接进行应用.
综上所述, 本文针对未开放力矩接口的一类封闭机器人系统, 在考虑机器人受到未知动力学影响且具有未知内环PI速度控制器的情况下, 基于文献[19]的外环补偿框架提出了一种基于外环速度补偿的确定学习控制方案, 实现了封闭机器人的关节轨迹跟踪控制. 该方案的主要贡献点如下: 1)在文献[19]的工作基础上, 引入神经网络处理系统未知动态, 取消了封闭机器人未知动力学模型参数线性化假设, 并简化了外环补偿控制设计过程; 2)采用宽度RBF神经网络动态增量神经网络节点, 降低了网络结构复杂度, 改善了系统控制的实时性; 3)引入确定学习理论, 实现了宽度RBF神经网络对封闭机器人未知动态的精确学习, 并利用经验知识避免了对网络重复训练, 降低了计算负担, 实现了快稳准的高精度跟踪控制; 4)为确定学习理论应用于具有类似结构的封闭机械系统提供了研究思路, 拓展了确定学习的应用范围.
图 1 封闭机器人控制系统框图
图 2 封闭机器人关节角位置跟踪效果(自适应控制)
图 3 神经网络权值范数
本文针对未开放力矩控制接口的封闭机器人系统, 提出了一种基于外环补偿的自适应神经网络速度控制方案. 与现有大部分自适应神经网络控制方案不同的是, 本文所提方案的控制输入为关节角速度而不是关节力矩, 实现了自适应神经网络控制算法在封闭机器人上的应用, 并通过引入确定学习机制, 充分发挥神经网络的学习能力, 提高了机器人在执行相同或相似任务时的控制性能. 此外, 利用宽度神经网络的动态网络布点方式, 大幅降低了RBF神经网络结构的复杂度, 减小了设备计算负荷, 提高了系统控制实时性. 本文所提控制方案针对的是机器人关节空间控制, 在未来的工作中, 将逐步将其拓展到机器人任务空间控制、阻抗控制等, 提高该控制方案的工程应用价值.
作者简介
王敏
华南理工大学自动化科学与工程学院教授. 主要研究方向为智能控制与学习, 机器人控制和网络控制系统. 本文通信作者. E-mail: auwangmin@scut.edu.cn
林梓欣
华南理工大学自动化科学与工程学院硕士研究生. 主要研究方向为机器人建模与控制. E-mail: 202021017907@mail.scut.edu.cn
王聪
山东大学控制科学与工程学院教授. 主要研究方向为动态环境机器学习与模式识别, 确定学习理论, 基于模式的智能控制, 振动故障诊断及其在医学领域中的应用. E-mail: wangcong@sdu.edu.cn
杨辰光
华南理工大学自动化科学与工程学院教授. 主要研究方向为人机交互和智能系统设计. E-mail: cyang@ieee.org
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 10:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社