|
引用文本
刘成菊, 耿烷东, 张长柱, 陈启军. 基于自学习中枢模式发生器的仿人机器人适应性行走控制. 自动化学报, 2021, 47(9): 2170−2181 doi: 10.16383/j.aas.c190087
Liu Cheng-Ju, Geng Wan-Dong, Zhang Chang-Zhu, Chen Qi-Jun. Adaptive locomotion control of humanoid robot based on self-learning CPG. Acta Automatica Sinica, 2021, 47(9): 2170−2181 doi: 10.16383/j.aas.c190087
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190087
关键词
仿人机器人,自学习中枢模式发生器,适应性行走,轨迹生成
摘要
为了克服传统中枢模式发生器(Central pattern generator, CPG)关节空间控制方法的复杂性和局限性, 本文基于自学习中枢模式发生器模型, 提出了一套在线调制和融合多传感器信息的仿人机器人环境自适应行走控制方法.算法难点在于如何在机器人的工作空间将自学习CPG用于工作空间轨迹生成, 并使CPG参数直接和步态模式相关联.本文提出了利用自学习CPG来学习和实时生成机器人质心轨迹和脚掌轨迹的方法, 在线调节机器人步长、抬腿高度和步行速度等关键参数.参考生物反射行为, 利用传感反馈信息激发CPG以产生具有环境适应性的工作空间轨迹, 提升行走质量. 控制系统的参数通过优化算法来进一步改善行走性能.相比于传统的CPG关节空间法, 本文所采用的自学习CPG工作空间法不仅极大简化了CPG网络结构而且提高了仿人机器人行走的适应性.最后, 通过仿人机器人坡面适应性行走的仿真和实验, 验证了所提出控制策略的可行性和有效性.
文章导读
仿人机器人具有双手、双足、躯干等人类外形特征, 无需改造就能适应人类日常环境和使用工具, 更容易成为辅助人类生活、工作和完成危险作业的帮手, 因此可认为是下一代服务机器人最典型、最友好的本体特征. 行走控制是仿人机器人的基础科学问题, 但仿人机器人自由度多、传感器多, 是一个不稳定的非线性强耦合动力学系统, 行走的自然性、环境适应性、突发环境变化时的平衡控制是长期困扰仿人机器人发展和应用的难题. 目前, 行走控制方法主要基于编程作业机制, 使得仿人机器人的本体特性不能得到充分的发挥[1].普遍采用的基于零力矩点(Zero moment point, ZMP)的步行控制方法[2-7], 允许机器人按照预先设计的轨迹行走并保持平衡, 但是由于预先设计的轨迹是固定的, 一旦地形发生变化, 则机器人无法完成行走任务. 对于机器人的环境适应性行走控制, 需要具有自适应产生轨迹的能力.
改变传统的思维模式, 研究和抽象生物的行走机理并加以模仿, 可能是突破机器人行走控制瓶颈的有效途径. 该思想也引起相关学者的广泛关注, 其中, 比较著名的方法是基于中枢模式发生器(Central pattern generator, CPG)的生物诱导的机器人行走控制方法[8-13]. 由于其突出的适应性优势已经广泛应用在机器人运动控制中, 特别是在游泳、爬行、多足机器人的运动控制中取得了成功实验效果[14-21]. 然而目前存在的CPG模型基本只能产生正弦或类似正弦的输出, 如Hopf模型[22-23]、Kuramoto模型[24-25]等. 即使存在能够在一定程度上调整输出波形形状的模型, 如Matsuoka模型[26-28], 但是模型参数与输出波形的形状之间没有明确的对应关系, 只能通过试凑法不断地尝试. 并且只能对输出进行简单调整, 无法准确模拟某一特定形状.在Righetti等[29-30]的工作启发下, 我们提出了一种基于快速傅里叶变换的自学习CPG (Self-learning CPG, SL-CPG)模型. 提出的模型可以学习周期性任意形状输入信号, 解决了以往CPG模型输出上的局限性.自学习CPG模型可以通过调整参数在线平稳调整其输出频率和幅值, 为引入传感器信号提供了便利.
另一方面, 如何将CPG模型应用于机器人的节律运动控制是该研究的另一难点问题. 目前CPG机器人生物诱导控制方法应用较多的是关节空间控制法. 通常将一个CPG单元分配给一个自由度, 优化CPG拓扑网络, 生成多维协调信号, 直接控制关节运动实现运动控制. 关节空间方法在爬行、游泳、多足等机器人上取得了突出的研究成果. 但是仿人机器人自由度多、结构复杂, 如果直接将CPG分配到机器人关节空间, 利用CPG之间的相互耦合组成CPG网络, 网络庞大, 参数众多. 一些学者将CPG和进化算法结合来实现仿人机器人的行走控制[31-34], 参数的进化是CPG产生满足要求控制信号的关键, 但参数和CPG网络的输出轨迹的关系并不直观. 部分学者探索在机器人的工作空间来有效利用CPG的适应性[35-41], 取得了不错的实验效果.
基于学者们的前期研究, 我们提出了生物诱导的仿人机器人工作空间行走模型. 本文中, 我们采用自学习CPG模型在线生成仿人机器人质心和脚掌轨迹. 分别利用两组SL-CPG, 通过对示例轨迹的训练学习, 形成可以在线调制的轨迹生成器. 通过传感器测得机器人自身姿态信息作为轨迹发生器的反馈输入, 因此可以根据具体的地面环境适应性调节输出轨迹. 机器人的行走速度、腿的支撑段和摆动段的时间、迈步跨度和抬腿高度等可以实时地调整, 这是实现环境适应性行走的重要前提条件. 基于工作空间的方法大大简化了CPG网络和参数整定, 不需要事先获得地形条件信息, 也不依赖于地形测量的距离传感器信息. 仿人机器人坡面环境适应性行走实验验证了控制系统的有效性.
图 1 自学习CPG模型学习基本过程
图 2 自学习CPG学习结果
图 4 整体控制系统构架
本文采用了4个自学习CPG单元分别对机器人的工作空间轨迹训练学习, 得到质心和脚掌的在线轨迹发生器. 自学习CPG工作空间规划方法, 可以从机器人现有轨迹或人类的行走步态中学习, 并模仿人类的前庭反射, 通过设计多个反馈回路来防止机器人发生打滑和倾覆. 仿真和实体实验以及与传统关节空间法的对照实验, 验证了所采用基于自学习CPG的轨迹学习和生成方法以及自适应行走控制策略的有效性. 本文提出的SL-CPG模型和工作空间轨迹生成方法对足式机器人具有普适性. 下一步将研究反馈控制器的设计以及基于强化学习的参数进化算法, 并结合环境信息实现更为复杂地形及未知外部扰动下的自适应行走控制.
作者简介
耿烷东
同济大学电子与信息工程学院硕士研究生.主要研究方向为仿生技术, 机器人运动控制. E-mail: gengwandong@foxmail.com
张长柱
同济大学电子与信息工程学院副教授.主要研究方向为智能控制, 网络控制系统, 信号处理和自动驾驶. E-mail: zhang_changzhu@tongji.edu.cn
陈启军
同济大学电子与信息工程学院教授.主要研究方向为机器人运动控制, 智能控制, 嵌入式系统. E-mail: qjchen@tongji.edu.cn
LIU Cheng-Ju
Professor at the College of Electronic and Information Engineering, Tongji University. Her research interest covers bionics, robot motion control, and evolutionary computation. Corresponding author of this paper
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 06:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社