||
在工业制造、家庭服务以及太空深海探险的领域,双臂机器人以其独特的灵活性和效率,成为人类不可或缺的助手。这些机器人背后的协同控制技术,是机器人学中最具挑战性的课题之一。它们不仅要处理系统的强耦合性和高度非线性,还要应对各种不确定性因素。本期深度综述,我们将带您回顾双臂机器人的辉煌发展历程,深入了解其结构、建模、控制核心,以及在各领域的广泛应用。特别值得一提的是,我们将详细解读双臂机器人协同控制的多种方法,从传统的主从控制、力/位混合控制到前沿的阻抗控制技术,再到基于神经网络、模糊系统和强化学习的智能控制策略。
论文介绍
双臂系统协同控制研究综述: 从经典到基于学习的算法
作者:王东1,邱超超1,贺威2,王伟1
机构:1.大连理工大学 控制科学与工程学院;2.北京科技大学 智能科学与技术学院
引用格式:王东, 邱超超, 贺威, 等. 双臂系统协同控制研究综述: 从经典到基于学习的算法. 控制理论与应用, 2024, 41(11): 1951–1964Citation: WANG Dong, QIU Chaochao, HE Wei, et al. From classic to learning-based algorithms: A survey of cooperative control for dual-arm systems. Control Theory & Applications, 2024, 41(11): 1951–1964DOI: 10.7641/CTA.2023.20586
摘要
双臂系统的协同控制技术在机器人领域发挥重要的作用, 它可以协助人类在工业生产、家庭服务、太空及深海等非结构化环境完成复杂危险的任务。然而,双臂机器人是一个强耦合、高度非线性和不确定性系统, 其协同控制问题是一个具有挑战性的课题。本综述首先回顾了双臂系统的发展历程,其次对该系统的结构、建模、控制及其应用进行介绍。特别地,详细归纳了双臂系统的协同控制方法: 如协同搬运时的主从控制、力/位混合控制和阻抗控制等经典方法、基于神经网络和模糊系统的智能控制方法和基于强化学习的数据驱动方法在机器人控制取得的 最新进展。最后,展望了双臂系统的未来发展趋势。
前言
目前, 双臂协作机器人受到学术界和工业界的广泛关注, 特别是面临非结构化环境带来的挑战时, 其不仅解决了单臂无法或难以满足的智能化需求,而且可以提高工作效率,具有较好人机协作能力。双臂协作通常有3种形式: 1) 利用两个机械臂同时操作一个共同的物体, 如搬运较大动量或较大体积的物体 , 此类为紧耦合协作; 2) 在共享工作空间中顺序操作同一个零件, 如双臂调整零部件姿态; 3) 在共享工作空间中操作不同物体, 以完成特定任务, 如协作倒水、叠衣物等, 后两者为松耦合协作。紧耦合协作关注的是双臂与被抓物体的力控制问题, 而松耦合协作考虑的更多是运动规划与任务规划问题。虽然双臂系统具有广泛的应用场景、更大的灵巧性以及能够完成复杂任务等诸多优势, 但在系统建模及控制器设计的难度也显著增加, 其不仅是两个机械臂的简单组合, 而且需要协调配合, 避免碰撞的同时完成复杂任务。
紧耦合问题中, 双臂的末端执行器与被操作物体形成统一的闭链。因此, 各机械臂之间微小的位置误差也会产生巨大的内力, 对被操作物体及机械臂造成损坏。相比于松耦合问题, 双臂系统的紧耦合控制问题更加困难。20世纪70年代初期, 研究人员就开始了对双臂机器人的研究。这种需求主要源于单臂机器人应用中的限制, 如前文中提到的单臂难以搬运较重或大型物体。人们探寻自然界中的规律发现, 诸多单个 个体无法或难以完成的任务, 由多个个体以合作的方式变得可行。Nakano等人提出了用于双臂协同搬运物体的主从力控制方法, 并指出多机器人协同搬运共同物体时进行力控制的重要性。之后的几年, 随着单臂机器人基础理论的完善,双臂系统也得到了快速发展。Uchiyama等人定义了一个独特的工作空间坐标系统并与力/位混合控制相结合, 成功拓展到双臂机器人。Tarn等人将多个机械臂及被作用物体视为封闭的运动链, 提出了基于反馈线性化和输出同步解耦技术的多臂系统非线性控制算法。通过近期工作, 为双臂系统的应用奠定了较强的理论基础。
传统的双臂系统协同控制方法依赖复杂的运动学和动力学模型, 然而, 由于外界扰动及未知的环境变化, 精确的模型较难获得。随着人工智能的发展, 机器人凭借基于数据驱动的学习方法被赋予了不需要复杂建模和繁琐的人工编程就能执行具体操作的能力, 真正体现出机器人的智能性。2016年, Alpha Go战胜世界围棋冠军李世石, 成为人工智能领域的里程碑事件, 其核心技术深度强化学习受到了广泛关注。近年来, OpenAI Five也利用此技术在Dota2游戏中战胜了人类玩家, 人们开始真正意识到数据驱动方法的能力。从强化学习定义上来看, 强化学习方法非常适合解决机械臂控制问题。机械臂作为智能体, 与未知环境进行交互, 通过定义合适的奖励函数, 最大化未来收益总和, 进而学习期望的策略, 最终输出理想的动作。由于强化学习需要通过不断试错来获得最优的动作, 因此, 在真实环境中训练不仅费时, 而且机械臂长时间运行容易造成设备损坏、采样效率低和安全性等问题, 而在仿真环境进行机械臂的训练是更为廉价、安全、快速的方法。2021年, 谷歌公司将MuJoCo理仿真引擎开源, 这将极大推动基于学习方法的机械臂控制的相关研究。
本综述对双臂系统的热点研究方向进行了分类, 诸如建模、规划、控制、应用等方向, 作为入门本领域的一个参考指南。本文的目的是对双臂系统协同控制及其应用进行及时的回顾和介绍。它旨在为读者提供双臂系统的历史发展, 以及该领域的最新研究进展和成就。本文的其余部分组织如下: 在第2节中, 简要介绍了双臂系统的框架及应用; 第3节主要介绍了双臂系统的建模方法, 包括运动学和动力学建模; 第4节详细介绍了双臂系统的传统控制方法、智能控制方法以及基于强化学习的先进控制技术; 结论和未来的研究方向在第5节给出。

图1 双臂系统示意图

图2 双臂系统控制流程图

图3 不同类型双臂机器人示意图
表1 双臂系统经典控制方法对比

表2 强化学习算法对比

表3 用于训练双臂系统控制策略的软/硬件平台

结论
本综述回顾了双臂系统的最新进展, 尤其是从经典控制算法到学习算法的过渡。随着越来越多低价、安全、可靠的协作机械臂的出现以及人工智能技术在不同领域的应用, 双臂系统的协同控制必将成为一种研究趋势。因此为不同环境, 不同任务, 不同用户进行编程的机械臂控制方式显得繁琐且不可行, 而基于动态交互式的强化学习方法弥补了这种缺陷, 不需要手动编程, 通过不断试错的方式完成某种任务。在策略的学习过程中, 双臂机器人会进行大范围的无效探索, 使得技能学习效率低下, 所以强化学习与模仿学习相结合的方法大大改善了这一现象。
目前, 从事机器人控制的研究团队主要分为两个方向: 一是基于运动学与动力学模型的机器人控制, 如阻抗控制、力/位混合控制、自适应神经网络控制等; 二是基于数据驱动的人工智能方法进行机器人控制, 如模仿学习、强化学习等。经典的机器人理论是控制机器人的基础, 正如Oussama教授和丁汉院士在机器人大会中所提到的, 如果可以获得精确的机器人模型, 就充分利用它。机器人学科没有牢固的基础研究, 很难做到高速高精度。然而, 随着人工智能领域的发展, 似乎可以放弃复杂的机器人动力学模型, 转向一种与环境不断交互的方式完成诸多任务, 这种操作方式赋予了机器人“智能”。但基于学习的机器人控制也存在数据采样和Sim2real迁移困难等问题。未来, 在双臂系统的理论研究方面, 是否可以将机器人模型与强化学习算法结合, 即使仅能获得部分机器人模型, 这也将会比从一个黑盒子开始学习要好的多, 这种有模 型与无模型结合的方法可能会使机器人更快或更好的完成任务。但是如何把机械臂模型的知识“喂给”强化学习是一个悬而未决的问题。总之, 在基础理论研究上, 应尽可能利用当前人工智能的优势, 并与数十年发展起来的机器人学相结合。
在双臂机器人应用方面, 应更多关注其拟人化的构型, 自主双臂机器人不像传统工业机器人, 在无人工厂完成固定任务, 它需要与人类互动, 协助人类, 服务人类。因此, 双臂机器人如何更好地融入人类环境, 如何理解人类的意图是一个值得思考的问题。未来, 双臂系统应更善于完成诸如使用高效任务规划算法的复杂工件装配任务, 利用精准控制技术的双臂协同搬运任务, 结合类脑与认知科学技术的人机协作任务。
作者简介
王 东 博士, 教授, 目前研究方向为多机器人协同控制、分布式优化、切换系统。
邱超超 博士研究生, 目前研究方向为双臂机器人协同控制、强化学习。
贺 威 博士, 教授, 目前研究方向为机器人学、扑翼飞行机器人控制、振动控制和智能控制系统。
王 伟 博士, 教授, 目前研究方向为复杂系统建模、控制与优化、流程工业综合自动化技术。
期刊介绍
《控制理论与应用》(Control Theory & Applications)是经国家科学技术部批准, 教育部主管, 由华南理工大学和中国科学院数学与系统科学研究院联合主办的全国性一级学术刊物, 1984年创刊, 月刊, 国内外公开发行. 《控制理论与应用》是中国科学引文数据库首批统计源期刊之一,中文核心期刊,入选中国精品科技期刊顶尖学术论文F5000项目,中国科协自动化学科领域高质量科技期刊目录以及中国科协百篇优秀科技论文遴选计划,2021年入选广东省高质量科技期刊建设项目,2022-2024年连续获得基金委资助(科技活动专项)。


【收录】
目前被美国《工程索引》(Ei Compendex)、SCOPUS、CSCD、美国的《化学文摘》(CA)、英国《科学文摘》(Inspec)、德国《数学文摘》、俄罗斯《文摘杂志》(AJ)、《日本科学技术振兴机构中国文献数据库》等国内外检索系统收录。
官网:https://jcta.ijournals.cn/cta_cn/ch/index.aspx
知网优先发表:https://navi.cnki.net/knavi/journals/KZLY/detail
投稿:https://jcta.ijournals.cn/cta_cn/ch/author/login.aspx
微信:控制理论与应用
视频号:控制理论与应用
科学网博客:http://blog.sciencenet.cn/u/CTACTT
小红书:控制理论与应用(ID:8742781006)
Email:aukzllyy@scut.edu.cn
Tel:020-8711 1464

欢迎扫码关注控制理论与应用公众号
【2024-2026年期刊合集】
2025年第42卷第11期(“新一代智能优化理论方法与应用暨纪念郑大钟教授诞辰90周年”专刊)
2024年第41卷第7期(“秦化淑教授90寿诞—复杂系统控制理论及其应用”专刊)
2024年第41卷第6期(“数据与模型融合的智能调度优化”专刊)
2024年第41卷第3期(“人工智能驱动的过程工业自动化与智能化”专刊)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-16 23:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社