博文

基于事件触发的强化学习-模型预测控制的电动矿用挖掘机连接筒-斗杆防碰撞控制

已有 502 次阅读 2026-6-15 10:57 |个人分类:文章推荐|系统分类:博客资讯

欢迎订阅期刊出版内容的邮件提醒（TOC目录），第一时间获取最新研究成果。点击下方链接即可轻松订阅，也欢迎转发给感兴趣的学术同仁。

https://www.springer.com/alerts-frontend/subscribe?journalNo=11768

编辑荐语

矿用挖掘机铲斗连接筒与斗杆之间的内部自碰撞问题，在高负载、高频次作业下严重影响设备安全与运行效率。传统算法又难以同时兼顾安全性、自适应性与实时性。北京科技大学工业过程知识自动化教育部重点实验室与太原重型机械集团联合团队提出一种改进强化学习-模型预测控制（RL-MPC）框架：构建神经网络动力学模型，设计基于制动距离的事件触发机制，并引入SAC算法在线自适应调节模型预测控制算法的结构参数。该研究为重型装备内部自碰撞控制提供了一种融合数据驱动学习与模型预测优化的新思路。

Event-triggered RL-MPC for connecting barrel-arm collision avoidance control in an electric-drivenmining excavator （基于事件触发的强化学习-模型预测控制的电动矿用挖掘机连接筒-斗杆防碰撞控制）

作者：Kai Zhang, Yundan Liu, Shuo Niu

机构：1. School of Automation and Electrical Engineering, University of Science and Technology Beijing 2. Key Laboratory of Knowledge Automation for Industrial Processes 3. Taiyuan Heavy Machinery Group Co

引用：Zhang, K., Liu, Y. & Niu, S. Event-triggered RL-MPC for connecting barrel-arm collision avoidance control in an electric-driven mining excavator. Control Theory Technol. (2026). https://doi.org/10.1007/s11768-026-00334-5

全文链接：https://rdcu.be/foezJ

摘要

本文针对电动矿用挖掘机铲斗连接筒与斗杆之间的内部自碰撞问题，提出一种基于分层事件触发的强化学习-模型预测控制分层框架。首先，构建嵌入执行器约束与物理先验的神经网络动力学模型，实现对铲斗连接筒与斗杆相对距离的精确预测。在此模型基础上，设计基于最小制动距离的事件触发机制，仅在碰撞风险出现时激活MPC安全约束优化，形成选择性激活策略，在保证安全裕度的同时提升计算效率。在此基础上，强化学习层根据系统运行工况在线自适应调节MPC的结构参数（包括权重矩阵、预测时域与控制时域等），使控制器具备对动态环境的在线适应能力。这种集成设计构建了一个闭环分层优化机制，其中强化学习负责提供自适应参数微调，而MPC在事件触发协调下确保约束满足与系统稳定性。仿真实验表明，与传统PID控制和固定参数MPC相比，强化学习-模型预测控制分层框架在安全性、跟踪精度和计算效率方面均具有显著优势。

引言

随着矿山装备向智能化、自主化方向发展，以矿用挖掘机为代表的作业机械在矿山、港口等领域得到了广泛应用。矿用挖掘机在工作过程中，铲斗连接筒与斗杆之间存在复杂的复合运动，内部结构自碰撞风险极高，而操作员在驾驶室内无法直接观察这一盲区。传统的PID控制算法与固定参数MPC算法虽然实现简单，但控制参数通常依赖经验设定，难以适应多变的运行工况，导致控制性能与鲁棒性下降。现有研究多聚焦于外部避障，针对重型装备内部机械结构自碰撞防护的研究仍然较少。针对上述研究瓶颈，本文针对矿用挖掘机的内部自碰撞问题，开展融合强化学习与模型预测控制的研究。

本文核心贡献如下：

1. 针对大型电动矿用挖掘机的内部自碰撞问题，构建事件触发控制框架，并基于执行器变化率约束下的最小制动距离建立触发条件；

2. 引入强化学习机制来自适应调节模型预测控制算法的预测时域、控制时域及权重矩阵等结构参数，从而实现了针对变化运行工况的在线调整；

3. 提出了一种集成神经网络动力学预测、事件触发参考轨迹生成以及强化学习自适应模型预测控制优化的闭环架构，在内部结构约束下确保了安全性、自适应性与实时可行性。

结论

本文针对矿用挖掘机铲斗连接筒与斗杆内部自碰撞问题，提出了一种事件触发的强化学习-模型预测控制（RL-MPC）分层框架，将基于强化学习的参数自适应与基于模型预测控制的轨迹优化有机融合，并通过基于最小制动距离的事件触发机制在临近安全临界状态时激活优化控制。框架中嵌入神经网络预测模型，以有效应对系统的非线性动力学特征与执行器约束。仿真结果表明，与传统PID和固定参数MPC相比，所提控制器实现了零碰撞、更低的跟踪误差和更平滑的控制动作，验证了该方法在动态高负载环境下保障安全与精度的自适应能力与有效性。上述研究进一步证明了融合基于学习的自适应能力与基于模型的优化算法的有效性，为重型挖掘机安全高效的运行提供了一种规范化的解决方案。

作者介绍

Kai Zhang 2009年获山东大学自动化学士学位，2012年获北京科技大学控制科学与工程硕士学位，2016年获德国杜伊斯堡-埃森大学电气工程与信息技术博士学位，现为北京科技大学自动化学院副教授，研究方向为基于数据与知识的复杂工业过程监测、故障诊断及运行状态评估。

Yundan Liu 2024年获北京科技大学自动化学士学位，现为北京科技大学自动化学院硕士研究生，研究方向为复杂工业过程的质量预测与机器控制。

Shuo Niu 2018年获哈尔滨工程大学自动化学士学位，现就职于太原重工股份有限公司技术中心矿山研究所，主要负责矿山机械的电气设计与调试工作。

2024-2025刊期合集（英文）

Volume 23 (February - November 2025)

Issue 4, 2025

Issue 3, 2025 - Special issue on ADRC: New ADRC developments in Ibero-America

Issue 2, 2025

Issue 1, 2025

Volume 22 (February - November 2024)

Issue 4, 2024

Issue 3, 2024 - Special issue on analysis and control of complex systems in honor of the 90th birthday of Professor Huashu Qin

Issue 2, 2024 - Special issue on system identification and estimation

Issue 1, 2024

期刊简介

640 spr.jpg

欢迎扫码进入期刊主页

Control Theory and Technology (CTT), 中文名《控制理论与技术》, 创刊于2003年，原刊名为Journal of Control Theory and Applications，2014年刊名更改为Control Theory and Technology。由华南理工大学与中国科学院数学与系统科学研究院联合主办，主要报道系统控制科学中具有新观念、新思想的理论研究成果及其在各个领域中的应用。目前被 ESCI (JIF 1.5)、EI、Scopus (CiteScore 3.2)、CSCD、INSPEC、ACM 等众多数据库收录, 并于2013–2018年获得两期中国科技期刊国际影响力提升计划项目资助。2017–2021年连续获得“中国最具国际影响力学术期刊”和“中国国际影响力优秀学术期刊”称号，获得广东省高水平科技期刊建设项目I期(2021-2024年)和II期，2022-2025年进入中国科协自动化学科领域高质量科技期刊目录。

官网：https://link.springer.com/journal/11768 (即http://www.springer.com/11768)

https://jcta.ijournals.cn/cta_en/ch/index.aspx

投稿：https://mc03.manuscriptcentral.com/ctt

微信：ControlTheoryTech （欢迎扫码关注期刊微信公众号）