博文

《控制理论与应用》2025年第11期目次速览

已有 4913 次阅读 2025-12-16 17:35 |个人分类:刊期目录|系统分类:博客资讯

“新一代智能优化理论方法与应用暨纪念郑大钟教授诞辰90周年”专刊

前言

优化问题无处不在. 智能优化算法是基于计算智能的机制求解复杂问题最优或满意解的方法, 通过对自然与社会系统中相关行为、功能、经验、规则、作用机理的认知, 揭示优化的机理, 凝练优化的机制, 构建优化的框架与模型, 进而在问题特征的导引下设计智能化的优化算法, 力争取得优化性能的“稳、快、准”, 即优化结果的一致性、优化效率的快速性、优化质量的全局性. 智能优化算法的研究内容主要包括算法的设计与实现, 涉及算法原理、机制、框架、参数与操作的设计; 算法的性能分析, 涉及收敛性、收敛速度、有限时间性能、计算复杂性与鲁棒性等; 算法的对比、验证与应用.

随着科学与技术的发展, 工业与社会系统中的优化问题越来越复杂, 呈现出大规模、分布式、多目标、强约束、不确定、强动态等特征, 对优化的质量、效率和一致性要求越来越高, 对优化方法的设计挑战巨大. 如今, 智能优化受到了广泛重视, 已成为自动化、计算机、人工智能、数学、管理科学以及诸多工程学科的重要热点研究方向. 同时, 随着新一代人工智能的快速发展, 深度学习、强化学习等机器学习技术已成为提升优化性能的新途径. 在群体优化的框架内, 通过剖析问题的特征提炼优化知识, 通过解析数据的变化设计优化策略, 通过融合机器学习的方式增强优化能力, 发展知识融合与迁移的、机器学习驱动的、数模双驱协同的新一代智能优化理论与方法, 开展优化范式、机制、收敛性、复杂性、可解释性等理论研究, 并通过多领域的成功工程验证与应用, 推进高效率、高质量、高可靠的新一代智能优化理论与方法的发展.

郑大钟教授是我国著名控制理论学者. 郑大钟教授生前积极倡导青年学者关注控制理论新的前沿方向, 并以身作则, 积极推动复杂系统建模、分析、控制与优化以及与人工智能的交叉融合研究. 本专刊聚焦智能优化与控制的最新理论、方法及应用, 展示相关领域的最新研究成果, 促进学术创新、学科融合、应用推广, 助力“人工智能+”在经济、国防和社会等领域的高质量发展. 自征稿以来, 本专刊迅速引起了诸多领域专家学者的高度关注, 来稿覆盖了多个学科、多个领域、多个行业在理论、方法和应用等方面的研究成果. 经过《控制理论与应用》编辑部严格的审稿流程, 优选录用了27篇高质量稿件, 旨在促进智能优化相关领域的研究与发展. 值此郑大钟教授诞辰90周年之际, 特借此专刊的征集和出版, 纪念他对于推动控制理论发展的重要贡献.

井冈山等从图的视角出发, 对基于学习的网络化系统控制方法进行了系统性梳理, 揭示了图结构在网络化系统控制策略学习中的重要作用, 指出了现存的难题并展望了未来的发展方向. 李岳珩等综述了集中训练分布执行下的多智能体强化学习, 回顾了值函数分解方法和策略梯度方法两大类算法, 总结了算法在处理联合动作空间复杂性、非平稳性问题以及估计误差方面的表现, 并提出了一些新的视角和思路. 针对基于暖通空调系统热动态与能耗的多变量耦合特点及数据预测精度不足的问题, 付伟豪等提出了融合时间卷积–长短期记忆–注意力机制的融合预测模型, 采用改进粒子群算法优化预测模型超参数以降低模型预测误差. 考虑到传统多目标优化算法因参考点分布僵化、环境适应性弱与种群多样性衰减会导致解集分布失衡且收敛效率不佳, 董浩铭等提出了融合自适应更新参考点策略和种群预测机制的多目标优化算法. 夏天威等研究了非线性动态系状态变量的参与因子的唯一性, 考虑了模态组成和模特形状中不确定缩放因子的影响, 给出了唯一性的充分条件, 并探讨了状态变量扰动幅度与合理选择缩放因子之间的关系. 萧德云等研究了基于v-gap达到L2最优的EIV模型频域辨识方法, 所提方法同时适用于闭环系统和多变量系统等多种情况, 不需要对系统输入和输出有界噪声的特性做任何假设, 可以同时估计获得系统模型和相应的噪声模型. 吕梦欣等梳理了多智能体深度强化学习、微分博弈的原理和发展现状, 介绍了应用于微分博弈的强化学习算法, 总结了目前研究对传统方法所面临困难的解决情况, 并分析了发展现状, 给出了未来可能的研究方向. 以二阶无零点对象为例, 金辉宇等在线性系统理论框架内诠释内扰、总扰动和扩张状态等概念, 提出了韩氏扩张实现的概念. 针对目前自主水中载具存在的运行速度慢及工作范围有限的问题, 赵佐权等设计了一款新型高速单杆无人水翼船: 中大飞板, 可实现更快的前进速度、更低的能量消耗以及更广阔的工作范围.

针对多智能体协同控制领域的分布式优化问题, 崔秋燕等综述了离线和在线分布式优化问题的研究现状, 展望了未来的研究趋势, 指出了分布式优化在多智能体系统中的潜在发展方向. 考虑到铜箔电解过程中能耗建模精度不足会降低节能优化的可靠性, 黄大建等提出了一种基于局部多尺度滤波的铜箔电解过程节能优化方法. 针对分布式生产物料供应调度问题, 王晶晶等考虑多仓库、多工厂、多物料类型组成的复杂供应网络, 以同时优化生产商的满意度和物料拖期为目标, 构建了考虑动态补货机制的混合整数规划模型, 提出了一种数模双驱的协同智能优化方法. 针对园区综合能源系统的日内调度问题, 张涛等构建了包含两个时间粒度的日内调度模型及相应的优化框架, 设计了全连接全重网络模型自适应更新策略, 并通过两个时间粒度的调度优化实现对日前调度方案的逐步细化调整.

针对大规模紧急任务场景下异构多智能体任务分配策略寻优问题, 张华卿等提出了一种基于深度强化学习的多智能体批次任务分配方法, 提高了紧急任务场景下任务分配策略的实时性、可靠性和协同能力. 为了实现动态环境下的资源分配优化, 王晴等提出了融合深度强化学习与图神经网络的动态武器目标分配优化方法. 针对带时间窗约束的天车调度问题, 苏章圣等建立了基于时空离散化的混合整数线性规划模型, 设计了一种分层强化学习决策框架, 上层决策网络将运输任务指派至适合天车, 下层决策网络规划各天车运行路径执行具体运输. 针对三维无人机物流路径规划问题, 刘润恺等建立了包含环境建模与数学建模的综合分析框架, 提出了一种融合强化学习机制的改进人工蜂群算法.

针对分布式同构混合流水车间调度问题, 以最小化最大完工时间和总碳排放量为优化目标, 颜雪松等给出了加工过程碳排放量的计算公式, 在NSGA-II框架内设计了算法的混合初始化策略、更新策略和降碳策略. 针对考虑工人双层学习效应的双资源柔性作业车间调度问题, 袁志华等构建了以最大完工时间为优化目标的数学模型, 提出了一种改进的Memetic算法. 针对动态级联车间能效调度问题, 包海著等研究了由分布式流水车间、混合流水车间及二者之间的运输阶段组成的级联车间系统, 以最小化订单总延迟时间和总能耗为目标, 提出了一种基于图神经网络的深度强化学习算法. 针对多机器人除草任务分配问题, 李泷鑫等建立了最小化任务最大完成时间、总能耗以及总农药剩余的混合整数线性规划模型, 提出了一种基于分组策略的多目标离散人工蜂群算法. 针对动态多重柔性作业车间调度问题, 杨晓宇等考虑工件订单和多类型工件的动态到达, 提出了多策略决斗双深度Q网络求解方法.

针对带有时间依赖性的多敏捷卫星多目标调度优化问题, 张广辉等构建了数学规划模型, 提出了一种混合进化博弈调度算法. 在负相关集成强化学习的框架下, 童浩等提出了基于多目标集成剪枝的多样内容在线生成方法, 降低了计算资源消耗. 针对在多任务优化中可能导致的有效知识转移效率降低的问题, 王振宇等提出一种基于最小二乘法子空间对齐和种群重用机制的多任务优化算法, 提高了算法的收敛性能. 考虑到联邦学习架构下的移动群智感知用户存在隐私泄露风险, 蒋伟进等采用联邦随机主成分分析法对数据降维, 引入Bregman散度更新损失函数, 从而取得更高的准确性和收敛精度. 考虑到基于用户交互的进化优化算法搜索方向出现较大偏离会导致搜索效率低下的问题, 孙晓燕等提出了一种融合Kalman滤波偏差估计和代理模型的个性化差分进化算法.

本专刊的出版为广大专家学者和学生展示了智能优化与控制的最新代表性成果, 鉴于组织者水平和时间有限, 专刊内容难免存在若干不足, 敬请广大读者理解. 在此, 衷心感谢作者的成果分享、专家的专业审稿、编辑的高效工作, 特别感谢《控制理论与应用》编辑部对本专刊的大力支持. 展望未来, 期待智能优化在理论、方法、技术、应用等层面涌现出更多更新的成果, 促进学术创新、技术创新、应用创新、学科交叉以及社会经济的高质量发展.

王凌清华大学

段海滨北京航空航天大学

桑红燕聊城大学

龚文引中国地质大学(武汉)

两次做郑大钟老师学生的经历

【作者】

吴宏鑫

【全文】

欣闻控制理论与应用要出版一期纪念郑大钟老师诞辰90周年的专刊, 我心情非常激动, 特借此机会回忆我两次幸运地做郑老师学生的经历, 以及这些经历对我的成长和为国家做出的贡献的深远和重要影响.

我两次跟郑老师做学生. 第一次是文革之前, 我上大学的时候, 郑老师给我们辅导过《过渡过程分析》, 当时是钟士模先生主讲. 第二次是我大学毕业后回校听郑大钟老师给研究生上的《现代控制理论》课. 这次上课, 是我在文革结束后, 由于历史原因还没有恢复工作的那段时间. 郑老师了解到我的情况, 就主动邀请我回学校旁听他的课. 他把控制理论的概念讲得提纲挈领、鞭辟入里, 让人百听不厌, 真是一种享受！我做完作业, 给郑老师交作业. 郑老师亲自给我们批改作业. 文革后我的情况得到平反, 面临工作方向上的重大选择: 是驾轻就熟地继续搞卫星总体方案设计, 还是开拓国内尚无人涉足的航天器自适应控制这个领域? 在清华的学习经历, 特别是两次做郑老师学生, 让我学到系统的基础理论和专业课, 为我从事科研工作打下坚实的基础, 给了我勇于探索科技前沿的底气. 我选择了后者, 因为这一领域的技术无论在工业生产上还是在航天方面, 都有广阔的发展前景.

除了上郑老师的课, 在我的学术生涯中, 最重要的两篇文章, 都是在郑老师的指导下完成和发表的. 郑老师亲自帮我修改. 一篇是《一种全系数的自适应控制方法》, 85年发表在《自动化学报》上. 第二篇文章, 是《基于对象特征模型描述的智能控制》, 99 年发表在《自动化学报》上. 这两篇论文提出的创新方法在发表之前, 已经在工程上得到了验证. 但作为学术论文, 发表的过程可谓非常曲折. 我刚开始投稿的时候, 总被拒稿. 拒稿理由是文章提出的“模型系数之和等于一”的条件没听说过, “特征模型”也没听说过. 稿子被退回来后, 我都没有再投稿的信心了. 郑老师看过之后, 相信我做的工作是有价值的, 并热情地鼓励我把文章发表出来. 作为学生, 我知道郑老师的理论功底是很扎实的, 在学术界也是很受人尊重的. 有了郑老师的认可, 我心里就有底了. 郑老师非常严谨, 以高标准对我提出了要求. 他说一定要给出问题的准确描述和结果的严格证明, 没有严格的证明是不行的. 他从文章结构到理论推导全过程都进行了耐心指导和修改. 后来, 经过郑老师的帮助, 文章终于得到了审稿专家的认可, 被录用了. 我希望郑老师能够在文章上署名, 但他拒绝了, 就连帮我修改论文的经历, 他也从来没有跟人提起, 也不让我对外宣扬. 从这一点上, 我感受到郑老师崇高的品质.

希望我的经历, 能够鼓励控制理论与应用领域的科研工作者, 继承郑大钟老师为代表的老一辈科学家严谨的治学态度、崇高的品质和对学术前沿的探索精神, 为我国科技自立自强做出应有的贡献.

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=20251103&flag=1

郑大钟教授生平和学术成就简介

【作者】

王龙, 赵千川

【简介】

郑大钟教授(1935年5月13日―2019年11月17日), 籍贯浙江绍兴, 出生于江苏南京. 抗战期间随家人迁居绍兴乡间. 尽管童年坎坷, 他仍自幼刻苦向学. 家乡解放后, 他依靠人民助学金的支持, 得以完成中学乃至大学的学业. 这段经历让他一生铭记社会的温暖与扶助, 也成为其将“感恩”与“奋斗”作为人生主题的根源. 1954年, 他以优异成绩考入清华大学电机工程系, 后转入新成立的自动控制系. 时值国家“一五”计划全面推进阶段, 宏伟的建设目标深深激励着他, 使他立志以所学知识报效国家. 1959年大学毕业后, 他留校任教, 从助教起步, 开始了在清华长达半个多世纪的教育与研究生涯. 1966年文化大革命开始后, 学校教学科研工作中断, 他先后参加政治学习、教改实验班, 并赴五七干校和工厂劳动与实践. 1978 年改革开放为科学事业带来新机遇. 1981至1983年, 他赴美国纽约州立大学石溪分校访学, 深入接触国际学术前沿. 回国后继续任教于清华, 1984年任副教授, 1990年晋升教授, 1993年成为博士生导师, 并于同年光荣加入中国共产党.

郑大钟教授的一生, 亲历并深刻影响了中国控制科学的发展进程. 作为一名忠诚的共产党员, 他始终将个人理想与国家需要紧密结合, 以高度的责任感和使命感投身于科研与教育事业. 他在线性系统理论与离散事件动态系统等领域做出了奠基性的贡献, 赢得了国际学术界的广泛认可; 在教材编写与人才培养方面倾注心血, 滋养和引领了几代学人的成长. 他不仅是一位严谨求实的学者, 更是一位胸怀家国、甘于奉献的教育家; 既是科研前沿的开拓者, 也是恪守初心、以身作则的共产党员楷模.

他以“感恩”回馈时代, 以“奋斗”践行担当. 那句“认认真真做事, 清清白白做人”的座右铭, 既是他作为一名共产党员的基本操守, 也是他一生学术与人格的真实写照, 为后学树立了崇高的精神标杆.

郑大钟教授以共产党员的忠诚与担当, 将其学术生命毫无保留地奉献给了中国控制和系统科学的发展. 他所留下的, 不仅是丰硕的成果与著作, 更是一份历久弥新的精神财富, 将持续照亮后来者在学术与人生道路上的前行方向.

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=20251104&flag=1

郑大钟教授的教学教育思想

【作者】

萧德云, 田作华

【简介】

郑大钟教授毕生献身于教育事业, 在自动控制理论方面做出卓越贡献, 对自动化专业教学教育富有深邃思考, 拥有前瞻思想, 为自动化专业教学筑牢根基,治学严谨, 严于律己, 称得上一位学术博大精深、思想朴实稳重的自动控制理论教育家, 在国内及国际自动控制界享有盛名, 深受业内同行敬重, 在学界的影响力甚广, 威望素著.

本文从致力构建自动化专业课程体系、坚持不懈地改革专业课程、富有专业建设的前瞻性思想、积极推进自动化专业教材建设、始终重视素质教育、主张因类适宜地培养高层次研究人才等六个方面简要阐述郑大钟教授对自动化专业教学教育的奉献与付出, 以展现他的教育思想和育人境界, 旨在阐扬光大, 薪火相承.

郑大钟教授一辈子扎根教育, 服务教育, 端严治教, 把“教育”二字刻进了岁月, 对教学教育的贡献藏在被他点亮的自动化专业建设事业之中. 为清华自动化专业教学呕心沥血, 为全国自动化专业教学撒播改革精神, 影响了一代又一代, 永远值得我们缅怀和敬仰.

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=20251105&flag=1

论文与报告

网络化系统的学习与控制

【作者】

井冈山, 王龙, 史大威, 陈通文

【摘要】

网络化系统是指由多个具有交互和任务执行能力的子系统基于网络结构连接而成的动态系统. 由于在不同应用场景中经常呈现高维、多约束、非凸、非线性等特点, 网络化系统的分析与控制问题在本世纪受到了来自不同领域的广泛关注. 为应对动态环境与复杂系统中的不确定性等问题, 具有端到端特性的强化学习方法被引入到网络化系统的控制策略学习中. 然而, 网络化系统的高维数与结构化特性使强化学习的效率和有效性面临严峻挑战. 事实上, 许多研究发现, 网络化系统的性能与其网络结构密切相关, 从图的角度切入能够把复杂的控制问题转化为简单的组合优化问题, 进而实现对实际大规模网络的应用. 鉴于此, 本文从图的视角出发, 对基于学习的网络化系统控制方法做系统性梳理, 通过考察线性二次调节与马尔可夫博弈两种模型下的最优控制问题, 揭示图结构在网络化系统控制策略学习中的重要作用, 同时也将列举该领域现存的难题并展望未来的发展方向.

【关键词】

网络化系统; 强化学习; 数据驱动控制; 分布式控制

【引用格式】

井冈山, 王龙, 史大威, 等. 网络化系统的学习与控制. 控制理论与应用, 2025, 42(11): 2100 – 2113

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250259&flag=1

集中训练分布执行下的多智能体强化学习综述

【作者】

李岳珩, 谢广明

【摘要】

近年来, 多智能体强化学习(MARL)因其在解决实际问题上的巨大潜力而逐渐成为研究的热点. 在复杂的多智能体系统中, 集中式训练与分布式执行(CTDE)框架被广泛应用. CTDE通过集中训练的方式缓解了多智能体强化学习中的非平稳性问题, 但也因此带来了新的挑战, 特别是在训练过程中需要处理所有智能体的信息, 尤其是随着智能体数量增加而呈指数级增长的联合动作空间. 本文对CTDE框架下的多智能体强化学习算法及其发展进行了选择性的回顾, 重点探讨了两大类算法: 值函数分解方法和策略梯度方法. 本文总结了这些算法在处理联合动作空间复杂性、非平稳性问题以及估计误差方面的表现, 并提出了一些新的视角和思路, 旨在为该领域的研究人员提供更深入的理解和未来研究的指导.

【关键词】

多智能体强化学习; 集中式训练分布式执行; 值函数分解; 强化学习

【引用格式】

李岳珩, 谢广明. 集中训练分布执行下的多智能体强化学习综述. 控制理论与应用, 2025, 42(11): 2114 – 2124

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250009&flag=1

基于TCN-LSTM-Attention的建筑热动态与能耗预测

【作者】

付伟豪, 赵千川

【摘要】

基于暖通空调系统热动态与能耗的多变量耦合特点及数据预测精度不足的问题, 本文提出一种融合时间卷积–长短期记忆–注意力机制(TCN-LSTM-Attention)的融合预测模型. 首先, 为了能够更加好捕获建筑运行数据中的短期与长期依赖, 建立了TCN-LSTM-Attention建筑热动态与能耗预测模型来预测HVAC能耗、室内温度、PMV; 采用改进粒子群算法(IPSO) 优化预测模型超参数, 降低模型预测误差, 并对模型逼近能力进行分析; 其次, 使用EnergyPlus搭建建筑仿真模型并进行验证; 以河北省某办公建筑运行数据进行预测模型仿真验证, 实验表明本模型在对比算法中有较好的预测精度和预测稳定性, 并且验证了算法在建筑围护结构参数改变时的泛化性.

【关键词】

建筑状态预测; 时间卷积网络; 长短期记忆网络; 注意力机制; 粒子群优化算法

【引用格式】

付伟豪, 赵千川. 基于TCN-LSTM-Attention的建筑热动态与能耗预测. 控制理论与应用, 2025, 42(11): 2125 – 2135

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250131&flag=1

融合自适应更新参考点策略与种群预测机制的多目标优化算法

【作者】

董浩铭, 姚立忠, 王凌, 殷涛, 罗海军

【摘要】

传统多目标优化算法因参考点分布僵化、环境适应性弱与种群多样性衰减, 常导致解集分布失衡且收敛效率不佳. 为此, 本文提出融合自适应更新参考点策略和种群预测机制的多目标优化算法. 首先, 设计一种精英基因引导生殖交叉算子, 通过干扰交换和继承三重机制增强全局搜索与多样性; 其次, 建立种群预测机制, 结合正则化回归与边界扰动预测新解, 经误差修正实现历史信息与新种群的动态融合; 然后, 提出自适应更新参考点策略, 动态剔除无效点并生成新点, 优化高维目标空间覆盖; 最后, 给出基于自适应更新参考点策略和预测种群机制的多目标优化算法的完整框架. 实验结果表明, 该算法在一系列测试问题和实际铝电解工艺参数优化案例中表现优异.

【关键词】

多目标优化; 环境适应性; 种群预测; 自适应参考点更新; 铝电解

【引用格式】

董浩铭, 姚立忠, 王凌, 等. 融合自适应更新参考点策略与种群预测机制的多目标优化算法. 控制理论与应用, 2025, 42(11): 2136 – 2146

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250141&flag=1

关于非线性动态系统状态变量的参与因子的唯一性

【作者】

夏天威, 孙凯

【摘要】

在非线性动态系统的模态分析与控制中, 状态变量在某个关键或选定模态中的参与因子是简化稳定性研究的重要工具, 它使得研究能集中于参与度高的少数状态变量. 对于一个线性系统, 其状态变量在某一模态的线性参与因子由左、右特征向量分别定义的模态组成和模态形状共同唯一确定. 然而, 其他类型参与因子的唯一性需要更为深入的研究. 针对非线性参与因子及其他5种参与因子的变体, 本文证明了其唯一性的充分条件. 该条件考虑了模态组成和模态形状中不确定缩放因子的影响. 这些缩放因子源于在分析和控制实际动态系统时选择状态变量的物理单位或数值范围的变化. 因此, 获得和理解参与因子唯一性的充分条件对于在实际场景中正确地将参与因子的概念用于稳定性分析和控制至关重要. 此外, 本文还探讨了状态变量扰动幅度与合理选择缩放因子之间的关系.

【关键词】

参与因子; 模态形状; 模态组成; 非线性系统; 振荡

【引用格式】

夏天威, 孙凯. 关于非线性动态系统状态变量的参与因子的唯一性. 控制理论与应用, 2025, 42(11): 2147 – 2155

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240618&flag=1

基于v-gap达到L2最优的EIV模型频域辨识方法研究

【作者】

萧德云, 耿立辉, 纪国锋, 张益农, 农时猛, 杨帆, 巨辉, 刘敏华

【摘要】

本文论述一类基于v-gap测度、达到实现L2最优的变量带误差(EIV)模型辨识问题, 包括单输入单输出系统的开环与闭环EIV模型辨识和多输入多输出系统的EIV模型辨识. 基于v-gap测度就是以扰动模型与逼近模型之间的距离为优化准则, 当满足相应的Nyquist缠绕条件时, 获得模型辨识的最优解. 达到L2最优是指, 在L2空间下对扰动的输出和输入频域实验数据进行正交分解, 使正规右互质因子描述的系统模型的值空间与系统模型补因子描述的噪声模型的值空间具有正交性, 通过优化v-gap测度间接使逼近误差(噪声)达到L2最小. 本文所提出的方法为EIV模型辨识提供了一种新的研究途径, 同时适用于闭环系统和多变量系统等多种情况下, 不需要对系统输入和输出有界噪声的特性做任何假设, 可以同时估计获得系统模型和相应的噪声模型, 在工程上具有广泛的实用性.

【关键词】

系统辨识; EIV模型; v-gap测度; L2最优准则; 频域

【引用格式】

萧德云, 耿立辉, 纪国锋, 等. 基于v-gap达到L2最优的EIV模型频域辨识方法研究. 控制理论与应用, 2025, 42(11): 2156 – 2164

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250049&flag=1

多智能体强化学习在微分博弈中的应用

【作者】

吕梦欣, 石宗英, 钟宜生

【摘要】

微分博弈是一种研究对抗环境下多智能体系统决策问题的方法, 在经济、工程等领域都有着广泛的应用前景. 然而当问题建模接近真实场景时, 微分博弈的理论求解面临诸多困难. 近年来, 随着人工智能技术的快速发展, 多智能体深度强化学习方法的研究取得了瞩目突破, 为解决微分博弈所面临的挑战提供了新的思路. 本文首先对这二者各自的原理、发展现状进行了梳理; 之后详细介绍应用于微分博弈的强化学习算法, 并根据微分博弈问题类别和网络模型进行细分, 总结目前研究对传统方法所面临困难的解决情况; 最后, 对微分博弈与多智能体强化学习的发展现状进行分析, 给出未来可能的研究方向.

【关键词】

强化学习; 微分博弈; 多智能体系统; 最优控制

【引用格式】

吕梦欣, 石宗英, 钟宜生. 多智能体强化学习在微分博弈中的应用. 控制理论与应用, 2025, 42(11): 2165 – 2178

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250128&flag=1

二阶无零点对象的内扰、扩张状态与韩氏扩张实现

【作者】

金辉宇, 史国明, 兰维瑶

【摘要】

自抗扰控制提出了内扰、总扰动和扩张状态等新概念, 也让诠释这些概念成为控制理论的新课题. 本文以二阶无零点对象为例, 在线性系统理论框架内诠释上述概念. 内扰被诠释为对象能控规范形中反馈项产生的信号. 本文提出了韩氏扩张实现的概念, 该实现的状态就是扩张状态, 其中包含一个能观不能控的分量. 扩张状态观测器是韩氏扩张实现的观测器, 而线性自抗扰控制是基于韩氏扩张实现的输出反馈控制. 这些结果表明, 上述概念与线性系统理论完全兼容, 其研究有望为线性系统理论带来新的方向和活力.

【关键词】

自抗扰控制; 内扰; 总扰动; 扩张状态; 韩氏扩张实现

【引用格式】

金辉宇, 史国明, 兰维瑶. 二阶无零点对象的内扰、扩张状态与韩氏扩张实现. 控制理论与应用, 2025, 42(11): 2179 – 2187

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250130&flag=1

中大飞板: 一种高速单杆无人水翼船

【作者】

赵佐权, 陈本美

【摘要】

针对目前自主水中载具存在的运行速度慢, 工作范围有限问题, 本文设计了一款新型高速单杆无人水翼船: 中大飞板. 与传统自主水中载具不同, 中大飞板具有3种运动模式, 使其可以适用于不同的海洋任务. 本文针对中大飞板的水翼模式展开深入研究. 中大飞板的水翼模式借鉴了固定翼无人机的设计理念, 将水翼作为机体的重要组成部分. 当水翼在水中运动时, 会产生向上的升力, 这一升力能够把船体抬离水面, 减少船体与水的接触面积, 进而降低船体前进时所受到的阻力. 由于阻力大幅降低, 中大飞板得以实现更快的前进速度, 更低的能量消耗以及更广阔的工作范围. 同时, 依据伯努利原理, 水翼的升力与速度的平方成正比, 因此中大飞板更快的前进速度使中大飞板具备更强的负载能力. 本文详细地介绍了中大飞板的工作原理, 设计过程以及控制方法, 并通过实验验证了设计方法的有效性, 以及中大飞板相较于传统单体船和双体船的优越性能. 中大飞板的更多详情可以通过以下链接查看:https://b23.tv/UHw7KOp.

【关键词】

中大飞板; 无人水面船; 水翼船

【引用格式】

赵佐权, 陈本美. 中大飞板: 一种高速单杆无人水翼船. 控制理论与应用, 2025, 42(11): 2188 – 2195

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250076&flag=1

分布式优化研究进展

【作者】

崔秋燕, 纪志坚

【摘要】

分布式优化问题是多智能体协同控制领域的重要研究课题之一, 旨在通过局部信息交互实现全局目标的协同优化. 在分布式优化框架下, 每个智能体基于自身的局部信息, 并通过通信网络与其邻居节点交换信息, 以分布式方式协同最小化全局目标函数. 本文系统梳理了近年来的相关文献, 综述了离线和在线分布式优化问题的研究现状. 最后, 本文对未来的研究趋势进行了展望, 指出了分布式优化在多智能体系统中的潜在发展方向.

【关键词】

多智能体系统; 离线分布式优化; 离散时间; 连续时间; 在线分布式优化; 遗憾

【引用格式】

崔秋燕, 纪志坚. 分布式优化研究进展. 控制理论与应用, 2025, 42(11): 2196 – 2206

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250100&flag=1

基于局部多尺度滤波的铜箔电解过程高可靠性节能优化

【作者】

黄大建, 张文安, 桂卫华

【摘要】

铜箔电解过程中的能耗建模精度不足会降低节能优化的可靠性, 给现有的节能优化方法带来了严峻挑战. 针对这一问题, 在难以进一步提升能耗模型精度的背景下, 本文提出了一种基于局部多尺度滤波的铜箔电解过程节能优化方法, 并对其可靠性进行了系统分析. 首先, 针对电解过程在工业应用中的能耗建模误差, 通过循环–判断结构生成不同精度的模型, 分析建模精度对能耗优化的影响机制. 其次, 基于现有回归模型的拟合优度评估指标, 设计了可靠性分析方法, 实现了对节能优化可靠性的定量评估. 再次, 提出基于局部多尺度滤波的能耗优化改进方法, 在能耗优化模型中引入多尺度的局部均值滤波, 减小预测误差对智能仿生优化算法的误导影响, 从而提高因建模精度不足导致的可靠性问题, 并进行相关理论推导. 最后, 基于某企业的铜箔电解过程工业实验验证, 所提方法将能耗优化的绝对误差从4.29%降至1.53%, 表明该方法在能耗模型低精度条件下依然能够显著提升智能仿生优化算法的可靠性.

【关键词】

铜箔; 电解过程; 节能优化; 局部多尺度滤波; 过程可靠性增强

【引用格式】

黄大建, 张文安, 桂卫华. 基于局部多尺度滤波的铜箔电解过程高可靠性节能优化. 控制理论与应用, 2025, 42(11): 2207 – 2220

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240580&flag=1

数模双驱的分布式生产物料供应智能优化调度

【作者】

王晶晶, 郭琦, 韩红桂

【摘要】

随着制造企业间的合作日益普遍, 分布式制造具有资源配置优化共享的优势, 已成为一种现代化生产模式. 物料作为生产制造的核心资源, 供应商与生产商间的高效物料供应调度能够提升分布式生产效率、降低生产成本. 本研究针对分布式生产物料供应调度问题, 提出一种数模双驱的协智能优化方法, 同时优化生产商的满意度和物料拖期目标. 首先, 针对多仓库、多工厂、多物料类型组成的复杂供应网络, 构建考虑动态补货机制的混合整数规划模型; 其次, 在中小规模和大规模问题上分别利用数学求解器Gurobi和启发式规则最大化满意度和最小化拖期并得到两个单目标最优解, 作为多目标优化的高质量起点和终点; 然后, 设计基于模型优化解的自适应路径重连机制, 通过差异驱动自适应探索策略, 提升多目标优化解集多样性; 最后, 提出目标驱动的局部增强搜索策略, 进一步提升算法性能. 不同规模数据集的仿真实验结果表明了所提算法能够有效求解分布式物料供应调度问题.

【关键词】

数模双驱; 分布式生产; 物料供应调度; 智能优化

【引用格式】

王晶晶, 郭琦, 韩红桂. 数模双驱的分布式生产物料供应智能优化调度. 控制理论与应用, 2025, 42(11): 2221 – 2230

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250266&flag=1

全连接权重网络自适应的园区综合能源日内调度优化

【作者】

张涛, 董南江, 王锐

【摘要】

园区综合能源系统的日内调度需要根据风光自然因素、负荷的波动, 对预调度方案进行快速调整, 实现园区能源系统的经济稳定运行. 日内调度优化模型是一个包含半连续变量的非线性多目标的问题, 同时对算法的时效性要求较高, 对现有的用于多目标智能优化算法的收敛速度提出挑战. 为此, 本文构建了包含两个时间粒度(15 min和5 min)的日内调度模型及相应优化框架, 针对日内调度优化时效性要求高的特点, 在双层全连接权重网络进化算法的基础上, 设计了全连接全重网络模型自适应更新策略, 记为S-TFCWNEA. 通过模型参数标准差随优化进程自适应调整的策略, 平衡算法的全局和局部搜索, 加速种群收敛. 通过两个时间粒度的调度优化实现对日前调度方案的逐步细化调整. 仿真结果表明, 引入全连接权重网络模型自适应更新策略能显著提高算法收敛速度, 快速响应风光、负荷的波动, 在有限时间内快速调整调度方案.

【关键词】

全连接权重网络; 多目标优化; 能源系统调度优化; 参数自适应

【引用格式】

张涛, 董南江, 王锐. 全连接权重网络自适应的园区综合能源日内调度优化. 控制理论与应用, 2025, 42(11): 2231 – 2241

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250115&flag=1

面向紧急任务的多智能体批次任务分配

【作者】

张华卿, 郝明瑞, 姜吉祥, 张晓飞, 马宏宾, 司佳帅

【摘要】

现有的基于学习的构造任务分配方法需要在连续构造一个完整任务分配方案后, 再将任务分配给智能体去执行, 其在救援、对抗等大规模紧急任务场景下通常无法满足任务的实时性需求. 本文则针对大规模紧急任务场景下异构多智能体任务分配策略寻优问题, 提出了一种基于深度强化学习的多智能体批次任务分配方法. 在该方法中设计了包含编码器、智能体和任务节点选择解码器、递归嵌入结构的策略模型, 其能够根据目标函数的最优性要求一次给出一个批次的由智能体–任务节点对所构造的部分任务分配方案. 在在线任务分配中相应的智能体不用等到构造完完整的任务分配方案后再去执行相应的任务. 评估结果表明, 多智能体批次任务分配方法提高了紧急任务场景下任务分配策略的实时性、可靠性和协同能力.

【关键词】

异构多智能体; 任务分配; 深度强化学习; 注意力机制; 紧急任务场景

【引用格式】

张华卿, 郝明瑞, 姜吉祥, 等. 面向紧急任务的多智能体批次任务分配. 控制理论与应用, 2025, 42(11): 2242 – 2251

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240518&flag=1

融合深度强化学习与图神经网络的动态武器目标分配优化

【作者】

王晴, 王雨珏, 王浩然, 辛斌

【摘要】

本文提出了一种基于深度强化学习(DRL)与图神经网络(GNN)的动态传感器武器目标分配(SWTA)方法, 旨在应对现代战场中复杂和动态的决策需求. 传统静态方法在实时变化的战场中效率低、适应性差. 为此, 本文通过结合深度强化学习与图神经网络, 构建智能决策框架, 利用环境交互和深度学习优化决策策略, 提高资源分配效率和决策精度. 框架受OODA环理论指导, 通过图神经网络捕捉场景中武器、目标和传感器的关系特征, 快速生成分配方案, 结合深度强化学习优化策略, 实现动态环境下的资源分配优化. 优化过程中考虑到了作战效能, 资源消耗和关键要地保护的约束. 实验表明, 该方法在多种场景中表现优异, 显著提升了资源利用率和作战效果.

【关键词】

动态传感器武器目标分配; 深度强化学习; 图神经网络; OODA环

【引用格式】

王晴, 王雨珏, 王浩然, 等. 融合深度强化学习与图神经网络的动态武器目标分配优化. 控制理论与应用, 2025, 42(11): 2252 – 2260

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250065&flag=1

基于分层强化学习的天车调度优化方法

【作者】

苏章圣, 蒋胜龙, 彭功状, 梁越永

【摘要】

天车是车间、仓库、港口等工业园区中关键的重型物料运载装置, 其调度对运输效率及生产目标达成影响显著. 针对带时间窗约束的天车调度问题(CSP-TW), 建立了一种基于时空离散化的混合整数线性规划模型. 基于模型特征, 设计了一种分层强化学习(HRL)决策框架: 上层决策网络将运输任务指派至适合天车; 下层决策网络规划各天车运行路径执行具体运输. 在学习过程中, 引入了动作禁忌规则规避无效动作, 引导上下层决策网络向优势策略空间探索. 随后, 采用了外部经验池和D3QN策略训练决策网络. 基于某公司钢厂物流仿真平台进行测试: 消融实验表明所引入的动作禁忌规则可提高HRL 学习效率; 训练比较表明HRL的收敛性优于端到端框架; 对比实验表明HRL的求解效果优于多规则组合法、元启发式算法、端到端和DQN等多类方法, 并符合秒级响应的应用需求.

【关键词】

天车调度; 分层强化学习; 任务指派; 路径规划; 动作禁忌

【引用格式】

苏章圣, 蒋胜龙, 彭功状, 等. 基于分层强化学习的天车调度优化方法. 控制理论与应用, 2025, 42(11): 2261 – 2273

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250167&flag=1

面向三维无人机物流路径规划问题的改进人工蜂群算法

【作者】

刘润恺, 胡伟, 宋彦杰, 邢立宁

【摘要】

无人机凭借其空中机动性与自主性优势, 在物流配送领域展现出重要应用价值. 该模式可显著降低人力成本, 同时提升物流网络的灵活性与响应效率. 然而, 三维复杂环境中建筑物、山体等障碍物对无人机飞行安全构成严峻挑战. 如何构建障碍规避约束下的配送路径, 成为无人机物流系统优化的关键问题. 针对三维路径规划需求, 本文研究建立了包含环境建模与数学建模的综合分析框架, 并提出一种融合强化学习机制的改进人工蜂群算法. 该算法采用基于起讫点空间关系的启发式规则生成初始种群, 通过强化学习动态选择采蜜蜂阶段的3种搜索策略, 显著提升了初始解质量与搜索方向性. 观察蜂阶段引入反向学习机制, 生成互补种群以增强算法收敛精度与速度. 仿真实验表明: 相较于传统算法, 改进算法在路径成本与计算效率方面均具有显著优势, 可为复杂三维场景下的无人机物流路径规划提供高效解决方案.

【关键词】

强化学习; 人工蜂群算法; 无人机; 物流配送; 路径规划

【引用格式】

刘润恺, 胡伟, 宋彦杰, 等. 面向三维无人机物流路径规划问题的改进人工蜂群算法. 控制理论与应用, 2025, 42(11): 2274 – 2285

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240527&flag=1

面向分布式同构混合流水车间绿色调度的多目标优化方法

【作者】

颜雪松, 张峻华, 胡成玉

【摘要】

在双碳目标的背景下, 制造业的发展既面临挑战又面临机遇, 为响应国家政策, 大力减少碳排放量, 本文以分布式混合流水车间绿色调度问题作为研究对象, 对于具有相同加工能力的工厂车间, 本文构建了一个分布式同构混合流水车间绿色调度问题模型, 结合实际工厂特点, 给出加工期间碳排放量的计算公式. 结合问题特性提出了改进的NSGA-II算法, 设计了算法的混合初始化策略、更新策略和降碳策略以提高算法的性能, 在算法的实验验证中, 设计消融实验验证了所提策略的有效性, 并与多种先进的多目标优化算法进行对比实验, 验证了改进算法在求解该问题上的有效性.

【关键词】

分布式混合流水车间调度; 双碳目标; 多目标优化; NSGA-II

【引用格式】

颜雪松, 张峻华, 胡成玉. 面向分布式同构混合流水车间绿色调度的多目标优化方法. 控制理论与应用, 2025, 42(11): 2286 – 2295

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240443&flag=1

考虑双层学习效应的双资源柔性作业车间调度

【作者】

袁志华, 卢超, 余飞, 龚文引

【摘要】

在工业5.0时代, “以人为本”的智能制造成为研究热点. 针对双资源柔性作业车间调度问题, 已有研究考虑了工人的学习效应, 但尚未涉及工人对工件和机器双层学习效应对生产效率的影响. 为此, 本文首次提出了考虑工人双层学习效应的双资源柔性作业车间调度问题, 并构建以最大完工时间为优化目标的数学模型. 为求解该问题, 提出了一种改进的Memetic算法, 主要改进包括: 设计符合问题特性的3层编码, 提出主动调度解码策略提升解的质量, 开发种群初始化策略增强多样性, 并设计融合交叉变异更新与变邻域搜索策略以提高全局探索与局部寻优能力. 最后, 通过对比实验验证了算法和模型的有效性.

【关键词】

柔性作业车间调度问题; 工人的双层学习效应; Memetic算法

【引用格式】

袁志华, 卢超, 余飞, 等. 考虑双层学习效应的双资源柔性作业车间调度. 控制理论与应用, 2025, 42(11): 2296 – 2309

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250001&flag=1

基于深度强化学习的动态级联车间能效调度优化

【作者】

包海著, 潘全科

【摘要】

针对动态级联车间能效调度问题(DCSESP), 本文研究了由分布式流水车间、混合流水车间及二者之间的运输阶段组成的级联车间系统, 旨在最小化订单总延迟时间和总能耗. 为此, 建立了混合整数线性规划模型, 并提出了一种基于图神经网络的深度强化学习(GDRL)算法. 首先, 针对级联车间调度问题, 设计了一种异构图模型, 构建了三阶段节点嵌入方法, 用于实时捕捉车间的动态状态特征; 其次, 依据提取的状态特征, 分别对级联车间的两个阶段执行工件和工序选择决策; 最后, 将多层感知机(MLP)和图注意力网络(GAT)结合于近端策略优化(PPO)算法的行动者–评论者框架中, 进行训练与学习, 从而实现级联车间的快速联合调度. 实验结果表明, GDRL算法在求解动态级联车间能效调度问题时, 显著优于其他3种先进的调度方法, 尤其在复杂问题场景下表现出更强的优化能力和鲁棒性.

【关键词】

级联车间调度; 流水车间; 动态调度; 深度强化学习; 图神经网络

【引用格式】

包海著, 潘全科. 基于深度强化学习的动态级联车间能效调度优化. 控制理论与应用, 2025, 42(11): 2310 – 2321

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250119&flag=1

基于分组策略的多除草机器人任务分配多目标优化

【作者】

李泷鑫, 桑红燕, 孟磊磊, 张彪

【摘要】

本文针对多机器人除草任务分配问题 (MWRTA) 展开研究, 旨在最小化任务最大完成时间、总能耗以及总农药剩余, 这些指标是衡量可持续农业系统性能的关键因素. 为此, 本文建立了一个混合整数线性规划模型, 并提出了一种新颖的基于分组策略的多目标离散人工蜂群算法(GMO-DABC), 以高效求解MWRTA问题. 首先, 设计了一种融合分组策略与负载均衡的启发式方法, 用于有效生成解; 其次, 基于分组策略构建邻域算子结合问题知识动态调整邻域结构, 降低陷入局部最优的风险; 最后, 提出了一种结合分组策略与非支配前沿分析的搜索策略, 以高效探索解空间. 在多个规模的算例中进行的大量仿真实验表明, GMO-DABC在解质量、收敛速度和鲁棒性方面均优于多种先进算法, 验证了该算法在优化能力方面的优势及其在实际农业应用中的潜在价值.

【关键词】

多机器人任务分配; 人工蜂群算法; 多目标优化; 分组策略

【引用格式】

李泷鑫, 桑红燕, 孟磊磊, 等. 基于分组策略的多除草机器人任务分配多目标优化. 控制理论与应用, 2025, 42(11): 2322 – 2331

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250125&flag=1

融入流体松弛模型的决斗双深度Q网络求解动态多重柔性作业车间调度问题

【作者】

杨晓宇, 韩玉艳, 王玉亭, 李寰, 张彪

【摘要】

鉴于生产过程中订单的随机到达可能导致调度方案无法实现最优, 实时动态订单到达成为关键问题. 针对动态多重柔性作业车间调度问题(DMFJSP), 提出了多策略决斗双深度Q网络(MPD3QN)求解方法. 该问题考虑了工件订单和多类型工件的动态到达, 首先, 为了降低DMFJSP的复杂性, 提出了一个简化的流体松弛模型, 并基于流体模型设计了多指标选择策略, 用于辅助生产调度决策. 其次, 进一步构建了马尔可夫决策过程(MDP)模型, 提取了与工件和机器相关的19个状态特征, 设计了20种复合规则作为动作空间. 然后, 结合优先经验回放、软更新机制和自适应动作选择策略, 提出了MPD3QN算法. 最后, 通过81个测试算例, 将所提算法与3种现有的深度强化学习调度方法进行比较, 仿真结果验证了其优越性.

【关键词】

柔性制造系统; 流体松弛模型; 深度强化学习; 多策略决斗双深度Q网络; 多重性

【引用格式】

杨晓宇, 韩玉艳, 王玉亭, 等. 融入流体松弛模型的决斗双深度Q网络求解动态多重柔性作业车间调度问题. 控制理论与应用, 2025, 42(11): 2332 – 2340

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250083&flag=1

基于混合进化博弈的多敏捷卫星多目标调度优化

【作者】

张广辉, 魏晨轩, 冯彦翔, 李晓玲

【摘要】

随着航天技术的不断发展, 具有先进姿态机动能力的敏捷地球观测卫星在气候监测、军事动态等方面发挥重要作用. 为满足复杂的敏捷卫星任务调度需求, 本文以最小化观测任务失败率和卫星负载均衡为目标, 研究了带有时间依赖性的多敏捷卫星多目标调度优化问题. 首先, 基于问题特征构建了数学规划模型. 其次, 基于进化博弈理论提出一种混合进化博弈调度算法(HEGSA), 包括全局开采和局部勘探两个进化阶段, 全局开采阶段通过启发式策略生成具有异构身份的两个子种群, 并采用多目标进化博弈策略优化每个子种群以平衡收敛性和多样性; 局部勘探阶段采用一种自学习算子以增强对解空间的高效搜索. 最后, 通过仿真实验验证了HEGSA的有效性.

【关键词】

敏捷卫星; 任务调度; 时间依赖性; 多目标; 进化博弈; 自学习

【引用格式】

张广辉, 魏晨轩, 冯彦翔, 等. 基于混合进化博弈的多敏捷卫星多目标调度优化. 控制理论与应用, 2025, 42(11): 2341 – 2351

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250050&flag=1

基于多目标集成剪枝的多样内容在线生成方法

【作者】

童浩, 张清泉, 袁博, 王晗丁, 刘佳琳

【摘要】

在线生成多样内容是近年来程序化内容生成领域的新兴研究方向之一, 不仅可以满足用户的不同偏好进而提升用户体验, 也可以为人工智能算法的训练和测试提供海量的场景集和问题集. 近期研究提出了基于负相关集成强化学习的多样内容在线生成方法, 但此类方法无法有效地匹配不同用户的偏好. 此外, 训练与部署集成模型中的个体学习器需要消耗大量的计算资源. 针对这两个问题, 在负相关集成强化学习的框架下, 本文提出了基于多目标集成剪枝的多样内容在线生成方法. 该方法通过多目标优化算法搜索模型集成的权重, 使获得的集成模型不仅能够有效地匹配给定的用户偏好, 还能提供权衡模型性能与计算资源消耗的帕累托集. 此方法通过调整个体学习器的集成权重来匹配用户需求, 而非重新训练个体学习器, 因此降低了计算资源消耗.

【关键词】

程序化内容生成; 在线内容生成; 多目标优化; 演化算法; 集成学习; 视频游戏

【引用格式】

童浩, 张清泉, 袁博, 等. 基于多目标集成剪枝的多样内容在线生成方法. 控制理论与应用, 2025, 42(11): 2352 – 2362

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250126&flag=1

融合PLS子空间对齐和种群重用的多任务优化算法

【作者】

王振宇, 王磊

【摘要】

通过利用跨任务的知识转移, 多任务优化可以实现比传统单任务优化更好的收敛性能. 然而, 在多任务优化中, 搜索空间和优化场景的偏差以及干扰知识转移的噪声, 都可能导致有效知识转移效率的降低, 甚至出现负向迁移. 为解决此问题, 本文提出一种基于最小二乘法 (PLS) 子空间对齐和种群重用机制的多任务优化算法 (PR-MTEA). 首先, 通过引入PLS子空间投影策略, 将高维任务搜索空间向低维空间转化, 并建立各任务所拥有种群的特定低维子空间; 其次, 实时调整子空间Bregman散度获取对齐矩阵, 实现跨任务知识转移; 最后, 设计基于Residual残差结构的种群重用机制, 避免出现负向迁移和陷入局部最优情况, 并提高算法的收敛性能. 实验结果表明: 与其他4种先进多任务优化算法进行相比, PR-MTEA具有更好的收敛性能和快速搜索能力. 另外, 通过传感器覆盖问题进行测试分析, 进一步验证算法的可行性和适用性.

【关键词】

多任务优化; 知识转移; 子空间对齐; 种群重用; 传感器覆盖问题

【引用格式】

王振宇, 王磊. 融合PLS子空间对齐和种群重用的多任务优化算法. 控制理论与应用, 2025, 42(11): 2363 – 2373

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA240598&flag=1

异构环境下基于目标扰动的群智感知隐私保护策略

【作者】

蒋伟进, 王海娟, 李一骁, 蒋意容

【摘要】

联邦学习架构下的移动群智感知用户存在隐私泄露风险, 现有基于差分隐私的方案在梯度裁剪过程中会引起本地模型训练精度的缺失, 这种现象在异构环境中表现尤为不佳. 为了解决上述问题, 本文首先采用联邦随机主成分分析法对数据进行降维处理; 随后, 将经过R´enyi-差分隐私扰动后的目标函数替代梯度进行更新. 然后, 引入Bregman散度作为正则化项更新损失函数, 约束本地模型与全局模型的偏离. 实验结果表明, 本文所提出的方法与现有几种方法相比具有更高的准确性和收敛精度.

【关键词】

移动群智感知; 隐私保护; R´enyi-差分隐私; 异构

【引用格式】

蒋伟进, 王海娟, 李一骁, 等. 异构环境下基于目标扰动的群智感知隐私保护策略. 控制理论与应用, 2025, 42(11): 2374 – 2385

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250127&flag=1

代理模型和Kalman滤波偏差估计增强的个性化差分进化算法

【作者】

孙晓燕, 李帅, 金耀初

【摘要】

基于用户交互的进化优化算法可有效提高个性化推荐的性能, 但已有研究忽略了编码个体与解码样本间的偏差, 往往导致算法搜索方向出现较大偏离, 搜索效率低; 此外, 用户交互评价的定量化表示也是较大挑战. 针对此, 本文提出了融合Kalman滤波偏差估计和代理模型的个性化差分进化算法. 首先, 构建了基于用户评价、商品属性等的深度信念网络代理模型, 实现对用户交互的定量评价; 然后, 设计Kalman滤波偏差估计器, 跟踪进化过程中基因型和表现型之间的偏差, 并基于该偏差设计差分进化算子, 改变种群分布并引导搜索方向; 最后, 将该算法应用于亚马逊个性化搜索数据集, 验证了其有效性.

【关键词】

个性化搜索; 差分进化算法; Kalman滤波器; 代理模型; 偏差估计

【引用格式】

孙晓燕, 李帅, 金耀初. 代理模型和Kalman滤波偏差估计增强的个性化差分进化算法. 控制理论与应用, 2025, 42(11): 2386 – 2396

【全文链接】

https://jcta.ijournals.cn/cta_cn/ch/reader/view_abstract.aspx?file_no=CCTA250210&flag=1

期刊介绍

《控制理论与应用》(Control Theory & Applications)是经国家科学技术部批准, 教育部主管, 由华南理工大学和中国科学院数学与系统科学研究院联合主办的全国性一级学术刊物, 1984年创刊, 月刊, 国内外公开发行. 《控制理论与应用》是中国科学引文数据库首批统计源期刊之一，中文核心期刊，入选中国精品科技期刊顶尖学术论文F5000项目，中国科协自动化学科领域高质量科技期刊目录以及中国科协百篇优秀科技论文遴选计划，2021年入选广东省高质量科技期刊建设项目，2022-2024年连续获得基金委资助（科技活动专项）。

期刊封面2.jpg 目录2.jpg