|
引用本文
胡磊, 许星晗, 刘建卫, 韩敏. 基于相关熵核学习演化模糊系统的混沌时间序列在线预测. 自动化学报, 2026, 52(4): 724−737 doi: 10.16383/j.aas.c250343
Hu Lei, Xu Xing-Han, Liu Jian-Wei, Han Min. Online prediction of chaotic time series based on correntropy kernel learning evolving fuzzy systems. Acta Automatica Sinica, 2026, 52(4): 724−737 doi: 10.16383/j.aas.c250343
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c250343
关键词
演化模糊系统,相关熵,核学习策略,混沌时间序列,在线预测
摘要
演化模糊系统(EFSs)是在线学习领域中广泛应用的方法. 然而, 大部分EFSs往往隐含高斯噪声假设, 在重尾、偏态及强相关等非高斯扰动下易出现性能退化. 为此, 提出一种相关熵核学习演化模糊系统(CKL-EFS). CKL-EFS融合结构自组织与鲁棒递归学习两种机制, 以提升非高斯噪声环境下的在线建模能力. 在结构演化方面, 模型基于数据密度与激活度实现数据云的按需生成与效用驱动移除, 并通过在线归属更新维护数据云统计量, 从而抑制规则库无界膨胀并保持紧凑结构; 在参数更新方面, 采用核学习策略将输入映射至高维特征空间, 并引入改进相关熵准则对大误差样本自适应降权, 以增强对离群冲击与非高斯噪声的鲁棒性. 此外, 给出模型的计算复杂度分析. 在多个公开数据集上的实验结果表明, 所提CKL-EFS在预测精度与抗非高斯扰动稳定性方面均优于现有代表性方法.
文章导读
混沌时间序列广泛存在于天文[1]、水文[2]、电力[3]和金融[4]等领域中. 在当代社会, 基于数据的混沌时间序列预测已成为计算机科学领域的研究重点[5]. 然而, 现实中提取的混沌时间序列通常表现出较强的非线性和噪声, 这对传统的预测方法提出挑战[6]. 随着信息技术和人工智能的不断发展[7−8], 各种数据挖掘技术为混沌时间序列的分析提供新视角[9−10]. 作为数据挖掘中的关键技术, 演化模糊系统(evol-ving fuzzy systems, EFSs)在处理复杂时间序列方面具有较强的竞争力[11−12]. EFSs的有效性已经在多个实际应用中得到验证[13]. 相比其他预测方法, EFSs推理和决策的过程类似于人类认知[14], 具备在线更新、结构可调和结果可解释等优势[15−16]. 现有工作大致可分为三类. 第一类是典型EFSs, 如基于经验数据分析的自主学习多模态系统(autonomous learning multi-model systems, ALMMo)[17], 能在数据漂移时自动生成或调整规则, 并通过递归最小二乘(recursive least squares, RLS)更新后件参数; Hu等[18]通过多种群信息集成粒子群优化(multi-population information integrated particle swarm optimization, MIIPSO)同时调整前后件参数, 进一步提升模型自适应性能. 但这类方法大多仍以均方误差(mean square error, MSE)[19−20]为主优化目标, 对强非高斯或脉冲噪声仍然敏感. 第二类工作将核学习或多层结构引入EFSs, 例如多层集成演化模糊推理系统(multilayer ensemble evolving fuzzy inference system, MEEFIS)[21]与基于核递归最小二乘和距离相关性的演化参与式学习(evolving participatory learning with kernel recursive least square and distance correlation, ePL-KRLS-DISCO)方法[22], 显著增强了非线性表征能力, 但仍使用MSE或无鲁棒性误差度量, 在遇到离散化、结构性非高斯噪声时, 预测稳定性仍会下降[23−24]. 第三类工作尝试把最大相关熵准则(maximum correntropy criterion, MCC)[25]、最大总相关熵(maximum total correntropy, MTC)[26]等信息论准则[27−28]引入EFSs, 如基于相关熵的演化模糊神经系统(correntropy-based evolving fuzzy neural system, CEFNS)[29]和基于演化参与式学习的核一般损失算法(kernel general loss algorithm based on evolving participatory learning, EPL-KGLA)[30], 能在一定程度上抑制离群点影响[31], 但多为单尺度或无梯度约束的相关熵形式, 且与在线核方法结合不紧密, 因而在强非线性和强非高斯场景下仍有改进空间. 现实世界中的混沌序列往往同时受到高斯噪声与非高斯噪声的干扰, 常表现为厚尾特性、间歇性离群点以及统计结构时变等复杂特征[32−33]. 在此类环境下, 仅依赖二阶统计量的MSE难以兼顾精度与鲁棒性[34]. 为此, 本文基于“EFSs +核学习 + 相关熵”融合框架进行统一建模, 主要贡献包括:
1)提出相关熵核学习演化模糊系统(correntropy kernel learning EFSs, CKL-EFS). 该系统在EFSs的递归学习过程中引入相关熵驱动的鲁棒目标, 并与在线核递归更新机制紧密耦合, 从而在非平稳、非高斯扰动下实现稳定在线更新. 相比基于MSE的EFSs, CKL-EFS显著提升了对离群冲击与重尾噪声的抗扰能力.
2)设计面向非高斯数据流的密度感知结构自维护机制. 模型通过全局密度新颖性检测与局部覆盖门控识别新分布/稀疏区域并触发按需增生; 对于已覆盖样本, 采用在线归属更新(样本归并到最相似数据云并更新其中心与统计量)以自适应跟踪分布漂移; 同时引入效用驱动的规则移除策略, 自动剔除长期低贡献的数据云, 从而抑制规则库无界膨胀并保持紧凑可部署的结构复杂度.
3)给出复杂度分析与多噪声场景下的实证验证. 本文分析模糊推理与核递推更新的时间复杂度上界, 并在Lorenz-96混沌系统、气象、水文及风电等多类数据集(涵盖不同强度与类型的非高斯扰动)上开展对比实验. 结果表明, CKL-EFS在保证在线效率的同时取得更低预测误差, 且在非高斯性增强时呈现更小的性能退化幅度.
本文其他部分组织如下: 第1节给出相关预备知识; 第2节介绍所提CKL-EFS的结构与学习算法; 第3节分析计算复杂度; 第4节给出实验结果及讨论; 第5节为结论与展望.
图1 CKL-EFS结构及内部驱动原理
图2 Lorenz-96数据集: 不同模型的规则数量和运行时间
图3 伦敦气象数据集: 不同预测因子的波动趋势和非高斯噪声分析
针对非高斯噪声环境下的在线预测任务, 本文提出了CKL-EFS. 在结构演化机制中, CKL-EFS通过数据密度动态监测样本空间结构的变化, 生成不同的数据云, 并且通过相应规则控制内部样本数量增长. 在参数更新机制中, 根据样本信息, 结合核学习策略和MTGC准则实现数据云内的参数更新. 在不同类型和强度的非高斯噪声数据集中的实验结果表明, 所提CKL-EFS的鲁棒性并非依赖于特定噪声分布, 而是能够在非高斯性逐步增强的情况下保持稳定的预测行为, 并且在不同领域中具有良好的泛化性能. 未来研究将从以下层面开展: 1)将CKL-EFS与深度学习的高维表征学习模块深度融合, 强化模型的特征提取能力; 2)引入滑动窗口策略进一步降低在线更新的计算成本.
作者简介
胡磊
大连理工大学控制科学与工程学院博士研究生. 主要研究方向为时间序列在线预测. E-mail: hl666888@mail.dlut.edu.cn
许星晗
大连理工大学建设工程学院博士研究生. 主要研究方向为水文时间序列分析及建模. 本文通信作者. E-mail: xuxh2023@dlut.edu.cn
刘建卫
大连理工大学建设工程学院副教授. 主要研究方向为水文系统机理分析及数据建模. E-mail: jwliu@dlut.edu.cn
韩敏
大连理工大学控制科学与工程学院教授. 主要研究方向为复杂系统建模及时间序列预测. E-mail: minhan@dlut.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-7-4 21:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社