|
韩敏, 李宇, 韩冰.基于改进结构保持数据降维方法的故障诊断研究.自动化学报, 2021, 47(2): 338-348 doi: 10.16383/j.aas.c180138
Han Min, Li Yu, Han Bing. Research on fault diagnosis of data dimension reduction based on improved structure preserving algorithm. Acta Automatica Sinica, 2021, 47(2): 338-348 doi: 10.16383/j.aas.c180138
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180138
关键词
特征提取,数据降维,核主成分分析,局部保持投影法,故障诊断
摘要
传统基于核主成分分析(Kernel principal component analysis, KPCA)的数据降维方法在提取有效特征信息时只考虑全局结构保持而未考虑样本间的局部近邻结构保持问题, 本文提出一种改进全局结构保持算法的特征提取与降维方法.改进的特征提取与降维方法将流形学习中核局部保持投影(Kernel locality preserving projection, KLPP)的思想融入核主成分分析的目标函数中, 使样本投影后的特征空间不仅保持原始样本空间的整体结构, 还保持样本空间相似的局部近邻结构, 包含更丰富的特征信息.上述方法通过同时进行的正交化处理可避免局部子空间结构发生失真, 并能够直观显示出低维结果, 将低维数据输入最近邻分类器, 以识别率和聚类分析结果作为衡量指标, 同时将所提方法应用于故障诊断中.使用AVL Boost软件模拟的柴油机故障数据和田纳西(Tennessee Eastman, TE)化工数据仿真, 验证了所提方法的有效性.
文章导读
数据降维方法在众多领域应用广泛, 其划分依据也不尽相同, 按照数据结构特征保持与否的准则进行划分, 则可根据数据的全局结构保持和局部结构保持分成两类[1], 前者反映了数据的外部形状, 后者反映了数据的内在属性, 可以寻找出高维观测数据中所隐藏的低维流形结构.其中, 主成分分析(Principal component analysis,PCA)[2]、独立元分析[3]和人工神经网络[4]等方法均为数据全局特征结构保持的代表方法, 核主成分分析(Kernel principal component analysis, KPCA)[5]通过非线性映射函数将线性不可分的原始样本数据输入空间通过投影变换到线性可分的高维特征空间, 然后在新的特征空间中利用线性方法完成主成分分析, 从而实现数据整体方差最大化, 但KPCA方法只能够提取数据的全局结构信息, 若数据中低维局部结构中包含较多特征信息的话, 则效果较差.另外, 流形学习能够从高维历史信息中获取数据间有效的内部联系, 从而得以保持局部结构特征, 具有良好的非线性数据内部属性的处理能力[6-7], 代表性的流行学习[8]方法主要包括等距特征映射算法(Isometric feature mapping, ISOMAP)[9], 拉普拉斯特征映射算法(Laplacian eigenmaps, LE)[10], 局部线性嵌入算法(Locally linear embedding, LLE)[11], 局部保持投影算法(Locality preserving projections, LPP)[12]等, 其中, 有学者在LPP算法中引入核方法, 提出核局部保持投影(Kernel locality preserving projection, KLPP)[13], 其在保持局部结构特征的同时实现线性计算, 反映出数据的局部结构特征, 但本质上KLPP是一种基于局部结构保持的降维方法, 它并不能有效提取出数据的全局特征信息[14].
针对以上问题, 本研究拟对KPCA与KLPP相结合的降维方法进行探讨, 提出了本文的解决办法, 并把新提出的算法命名为改进全局与局部结构保持算法(Global and local structure preserving, GLSP), 在进行原始数据的投影变换时, 既考虑全局结构得以保持, 也兼顾保持局部近邻结构.首先使用局部与全部特征提取方法, 解决数据有效降维的问题, 使用聚类分析中类内距离与类间距离等作为衡量指标, 并使用K近邻(K-nearest neighbor, KNN)方法进行故障的检测[15].本文数据使用柴油机仿真故障数据[16]和TE过程公共数据集, 用于验证方法的有效性.
图1 数据降维方法流程
图2 柴油机模型仿真
图3 不同维度贡献率统计图
本文通过融合全局特征提取KPCA与局部特征提取KLPP两种降维方法, 提出一种结合两种降维方法的数据维数约简方法GLSP, 增强了数据低维可视化效果, 同时提高了识别精度, 并将其应用于故障诊断中.所提方法将流形学习保持局部结构的思想融入核主成分分析的目标函数中, 使得到的特征空间不仅具有原始样本空间的整体结构, 还保持样本空间相似的局部近邻结构, 可以包含更丰富的特征信息.使用AVL Boost软件对船舶柴油机工作过程进行故障仿真, 提取正常工况与故障工况下的仿真数据, 并将AVL Boost软件仿真数据和TE化工公共故障数据应用到所提方法中, 实验结果证明, 本文所提GLSP算法具有较好的维度约简效果, 并具有较高分类精度的优势.
作者简介
李宇
大连理工大学电子信息与电气工程学部硕士研究生.主要研究方向为柴油机故障诊断技术. E-mail: liyu0512@mail.dlut.edu.cn
韩冰
上海船舶航运研究院航海与安全技术国家重点实验室研究员.主要研究方向为船舶动力平台故障诊断和故障预测. E-mail: hanbing@sssri.com
韩敏
大连理工大学电子信息与电气工程学部教授.主要研究方向为模式识别, 复杂系统建模与分析及时间序列预测.本文通信作者. E-mail: minhan@dlut.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-26 11:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社