IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于马氏距离的改进核Fisher化工故障诊断研究

已有 1920 次阅读 2023-1-25 16:15 |系统分类:博客资讯

引用本文

 

吕鹏飞, 闫云聚, 荔越. 基于马氏距离的改进核Fisher化工故障诊断研究. 自动化学报, 2020, 46(11): 23792391 doi: 10.16383/j.aas.c190635

Lv Peng-Fei, Yan Yun-Ju, Li Yue. Research on fault diagnosis of improved kernel Fisher based on Mahalanobis distance in the field of chemical industry. Acta Automatica Sinica, 2020, 46(11): 23792391 doi: 10.16383/j.aas.c190635

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190635

 

关键词

 

Fisher,故障诊断,区间三分法,TE过程,优化 

 

摘要

 

针对化工故障诊断数据存在非线性分布、 数据类别复杂、数据量大且故障特征不易区分等问题, 本文提出一种基于马氏距离的改进核Fisher故障诊断方法(Mahalanobis distance-based kernel Fisher discrimination, MKFD). 首先, 针对数据非线性分布的特点, 本文将核Fisher判别分析算法改进, 改进后的算法可以有效解决原始样本在投影后出现的因类间距离差异过大、类内距离不够紧凑造成的样本混叠现象. 除此之外, 利用Euclidean距离对类间距做加权处理时, 用组平均距离取代质心距离, 提升了运算效率, 降低了时间复杂度; 其次, 根据高斯径向基核函数(Radial basis function, RBF)MKFD中所呈现出的诊断精度的规律, 本文采用一种新的核参数选择方法: 区间三分法, 用以取代在实际应用中依靠经验的交叉验证法; 最后, 本文采用马氏距离对故障进行分类, 基于田纳西伊—斯特曼过程(Tennessee-Eastman, TE)数据将本方法与其他改进核Fisher算法进行仿真验证对比. 结果表明新提出MKFD算法不仅可以提高故障诊断的运算效率, 也能有效提高诊断的精度.

 

文章导读

 

随着科技的不断进步,现代化工业正发生着翻天覆地的变化, 工厂操作的复杂度急剧增加. 与此同时, 操作过程中测量的变量更加具有复杂性、非线性和巨量性, 而这些测量变量的新性质导致了监测平台操作挑战性不断升级[1]. 在化工过程中, 监测系统产生了大量的实测数据, 对这些数据的有效利用来实现实时监控和故障诊断, 为确保生产设备安全、降低维护成本、提高利润率提供了可靠的保证[2]. 因此, 高效的故障诊断技术正在工业生产的发展中扮演着愈来愈重要的角色.

 

在化工生产过程中, 需要建立监测平台对整个操作过程进行监控, 并利用监测平台得到的数据进行故障诊断, 从而确保化工产业生产设备安全, 降低维护成本, 提高利润率. 化工过程的故障诊断问题可以看作是对故障数据的分类问题, 其中包括故障特征提取技术、模式识别技术以及故障分类技术. 常见的特征提取方法有: 主元分析法[3] (Principal component analysis, PCA)、偏最小二乘法[4] (Partial least squares, PLS)、核熵分析法[5] (Kernel entropy component analysis, KECA)、独立主元法[6] (Independent component analysis, ICA). 然而, 在面向化工的实际应用中, 单纯的多元统计分析并没有取得良好的分类效果. 这是由于化工数据具有很强的非线性, 数据类别复杂、数据量大而且故障特征不易区分的特点[7]. 基于以上问题, Mika[8]将核函数引入Fisher判别分析算法, 得到了一种新的核Fisher判别法. 该方法在面对复杂的化工过程状态数据时, 能有效地解决因非线性造成的分类困难问题, 因此得到了广泛的应用. 随后, 国内外研究者对该算法进行了深入的研究并提出了许多改进措施. 张曦等[9]提出了基于核Fisher子空间特征提取的汽轮发电机组过程监控和故障诊断新方法, 该方法将原始样本数据从低维非线性空间映射到高维线性空间, 再利用线性Fisher判别分析算法提取原始样本数据的最优特征矢量, 实现了对汽轮发动机组的过程监控. 马立玲等[10]采用Euclidean距离对Fisher判别准则中的类间距做加权, 使得样本数据具有较好的投影效果, 然后通过改进K近邻算法[11]和马氏距离[12-13]算法对数据进行分类, 仿真验证结果表明改进后的核Fisher方法有效改善了因类间距较小而造成的投影数据混叠现象.

 

然而, 已有的改进核Fisher判别分析方法中, 仍存在以下问题: 1)在投影过程中, 类间距差异较大的类别之间出现投影混叠现象; 2)因为类内比较分散, 数据投影后会出现因类内距不够紧凑而出现的重叠现象; 3)在引入高斯径向基核函数(Radial basis function, RBF), 选取非最优的核参数会直接导致故障诊断性能的降低[14]. 为解决以上问题, 本文提出了一种基于马氏距离的改进核Fisher故障诊断方法(MKFD), 该方法采用了区间三分迭代法选取核参数, 利用组平均距离取代质心距离降低运算复杂度并通过加权改进类内的距离, 有效改善了投影效果. 最后, 在田纳西伊斯特曼过程平台上对该方法进行仿真试验验证, 并与传统的核Fisher诊断方法(Kernel fisher discrimination, KFD)、基于质心距离对类间距进行加权处理的核Fisher判别分析(Centroid kernel fisher discriminate, CKFD)和基于Fisher判别分析的全局局部保持投影算法(Fisher discriminant global-local preserving projection, FDGLPP)进行了对比. 结果表明, 本文提出的方法不仅提高了运算速度, 同时也有效提高了故障诊断的精度, 具有很高的工程应用价值.

 1  分类准确率变化图

 2  A, B, C的符号

 3  故障诊断准确率与核参数取值折线图

 

复杂的化工过程产生了大量的状态数据, 这些数据具有大量、非线性的特点. 引入KFD算法进行特征提取, 可以有效解决数据非线性问题, 提升算法效率. KFD算法也有一些缺点, 本文针对故障数据分类效果差及无法快速确定最优核参数这两个缺点, 提出了MKFD算法.

 

MKFD算法中, 选用区间三分法来克服核参数的低效选取问题, 该方法不仅可以解决依靠经验选择参数的劣势, 还可以避免遗漏最优解, 可以有效提升核参数的选取效率. 该方法基于TE过程数据做仿真验证, 并与之前常用的交叉验证法做对比, 结果表明: 在最优参数精度范围内, 本文所提方法加快了参数选择速度; 同时, 运用马氏距离对类间和类内距离进行加权, 不仅可以最大限度地分离投影向量的类间距离, 还可以使得其类内距离更紧凑, 显著提升了故障诊断算法的运行效率.

 

在本文提及的方法中, 数据量大所带来的矩阵非奇异的情况可以进一步深入研究, 除此之外, 并行运算, 实时监控, 提取最大信息量也是需要进一步深入研究的方向.

 

作者简介

 

吕鹏飞

西北工业大学硕士研究生. 主要研究方向为机器学习与故障诊断.E-mail: 13571807486@163.com

 

闫云聚

西北工业大学力学与土木建筑学院教授. 主要研究方向为信息融合与故障智能诊断系统. 本文通信作者.E-mail: yjyan_2895@nwpu.edu.cn

 

荔越

西北工业大学力学与土木建筑学院博士研究生. 主要研究方向为故障诊断与机器学习.E-mail: christli@mail.nwpu.edu.cn



https://blog.sciencenet.cn/blog-3291369-1373406.html

上一篇:基于 WTFMC 算法的递归模糊神经网络结构设计
下一篇:基于高斯过程的多机动扩展目标跟踪
收藏 IP: 117.136.38.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-28 11:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部