|
引用本文
张成, 高宪文, 李元.基于k近邻主元得分差分的故障检测策略.自动化学报, 2020, 46(10): 2229-2238 doi: 10.16383/j.aas.c180163
Zhang Cheng, Gao Xian-Wen, Li Yuan. Fault detection strategy based on principal component score difference of k nearest neighbors. Acta Automatica Sinica, 2020, 46(10): 2229-2238 doi: 10.16383/j.aas.c180163
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180163
关键词
主元分析,得分差分,k近邻,多模态过程,TE过程,故障检测
摘要
针对具有非线性和多模态特征过程的故障检测问题, 本文提出一种基于k近邻主元得分差分的故障检测策略.首先, 通过主元分析(Principal component analysis, PCA)方法计算样本的真实得分.然后, 应用样本的k近邻均值计算样本估计得分.接下来, 通过上述两种得分计算样本的得分差分矩阵和残差矩阵, 其中残差矩阵由样本的估计得分计算得到,这区别于传统方法.最后, 在差分子空间和残差子空间中分别建立新的统计指标进行故障检测.值得注意的是本文的得分差分方法能够消除数据结构对过程故障检测的影响, 同时, 新的统计量能够提高过程的故障检测率.将本文方法在两个模拟例子和Tennessee Eastman (TE)过程中进行测试, 并与传统方法如PCA、KPCA、DPCA和~FD-kNN等进行对比分析, 测试结果证明了本文方法的有效性.
文章导读
在现代化生产过程中, 有效的故障检测方法能够保障生产安全和提高生产效率.由于生产过程中多变量数据可以由分布式控制系统进行采集, 因此, 许多基于数据驱动的多变量统计过程控制(Multivariate statistical process control, MSPC)方法已经得到了广泛应用并取得了可喜的成果[1-2].
主元分析(Principal component analysis, PCA)作为一种典型的MSPC方法已经成功地被应用到生产过程的故障检测领域中并取得良好的效果[3-4]. PCA通过对监控变量实施线性变换并依据累积百分比方差(Cumulative percent variance, CPV)将输入空间分解为主元子空间(Principal component subspace, PCS)和残差子空间(Residual subspace, RS).在PCS和RS中, 分别应用T2和平方预测误差(Square prediction error, SPE)两个统计量实现对样本状态(正常或故障)的监控[4].近年来, 基于PCA的不同故障检测策略已经被提出, 如核主元分析(Kernel PCA, KPCA)[5]和动态主元分析(Dynamic PCA, DPCA)[6]. KPCA是指首先通过非线性变换将输入空间映射至高维特征空间(Feature space, FS), 然后在FS中执行PCA方法进行故障检测[7].由于KPCA能够捕获过程的非线性特征, 故它更适合非线性过程的故障检测[8]. DPCA是考虑到过程的动态特征而被提出的.在DPCA方法中, 首先通过增广过程时间序列的方法将样本的动态特征转换为变量静态特征, 然后应用静态PCA实现对过程动态和静态特征的同步提取[9].需要注意的是上述基于PCA的不同方法首先对样本数据进行适当处理, 然后执行PCA故障检测.故障检测过程仍然应用T2和SPE两个统计量对过程进行监控. T2和SPE适用于单模态过程故障检测, 并且在故障检测过程中通常假设过程变量是独立同分布[10].当得分变量存在多模态结构或非线性相关时, T2和SPE控制图通常具有较低的故障检测率(Fault detection rate, FDR)或较高的误报率(False alarm rate, FAR)[11].
针对非线性和多模态过程故障检测问题, He等提出应用k近邻规则的故障检测(Fault detection using the k-nearest neighbor rule, FD-kNN)方法[12]. FD-kNN首先在训练集中依据欧氏距离查找样本的k近邻集, 然后以样本与其k近邻的距离之和作为统计指标进行过程监控.该方法能够降低过程的非线性和多模态等特征对故障检测的影响, 相比传统的基于PCA的不同方法具有较高的故障检测性能[12].与传统多模型方法相比[13-14], FD-kNN在多模态过程中只需要建立一个模型即可完成过程的故障检测, 它是一种更加适合多模态过程故障检测的单模型方法.考虑到FD-kNN中查找k近邻计算的复杂度, 一种基于主元的k近邻规则(Principal component-based k nearest neighbor rule, PC-kNN)被提出[15].该方法只在主元空间执行k近邻规则进行故障检测.由于少量主元参与查找样本k近邻的计算, 因此相比FD-kNN, PC-kNN具有高效性.然而, FD-kNN和PC-kNN方法具有相应的局限性[16].首先, 在多模态过程中如果模态方差结构差异明显, 即存在密集模态和稀疏模态, 这时密集模态的小尺度故障通常不能被上述方法检测.其次, PC-kNN方法只监视了样本在PCS中的变化, 一旦故障完全发生在RS中该方法是无效的.
针对具有非线性和多模态特征过程的故障检测问题, 本文提出一种基于k近邻主元得分差分的故障检测策略(Fault detection strategy based on principal component score difference of k nearest neighbors, kDiff-PCA).在kDiff-PCA中, 首先在训练集中查找样本的k近邻集并计算该集合的均值样本; 然后, 应用PCA计算训练集的主元负载矩阵, 同时计算样本与其均值样本的主元得分向量; 接下来, 计算每个样本的得分差分向量并获得过程的差分子空间; 最后, 在差分子空间计算新的统计量进行过程监控.在样本残差的计算中, 本文应用上述均值样本的得分对测试样本进行重构, 该过程区别于传统的残差计算方法.
图 1 非线性例子:样本散点图
图 2 PCA检测结果
图 3 KPCA检测结果
为了更好地对非线性和多模态过程进行故障检测, 本文提出一种基于主元得分差分的故障检测策略.得分差分方法能够降低过程数据多模态或变量非线性特征的影响, 能够提高故障检测率.通过模拟测试与对比分析, 本文方法的有效性得到验证.由于本文方法应用k近邻规则进行得分估计, 因此近邻数的选择问题是接下来研究的一个方向; 同时, 本文方法在间歇生产过程中的应用也是未来的一个研究问题.
作者简介
张成
沈阳化工大学副教授, 东北大学博士研究生.主要研究方向为复杂工业过程故障诊断.
E-mail: zhangcheng@syuct.edu.cn
李元
沈阳化工大学教授. 2004年获得东北大学博士学位.主要研究方向为系统识别, 故障检测, 复杂过程故障诊断.
E-mail: liyuan@mail.tsinghua.edu.cn
高宪文
东北大学教授. 1998年获得东北大学博士学位.主要研究方向为工业过程监视和故障诊断, 数据分析, 模式识别.本文通信作者.
E-mail: gaoxianwen@ise.neu.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-26 02:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社