|
引用本文
赵健程, 赵春晖. 面向全量测点耦合结构分析与估计的工业过程监测方法. 自动化学报, 2022, 48(x): 1−21 doi: 10.16383/j.aas.c220090
Zhao Jian-Cheng, Zhao Chun-Hui. An industrial process monitoring method based on total measurement point coupling structure analysis and estimation. Acta Automatica Sinica, 2022, 48(x): 1−21 doi: 10.16383/j.aas.c220090
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220090
关键词
自迭代特征替换,多核图卷积,全量测点估计,故障检测
摘要
实际工业场景中, 需要在生产过程中收集大量测点的数据, 从而掌握生产过程运行状态. 传统的过程监测方法通常仅评估运行状态整体的异常与否, 或对运行状态进行分级评估, 这种方式并不会直接定位故障部位, 不利于故障的高效检修. 为此, 提出了一种基于全量测点估计的监测模型, 根据全量测点估计值与实际值的偏差定义监测指标, 从而实现全量测点的分别精准监测. 为了克服原有的基于工况估计的监测方法监测不全面且对测点间耦合关系建模不充分的问题, 提出了多核图卷积网络(Multi-kernel graph convolution network, MKGCN), 通过将全量传感器测点视为一张全量测点图, 显式地对测点间耦合关系进行建模, 从而实现了全量传感器测点的同步工况估计. 此外, 面向在线监测场景, 设计了基于特征逼近的自迭代方法, 从而克服了在异常情况下由于测点间强耦合导致的部分测点估计值异常的问题. 所提出的方法在电厂百万千瓦超超临界机组中引风机的实际数据上进行了验证, 结果显示, 提出的监测方法与其他典型方法相比能够更精准地检测出发生故障的测点.
文章导读
工业过程运行状态监测对于提高生产效率, 保证生产安全具有重要意义. 复杂工业环境下运行工况的识别与复杂工业系统智能建模也是工业人工智能的重要研究方向之一[1]. 由于工业过程的连续不间断运行, 导致故障在不同层级间传播和演化, 使得工业过程的监测和诊断成为一个复杂的问题[2]. 为了监控工业生产设备的工作状态, 通常需要对大量测点进行监测, 从而保证工业生产过程的经济、高效、安全. 同一生产过程中, 众多测点之间存在机理上的相关性, 且测点的值和测点间的关系反映了设备性能和健康状况.
由于工业生产流程的复杂性, 基于第一性原理对工业生产过程建立准确的机理模型比较困难, 因此数据驱动的方法近年来获得了许多关注[3-4]. 从历史的过程数据中提取信息进行建模, 从而进行运行工况监测的数据驱动方法已成为运行工况研究的热点领域之一[5]. 具体来说, 基于统计的过程监测方法通常通过建立监测模型, 定义并计算监测统计量, 根据统计量是否超过控制限判断过程的运行状态, 如基于主元分析(Principal component analysis, PCA)[6-7]、协整分析(Cointegration analysis, CA)[8]、慢特征分析 (Slow feature analysis, SFA)[9-10]、独立成分分析(Independent component analysis, ICA)的方法[11]等. 神经网络[12-14]、贝叶斯网络[15]等方法也被广泛应用于工业生产过程监测、异常检测场景. 此外, 自编码器(Autoencoder, AE) 结构作为一种有效的异常检测方法, 在图像异常检测[16]、时间序列异常检测[17-19] 等多领域异常检测方面取得了广泛的应用. 然而, 一般的监测方法通常仅判断过程整体的运行状态故障与否, 或对运行状态健康程度进行分级评估. 这种方式并不能直接定位具体故障的故障部位或传感器测点, 需要进一步使用故障隔离、故障根因追溯[20-21]等方法定位具体发生故障的部位, 明确报警的具体测点, 从而便于一线人员进一步检修. 此外, 对于一线操作人员, 复杂的监测指标是难以理解的. 相对而言, 直接给出测点的估计值, 更有利于一线操作人员理解并进行故障定位.
大量过程数据、工艺数据为判断工业过程运行状态、明确故障原因提供了丰富的数据支持[22]. 本文中描述的测点估计, 定义为以各个测点传感器当前及历史测量得到的数据作为输入, 重构出当前时刻在正常运行状态下各个测点的估计值. 在对测点进行准确估计的基础上, 通过测点估计值与实测值间出现的显著偏差, 为一线人员故障检修提供直接的参考. 对于工业过程中的测点估计任务, 一种经典有效的方法是多变量状态估计方法(Multivariate state estimation technique, MEST), 在多个领域得到了广泛应用[23-27]. MEST方法使用系统正常运行条件下收集到的足够多的历史数据构建过程记忆矩阵, 使用当前实际测量得到的数据与过程记忆矩阵中的各个历史状态计算相似度, 并利用相似度对历史状态进行加权求和, 从而得到当前系统状态的估计值. 然而, 这种方法一方面对过程记忆矩阵的要求较高, 需要其包含该系统全部正常运行范围和系统所有的特殊状态, 没有对系统内变量间潜在的耦合关系进行有效的建模与学习, 泛化能力较差; 另一方面缺少一种可靠的纠错机制, 系统中的某些变量出现异常可能导致当前状态与过程记忆矩阵中某些本不该相似的状态之间相似性提高, 使估计值出现异常, 从而无法准确判断当前状态的异常情况.
另一种可行的测点估计方法是软测量方法. 对于某一个具体的测点而言, 利用其他测点的信息对其进行估计, 与一般的软测量任务的范式是一致的. 随着大量工业传感器和工业物联网技术的使用, 大量的过程数据被累积, 为数据驱动的软测量方法提供了支持. He等[4]结合偏最小二乘算法(Partial least squares, PLS)和极限学习机(Extreme learning machine, ELM), 对精对苯二甲酸工艺过程的关键变量进行预测. Fan等[28]结合多层感知器(Multi-layer perceptron, MLP) 和双LASSO (Least absolute shrinkage and selection operator)算法, 对原油蒸馏过程中的重要产物(煤油)进行预测. Zhang等[29]基于进化极限学习机估计真实丙烯聚合过程变量的熔融指数. 深度学习方法在工业过程软测量领域也得到了有效应用. Ke等[30]开发了一种基于长短期记忆网络 (Long short term memory, LSTM)的软测量模型, 针对硫磺回收装置脱硫系统中SO2和H2S的含量进行预测, 展现了LSTM对工业过程动态性进行建模的能力. Yuan等[31]设计了一种动态卷积神经网络, 用于在软测量模型中学习分层局部非线性动态特征. Zhu等[32]使用卷积神经网络(Convolutional neural networks, CNN), 应用移动窗口法, 在软测量模型中捕获主导变量和辅助变量间时序相关性. 常树超等[33]提出了一种应用于工业过程软测量时空协同的图卷积网络(Graph convolutional networks, GCN), 使用LSTM捕获时序特征, 并使用图神经网络显式地建模各个测点间的相关性. 一般的软测量方法通常仅建立少数、部分测点作为输出的模型. 然而, 只对少数测点进行监测不能够全面充分地反映过程的运行状态, 且忽略了部分指标之间的相关性. 一种可能的策略是轮换建立以当前时刻部分指标为输出, 其余全部指标为输入的模型. 然而, 这种方法每次仅以单个指标为目标, 对于以多测点估计为目标的任务而言, 没有更深入地建模和挖掘测点之间的耦合关系. 此外, 这种方法对大量测点的信息进行了重复的特征提取操作, 且需建立多个模型, 费时费力.
随着图神经网络的蓬勃发展, 一些基于图的方法, 例如图卷积网络[34], 在多种类型的任务中取得了良好的效果. 基于图卷积方法, 能够同时更新图中全部节点的特征. 若将众多传感器测点视为一张过程全量测点图, 就能够使用单个图卷积模型实现所有测点特征的同步更新. 基于图的方法通常需要确定图的结构, 即邻接矩阵. 然而, 由于工业生产过程的复杂性, 工业测点之间的关系是部分甚至全部未知的. 也就是说, 基于测点建立的生产过程全量测点图, 其图结构是未知的. 一些确定邻接矩阵的方法已经被提出, 例如基于稀疏编码的方法[33]、基于相关性度量的方法[35], 这两种方式都不是端到端的. Wu等[36]在多变量时间序列预测任务中提出了一种用于获得图邻接矩阵的图学习层, 基于学习到的节点特征和稀疏性约束能够端到端地学习邻接矩阵. 然而, 上述方法均仅确定单一的邻接矩阵, 对一个内部机理复杂的工业过程而言, 单个邻接矩阵未必能够充分描述众多测点间的耦合关系.
当工业生产过程处于正常状态时, 一个能够充分建模测点之间相关关系的估计模型无疑是好的. 然而, 当某些测点测量的物理量因为某种原因出现异常变化时, 可能会导致模型对于正常的测点的估计同时出现异常, 即产生误报警; 或导致模型对于部分异常的测点的估计出现异常, 导致无法辨识出部分异常的测点, 即产生漏报警, 这也是基于软测量或估计的方法进行异常监测所面对的主要难点.
本文所述的全量测点, 定义为工业过程中某一对象可获得、用于建模的全部测点. 本文将图的邻接矩阵视为一种图的结构特征估计算子, 称之为邻接核(Adjacency kernel), 从而构建了多核图卷积网络(Multi-kernel graph convolution network, MKGCN). 并通过多组可学习的邻接核得到全量测点图不同通道的特征, 从而面向工业场景下图结构未知的任务实现了更充分、更鲁棒的建模. 在提出多核图卷积网络的基础上, 本文在模型训练过程中提出了特征逼近约束, 并引入了自迭代方法, 通过估计特征逼近和自迭代替换异常特征, 逐步消除异常工况下异常测点对模型估计其他测点造成的干扰, 从而在异常情况下也能实现对全测点的良好估计. 在得到了全量测点的估计值后, 通过测点估计值和实际值的偏差情况判断测点在当前时刻是否出现异常. 在训练阶段, 基于模型估计值和实际值的偏差, 确定每个测点的控制限. 在应用阶段, 根据控制限和偏差情况确定测点是否出现异常, 实现了全量测点的监测.
本文的主要贡献点如下:
1) 提出了一种基于测点间耦合结构分析与测点误差估计的全量测点同步监测理念. 通过将众多测点视为一张工业生产全量测点图的节点, 提出了一种多核图卷积网络, 从而对测点间的耦合结构进行显式的建模与充分的学习. 通过全量测点特征的同步更新, 基于单模型实现了全部测点的同步估计与监测.
2) 通过在多核图卷积网络的基础上引入基于特征逼近的自迭代方法, 构建了一种可靠的纠错机制. 应用训练好的基于多核图卷积网络的工况估计模型, 在自迭代过程中逐步消除异常特征的衍生影响, 缓解了系统工作异常的情况下异常测点对其他测点的估计造成的干扰, 在多个测点同时产生异常时仍能保持全量测点估计值的准确性.
图 1 LSTM内部结构
图 2 面向全量测点估计的多核图卷积模型结构
图 3 MKGCN层的计算过程
本文提出了一种面向全量测点耦合结构分析的多核图卷积估计模型, 并引入自迭代方法, 基于此设计了过程估计与监测方法. 与经典的多变量状态估计方法相比, 本文提出的测点估计与监测方法能够更充分地对测点间的耦合关系进行建模, 提升监测性能, 与一般的监测方法相比更加直观、全面. 通过将众多测点视为一张工业生产全量测点图中的节点, 本文提出了多核图卷积层对测点间的耦合结构进行有效地建模与学习, 基于估计偏差建立了监测指标, 从而实现全量测点的同步估计与监测. 并通过引入基于特征逼近的自迭代方法这一纠错机制, 有效消除了异常特征对于正常测点估计的干扰. 通过火电厂百万千瓦超超临界机组中重要辅机(引风机)的实际生产数据验证了所提方法在真实场景下的有效性. 所提方法在模型参数较少的情况下显著降低了系统异常情况下对于正常测点的误报情况, 能够对各个测点实现精准估计和有效监测, 对故障发生时快速精准定位故障原因具有重要意义.
作者简介
赵健程
浙江大学控制科学与工程学院博士研究生. 2021年获得浙江大学控制科学与工程学院自动化专业学士学位. 主要研究方向为大数据分析, 深度学习和零样本学习. E-mail: zhaojiancheng@zju.edu.cn
赵春晖
浙江大学控制科学与工程学院教授. 2003年获得中国东北大学自动化专业学士学位, 2009年获得中国东北大学控制理论与控制工程专业博士学位, 先后在中国香港科技大学、美国加州大学圣塔芭芭拉分校做博士后研究工作. 主要研究方向为机器学习, 工业大数据解析与应用, 包括化工, 能源以及医疗领域. 本文通信作者. E-mail: chhzhao@zju.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-17 13:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社