IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于鲁棒加权模糊聚类的污水处理过程监测方法

已有 1868 次阅读 2022-9-22 17:55 |系统分类:博客资讯

引用本文

 

张瑞垚, 周平. 基于鲁棒加权模糊聚类的污水处理过程监测方法. 自动化学报, 2022, 48(9): 2198−2211 doi: 10.16383/j.aas.c200392

Zhang Rui-Yao, Zhou Ping. Robust weighted fuzzy clustering for sewage treatment process monitoring. Acta Automatica Sinica, 2022, 48(9): 2198−2211 doi: 10.16383/j.aas.c200392

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200392

 

关键词

 

污水处理,鲁棒加权模糊c均值,核偏最小二乘,过程监测 

 

摘要

 

针对非线性强、先验故障知识少、异常工况识别难的污水处理过程监测问题, 提出一种基于鲁棒加权模糊c均值(Robust weighted fuzzy c-means, RoW-FCM)聚类与核偏最小二乘(Kernel partial least squares, KPLS)的过程监测方法. 首先, 针对污水处理过程的高维非线性耦合特性, 采用核偏最小二乘对高维输入变量进行降维; 其次, 针对传统基于最近邻分配的模糊c均值算法对离群点敏感以及存在聚类不平衡簇的问题, 提出充分考虑样本间相互关系的基于鲁棒加权模糊c均值聚类算法. 通过引入可能性划分矩阵作为权值参数实现不同样本数据的区分加权, 提高了离群点数据聚类的鲁棒性, 同时引入聚类大小控制参数解决不平衡簇的问题. 进一步将基于鲁棒加权模糊c均值算法对核偏最小二乘降维后的得分矩阵进行聚类, 利用聚类得到的隶属度矩阵实现异常工况的检测; 最后, 建立隶属度矩阵与过程变量的回归模型, 并利用得到的变量贡献矩阵描述变量对各个簇的解释程度, 实现异常工况的识别. 数值仿真以及污水处理过程数据实验表明该方法具有更好的鲁棒性能, 在异常工况检测和识别上具有较好的效果.

 

文章导读

 

污水处理工业在中国水资源可持续发展中占据重要一环. 目前, 应用最广泛的污水处理工艺是活性污泥法[1]. 如图1所示, 活性污泥法污水处理工艺流程通常按照处理程度分为一级处理(预处理)、二级处理(生化处理)和三级处理(深度处理)[2]. 原污水首先经过格栅拦截较大悬浮物或漂浮杂质后进入沉砂池, 沉砂池将密度较大无机悬浮物从污水中分离, 然后进入初沉池. 完成一级处理的污水经初沉池出水, 并与回流的二沉池沉淀污泥按一定比例混合进入曝气池. 曝气池分为缺氧区和好氧区. 在缺氧区中, 内循环回流的硝态氮在异养菌无氧呼吸作用下被还原为氮气; 在好氧区中, 氨氮在自养菌有氧呼吸作用下发生硝化反应, 有机物被进一步降解. 随后污水经曝气池出水进入二沉池, 将澄清水与活性污泥进行固液分离. 分离后, 澄清水排入受纳水体或经过物理、化学等技术进一步去除污染物后实现中水回用. 二沉池除回流污泥外的沉淀污泥与初沉池的污泥混合, 经过浓缩、消化、脱水等工艺后做最终处置及回收利用[2-4].

1 污水处理工艺流程示意图

 

污水处理的根本目的是将城市生活、工业生产等产生的污水经过上述污水处理的各道工序后达到国家规定的出水指标. 目前, 污水处理出水质量指标主要包括生化需氧量、化学需氧量、总悬浮物、总磷、氨氮等. 在污水处理过程中, 由于进水流量、进水组分、污染物种类、天气变化等都是被动接受, 微生物种群、溶解氧浓度、污水pH值等多种因素对微生物的生命活动都会产生巨大的影响, 因此保持污水处理厂的长期稳定运行十分困难[4−5]. 由于污水处理时常处于非平稳状态运行, 因此容易引发异常工况的发生. 如果不能及时监测到污水处理过程异常工况, 导致不能正确判断且没有采取有效措施加以调整纠正, 会导致出水水质不达标、污水处理能力降低, 甚至会引发污水处理过程的崩溃, 导致不可逆的事故发生, 使得运行成本大大增加并且造成环境污染. 所以, 通过建立有效监测方法来监测污水处理过程, 对异常工况做出准确判断, 并及时准确地采取有效措施, 对保证污水处理过程安全稳定顺行以及出水水质的达标尤其重要.

 

由于污水处理过程是一个多变量、强耦合、大时滞、高度非线性的复杂动态非平稳生化反应过程[5], 机理模型很难完全考虑污水处理全流程的运行状态. 大部分机理模型都是基于局部过程建立的, 因此在描述污水处理过程特性时具有很大的局限性[6−7], 这就促进了数据驱动尤其是基于机器学习与多元统计分析的过程监测与故障诊断方法在污水处理过程中的应用[5]. 文献[8]提出了一种基于在线估计技术和反向传播神经网络的故障检测和诊断方法, 不仅具有鲁棒性, 而且能够避免阈值问题, 显示出较好的应用可靠性. 文献[9]提出的粗集支持向量机分类方法降低了样本属性并保留一定的冗余性, 对污水处理过程运行状态的监测实验验证了该方法的有效性. 文献[10]针对主元分析对于噪声和不确定信息描述能力不足的问题, 提出了因子分析故障诊断方法, 在污水仿真基准模型的验证表明该方法能够降低传统主元分析方法的故障误报率, 对不确定信息具有较好的描述能力. 近年来, 由于污水处理数据缺少分类标识, 且先验知识匮乏, 因此模糊聚类技术在污水处理过程监测中得到了越来越多的应用. 模糊聚类是一种无监督分类技术, 本身具有捕获数据非线性结构的能力, 可以充分挖掘污水处理过程的数据信息, 通过建立模糊相似关系对过程进行监测和诊断[11]. 文献[12]针对采样数据维度过高的问题, 采用了主元分析和可能性模糊c均值(Possibilistic fuzzy c-means, PFCM)聚类相结合的方法, 在田纳西−伊斯曼过程仿真实验中取得较好效果. 但是主元分析是一种线性降维技术, 对于污水处理这样的高维非线性系统, 其实际应用效果会有很大局限性. 文献[13]提出了偏最小二乘、可能性聚类(Possibilistic c-means, PCM)与模糊c均值(Fuzzy c-means, FCM)的组合方法, 并给出了一种递归原型更新算法. 偏最小二乘算法的使用抑制了与输出数据无关的噪声和变化, 促进了PCM和FCM的应用, 使其更容易找到簇和相应的原型, 但聚类算法FCM对离群点敏感, 因此其监测效果易受离群点影响, 鲁棒性差. 当监测到异常工况发生时, 需要及时识别出导致异常工况发生的异常变量. 目前, 贡献图方法是最为普遍的故障识别方法[14]. Zhou等[15]提出了基于主元分析的贡献图方法, 用于辨识与故障相关的关键变量. Dunia等[16]提出了基于重构和平方预测误差方法, 即利用重构平方预测误差与实际平方预测误差的比值进行故障辨识. 文献[17]提出了一种基于核主成分分析的方法, 特别是在鲁棒重构误差的基础上, 提出了一种新的故障识别方法. 其基本思路是当重构的变量是故障变量时, 此变量的故障指标会比非故障变量的指标值偏小. 如今, 基于模糊聚类的故障识别方法的研究也得到越来越多专家学者的研究. 文献[18]提出了一种基于自回归滑动平均模型双谱分布特征与模糊c均值聚类分析的故障识别方法, 该方法通过FCM聚类构造类模板和最小距离模板的分类器, 实现了滚动轴承的故障识别. 文献[19]将模糊c均值算法和Gustafson-Kessel聚类算法用于燃气轮机故障的故障检测和识别, 仿真结果表明模糊聚类方法具有可接受的故障识别性能.

 

综上, 本文针对非平稳污水处理工业过程的非线性强、先验故障知识少、异常工况识别难等问题, 提出了一种基于鲁棒加权模糊c均值(Robust weighted fuzzy c-means, RoW-FCM)与核偏最小二乘(Kernel partial least squares, KPLS)算法的新型过程监测方法. 首先, 采用KPLS对污水处理过程的高维输入过程变量进行降维, 同时解决了污水处理数据的非线性问题; 其次, 采用RoW-FCM聚类算法对通过KPLS算法降维得到的得分矩阵聚类, 通过聚类得到的隶属度矩阵进行污水处理过程异常工况检测分析; 再次, 建立隶属度矩阵与样本数据变量之间的回归模型, 通过解得的变量贡献矩阵进行异常工况识别; 最后, 对本文RoW-FCM算法进行数值仿真验证, 并基于污水处理过程数据进行实验验证和对比分析.

2 本文监测算法建模策略

3 仿真实验数据及聚类效果图

 

针对先验故障知识少的非平稳污水处理过程异常工况监测与识别的难题, 引入并改进了基于模糊c均值的聚类方法, 提出了一种基于RoW-FCM与KPLS的过程监测新方法. 该方法首先建立了质量变量与高维非线性污水处理过程变量的KPLS模型, 然后采用本文基于RoW-FCM的算法对污水处理过程进行监测. 数值仿真实验表明, 相比于FCM、PCM、PFCM算法, 本文RoW-FCM聚类算法对离群点具有更好的鲁棒性, 并解决了不平衡簇数据集聚类问题. 此外, 数值实验也表明本文算法采用马氏距离能够适应更多聚类数据结构, 明显优于基于欧氏距离的聚类算法. 基于污水处理过程的异常工况检测与识别数据实验表明, 本文方法在监测过程中准确率更高, 迭代次数少, 能够有效监测到污水处理过程中异常工况的发生, 并能够正确识别出异常工况相关的关键变量, 因此在污水处理过程监测和异常工况识别上具有较好的测试效果和应用前景.

 

作者简介

 

张瑞垚

东北大学硕士研究生. 2018年获东北大学学士学位. 主要研究方向为数据驱动质量监测. E-mail: zryao_neu@163.com

 

周平

东北大学教授. 分别于2003、 2006、 2013年获东北大学学士、硕士和博士学位. 主要研究方向为工业过程运行反馈控制和数据驱动建模与控制. 本文通信作者. E-mail: zhouping@mail.neu.edu.cn



https://blog.sciencenet.cn/blog-3291369-1356450.html

上一篇:直播预告‖自动化前沿热点讲堂之第十九讲
下一篇:基于分层粒度对比网络的钢铁燃气调度知识获取与建模
收藏 IP: 117.114.9.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 14:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部