|
引用本文
夏恒, 汤健, 崔璨麟, 乔俊飞. 基于宽度混合森林回归的城市固废焚烧过程二噁英排放软测量. 自动化学报, 2023, 49(2): 343−365 doi: 10.16383/j.aas.c220012
Xia Heng, Tang Jian, Cui Can-Lin, Qiao Jun-Fei. Soft sensing method of dioxin emission in municipal solid waste incineration process based on broad hybrid forest regression. Acta Automatica Sinica, 2023, 49(2): 343−365 doi: 10.16383/j.aas.c220012
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220012
关键词
城市固废焚烧,二噁英排放建模,宽度学习,宽度混合森林回归,潜在特征,增量学习
摘要
二噁英是城市固废焚烧过程排放的痕量有机污染物. 受限于相关技术的复杂度和高成本, 二噁英排放浓度检测的大时滞已成为制约城市固废焚烧过程优化控制的关键因素之一. 虽然具有低成本、快响应、高精度等特点的数据驱动软测量模型能够有效解决上述问题, 但二噁英建模方法必须要契合数据的小样本、高维度特性. 对此, 提出了由特征映射层、潜在特征提取层、特征增强层和增量学习层组成的宽度混合森林回归软测量方法. 首先, 构建由随机森林和完全随机森林构成的混合森林组进行高维特征映射; 其次, 依据贡献率对全联接混合矩阵进行潜在特征提取, 采用信息度量准则保证潜在有价值信息的最大化传递和最小化冗余, 降低模型的复杂度和计算消耗; 然后, 基于所提取潜在信息训练特征增强层以增强特征表征能力; 最后, 通过增量式学习策略构建增量学习层后采用Moore-Penrose伪逆获得权重矩阵. 在基准数据集和城市固废焚烧过程二噁英数据集上的实验结果表明了方法的有效性和优越性.
文章导读
城市固废焚烧是目前世界范围内解决“垃圾围城”困境的主要方式之一, 具有无害化、减量化和资源化等显著优势[1-2]. 目前中国MSWI的处理能力占比已超过50%, 污染排放监管力度也逐渐加强[3]. 二噁英作为MSWI过程排放的有组织废气中具有持久性和剧毒性的有机污染物[4], 是造成焚烧建厂存在“邻避现象”的主要原因[5], 也是MSWI过程必须最小化控制的重要环保指标之一[6-7]. 基于高分辨气相色谱/高分辨质谱的离线化验分析方法是目前DXN排放浓度检测的主要手段[8], 存在技术难度大、时间滞后性大、人力与经济成本高等缺点, 已成为阻碍MSWI过程实现实时优化控制的关键因素之一. 因此, DXN排放浓度的在线检测是MSWI过程的首要挑战问题[3].
针对上述问题, 利用可在线检测的DXN关联物构建映射模型进而获得DXN浓度的在线间接检测方法成为热点[9-10]; 然而, 其存在设备复杂、成本高、干扰因素多、预测精度无法保证等问题[11], 同时其在本质上也是一种结合数据建模的检测手段. 相较于离线分析和在线间接检测方法而言, 基于工业集散控制系统采集的易检测过程数据驱动的软测量技术是解决DXN无法在线检测问题的有效途径, 具有稳定、精准和快速响应等特点[3]. 软测量技术已在石油、化工和炼钢等复杂工业过程的难测参数检测中广泛应用[12-15].
目前, 面向DXN排放浓度的软测量研究可分为基于单学习器和基于集成多学习器两个方向. 针对前者: Chang等[16]采用遗传规划结合神经网络对欧美等多个国家焚烧厂的Polychlorinated dibenzo-p-dioxins/Polychlorinated dibenzofurans排放进行建模, 其数据涉及多种不同类型的焚烧炉, 导致模型不具有良好的应用性; Bunsan等[17]通过多次重复实验确定反向传播神经网络结构后构建软测量模型, 但其不具有良好的移植性且BPNN面对小样本时存在过拟合、稳定性差等问题; 针对上述基于NN的软测量方法存的问题, 肖晓东等[18]利用支持向量回归[19]构建基于国内MSWI过程实际数据的软测量模型, 但存在核函数、惩罚系数等超参数难以确定的问题; 进一步, 乔俊飞等[20]针对北京某MSWI电厂的高维过程数据, 设计了基于多层特征选择策略的软测量模型, 但约简特征模型的泛化性能有待提高.
从机理视角, DXN排放浓度与MSWI过程的多个工艺阶段的众多过程变量均具有相关性, 并且在不同工况下也存在差异性; 此外, 获取DXN浓度检测真值存在难度大、成本高的缺点, 使得建模数据的小样本、高维度特性成为DXN软测量面临的主要问题. 上述因素导致基于单学习器的软测量模型难以获得较佳检测精度. 因此, 基于集成多学习器的软测量模型成为当前的研究热点, 其包括: 汤健等[21]基于选择性集成思想设计了一种自适应确定SVR超参数的软测量方法, 采用文献[22]的数据进行验证, 但测量精度有待提高; 在此基础上, 汤健等[23]采用变量投影重要性评价和设定特征约简比率的策略对北京某MSWI过程的DXN建模数据进行维数约简后, 构建能够自适应确定核参数的SEN软测量模型, 进一步提高了检测精度; 针对上述方法存在的放弃部分特征可能导致的信息丢失问题, Xia等[24] 通过随机森林和梯度提升树的混合集成策略进行DXN软测量模型构建, 但模型结构过于复杂且运行时间较长, 不适用于实际应用; 进一步, 借鉴NN模式和非NN模式深度学习在提取深层次表征特征方面的突出性能[25-26], Tang等[27-28] 提出了面向小样本高维数据的深度森林回归算法并用于构建DXN软测量模型, 但检测精度仍有待进一步提高; 在此基础上, Xu等[29]采用主成分分析对高维过程数据进行特征提取后再基于DFR构建软测量模型, 虽然提升了模型的泛化性能但约简后的潜在特征已不具备物理意义. 显然, 上述集成学习策略均存在训练难度大、模型复杂度高以及收敛速度慢等问题.
近年来, 宽度学习通过先扩展模型网络“宽度”再采用Moore-Penrose逆矩阵[30]获取权重的方式构建模型, 具有收敛速度快、超参数少和精度高等优势[31-32]. 现有的BLS研究主要基于NN模式, 已在图像识别[33-35]、故障诊断[36-38]和工业过程控制[39-41]等多个领域广泛应用. 但是, 上述研究均是在低特征维数、大样本数据集的研究背景下进行的应用与探索[39, 42]. 面向高特征维数、小样本数据集[43]的BLS研究还未见报道.
针对上述问题, 以MSWI过程DXN排放浓度检测为目标, 提出了基于宽度混合森林回归的建模算法. 主要创新工作为:
1)基于BLS框架的优势, 提出了具有特征映射层、潜在特征提取层、特征增强层和增量学习层结构的BHFR建模算法.
2)利用RF和完全随机森林组成的混合森林组替代BLS-NN神经元组, 实现对高维特征向量的映射.
3)基于PCA的潜在特征提取和互信息度量准则, 以保证全联接混合矩阵中潜在有价值信息的最大化传递和最小化冗余.
4)通过增量式学习策略构建以混合森林组作为最小单位的增量学习层, 采用Moore-Penrose伪逆获得权重矩阵.
在高维基准数据集和MSWI过程DXN数据集上的实验结果表明了本文方法的有效性和优越性.
图 1 城市固废焚烧工艺流程图
图 2 宽度混合森林回归建模策略图
图 3 RF和CRF的建模过程
针对MSWI过程关键指标参数DXN排放浓度难以实时准确检测的问题, 本文提出了一种基于BHFR的软测量方法, 其结合了宽度学习、集成学习和潜在特征提取等算法, 主要贡献: 1)基于宽度学习系统框架, 采用非微分学习器构建了包含特征映射层、潜在特征提取层、特征增强层和增量学习层的软测量模型; 2)利用信息全联接、潜在特征提取和互信息度量对BHFR模型内部信息进行处理, 有效保证了BHFR模型内部特征信息的传递最大化和冗余度最小化; 3)采用混合森林组为映射单元实现建模过程的增量学习, 通过伪逆策略快速计算输出层权重矩阵, 再利用训练误差的收敛程度自适应调整增量学习, 实现了高精度的软测量建模. 基于北京某MSWI电厂的真实数据验证了DXN浓度软测量模型的有效性.
今后的研究工作是进行基于数值仿真的机理分析, 实现面向生成、吸附和排放等多阶段的DXN排放浓度软测量建模, 为MSWI过程污染排放运行优化控制提供有效支撑.
作者简介
夏恒
北京工业大学信息学部博士研究生. 主要研究方向为小样本数据建模, 城市固废焚烧过程二噁英排放预测. E-mail: xiaheng@emails.bjut.edu.cn
汤健
北京工业大学信息学部教授. 主要研究方向为小样本数据建模, 城市固废处理过程智能控制. 本文通信作者. E-mail: freeflytang@bjut.edu.cn
崔璨麟
北京工业大学信息学部硕士研究生. 主要研究方向为城市固废焚烧过程风险预警. E-mail: cuicanlin @emails.bjut.edu.cn
乔俊飞
北京工业大学信息学部教授. 主要研究方向为污水处理过程智能控制, 神经网络结构设计与优化. E-mail: junfeiq@bjut.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 00:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社