|
引用文本
常玉清, 孙雪婷, 钟林生, 王福利, 刘英娇. 基于改进随机森林算法的工业过程运行状态评价. 自动化学报, 2021, 47(9): 2214−2225 doi: 10.16383/j.aas.c190066
Chang Yu-Qing, Sun Xue-Ting, Zhong Lin-Sheng, Wang Fu-Li, Liu Ying-Jiao. Industrial operation performance evaluation of industrial processes based on modified random forest. Acta Automatica Sinica, 2021, 47(9): 2214−2225 doi: 10.16383/j.aas.c190066
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190066
关键词
湿法冶金,运行状态评价,互信息,加权随机森林
摘要
运行状态评价是指在过程正常生产的前提下, 进一步判断生产过程运行状态的优劣. 针对复杂工业过程定量信息与定性信息共存的情况, 本文提出了一种基于随机森林的工业过程运行状态评价方法. 针对随机森林中决策树信息存在冗余的问题, 基于互信息将传统随机森林中的决策树进行分组, 并选出每组中最优的决策树组成新的随机森林. 同时为了强化评价精度高的决策树和弱化评价精度低的决策树对最终评价结果的影响, 使用加权投票机制取代传统众数投票方法, 最终构成一种基于互信息的加权随机森林算法(Mutual information weighted random forest, MIWRF). 对于在线评价, 本文通过计算在线数据处于各个等级的概率, 并且结合提出的在线评价策略, 判定当前样本运行状态等级. 为了验证所提算法的有效性, 将所提方法应用于湿法冶金浸出过程, 实验结果表明, 相对于传统随机森林算法, MIWRF 降低了模型的复杂度, 同时提高了运行状态评价精度.
文章导读
工艺操作的安全性和优化性是工业界近几十年来备受学术界和工业界关注的两个关键问题[1]. 然而, 由于扰动、噪声等不确定因素的存在, 安全性和最优性都可能发生恶化, 这会导致运行性能的下降. 因此, 及时、准确地掌握过程运行状态, 对于提高企业经济效益、生产效益和产品质量都有重要意义. 而传统的过程检测仅仅是监测生产过程是否正常, 对于异常的生产过程剖析原因通过调整使生产继续正常运行. 为了获得更高的经济效益, 需要得到整个工艺过程的优劣状态, 因此相关学者提出了运行状态评价的概念[2-3]. 运行状态评价是指在生产过程正常运行的前提下, 对实际生产过程的运行优劣进行识别与判断, 当运行状态处于“非优”时, 通过及时调整操作, 使运行状态达到“优”. 因此, 对运行状态评价的研究具有重要的理论意义和应用价值.
目前, 针对运行状态评价学者们进行了一定的研究. 案例推理[4]方法评价速度快, 且推理评价过程包含了学习和归纳, 有一定实际意义. 粗糙集理论[5]能够有效地分析和处理不完备信息, 并从中发现隐含的知识, 揭示潜在规律. 它的根本思想是在保持条件属性相对于决策属性不变的前提下, 通过属性约简和值约简等过程, 挖掘数据内涵的规则, 在对定性和定量变量混合的数据处理上具有较好的效果. 人工神经网络[6]学习能力强, 能够表达非线性的映射关系, 在非线性过程的运行状态评价中有应用. 针对小样本情况, 研究者提出灰色关联分析法[7]. 模糊评价[8]是最常用的评价方法之一, 它既符合决策过程中信息的可用性和不确定性, 又符合人的认知的模糊性. 针对多模态过程运行状态评价, 邹筱瑜等[9]提出了基于高斯混合模型的评价方法, 确保特征提取的准确性, 避免了模态划分问题. 文献[10]提出了多种工业过程运行状态评价方法, 但其是基于定量变量, 对于定性变量的处理并未提及.
但在实际生产中, 复杂工业过程运行环境差、检测技术不完善, 导致过程定量信息与定性信息共存, 限制了传统的运行状态评价方法的应用. 其中, 定量信息指用数值大小描述的变量信息, 定性信息指通过语义定性描述的变量信息. 本文通过对复杂工业过程进行深入研究, 提出了基于随机森林的运行状态评价方法, 随机森林的特点是能够同时处理定量信息和定性信息, 且无需对数据进行复杂的预处理.
为了提升随机森林的性能, 学者们提出了多方面的改进方案. 文献[11]通过操作训练集和训练特征定义了一组新的随机森林分类器. Tuv等[12]、Paul等[13]提出通过特征选择来去除不重要特征、减小特征冗余以减小特征空间. 文献[14]提出了随机森林中一种有效的聚合方法 — 交替决策森林, 该方法将随机森林的训练归为全局损失最小化问题. 在投票环节, 提出一种加权投票方法为不同决策树赋予不同的投票权值[15]. 但是针对决策树之间的冗余问题, 以上方法未有提及. 为了解决该问题, 本文提出一种基于改进的随机森林运行状态评价算法, 采用互信息计算随机森林中不同决策树之间的相关性以及每棵决策树的评价精度, 剔除相关性大且精度低的决策树. 同时, 为了解决投票权重问题, 将评价精度转换成决策树的权重, 增加精度高的决策树投票权重, 降低精度低的决策树投票权重, 进而提高随机森林的评价精度.
本文主要以湿法冶金的氰化浸出过程为研究对象, 分别利用传统的随机森林算法和改进的随机森林算法建立运行状态评价模型, 通过对评价结果的对比分析, 验证了所提方法的正确性和有效性.
图 1 基于互信息的加权随机森林算法
图 2 运行状态等级概率
图 3 运行状态评价等级
本文针对定量信息与定性信息共存的工业生产过程的运行状态评价问题, 提出了基于互信息的改进随机森林方法, 并且建立了运行状态评价模型以及相应的在线评价策略. 解决了定量与定性信息共存下的运行状态评价问题, 与传统随机森林方法相比, 不但提高了运行状态评价的精度, 而且降低了模型的复杂度. 将本文所提出的方法与传统运行评价方法进行了对比仿真实验并应用于湿法冶金氰化浸出过程, 仿真和实际应用结果证明了所提方法的正确性与有效性.
此外, 在对上述工作进行研究时, 本文并未考虑如何采取有效措施进行非优运行状态原因追溯. 即当运行状态评价结果为非优时, 通过非优原因追溯, 追溯出导致非优的变量, 并结合过程特性给出操作指导建议. 未来的研究将会围绕如何基于随机森林进行非优原因追溯展开.
综上所述, 本文针对复杂工业过程提出的运行状态评价方法, 在现有成熟方法上进行改进和应用, 具有科研价值, 但仍存在研究空间.
作者简介
常玉清
东北大学教授. 2002年于东北大学获得博士学位. 主要研究方向为复杂工业过程建模、监测、运行状态评价及过程优化. E-mail: changyuqing@ise.neu.edu.cn
孙雪婷
东北大学硕士研究生. 2017年于大连交通大学获得学士学位. 主要研究方向为复杂工业过程
的建模控制与优化. 本文通信作者. E-mail: xuetingsun111@163.com
钟林生
东北大学信息科学与工程学院博士研究生. 主要研究方向为复杂工业过程运行状态评价和
故障诊断. E-mail: zhonglinsheng_neu@163.com
王福利
东北大学信息科学与工程学院教授. 主要研究方向为复杂工业过程建模、优化与故障诊断. E-mail: wangfuli@ise.neu.edu.cn
刘英娇
东北大学硕士研究生. 2015年于东北大学秦皇岛分校获得学士学位. 主要研究方向为复杂工业过程的建模控制与优化. E-mail: liuyingjiao1992@163.com
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-3 17:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社