zhuyucai1的个人博客分享 http://blog.sciencenet.cn/u/zhuyucai1

博文

为什么说流程工业大数据是大垃圾?

已有 352 次阅读 2025-12-16 13:49 |系统分类:科研笔记

系统辨识,才是工业智能的灵魂---朱豫才

我们知道,自动控制(PID+MPC)和运行优化(RTO)是流程工业智能制造的核心技术。这里大数据是指你采集了生产装置的很多或者所有变量的数据,且采集时间很长,比如10年。

对于流程工业装置的自动控制和运行优化来说,为什么说大数据是大垃圾

先说一个刚发生的故事。某热电厂要改进汽温控制,由某供应商提供系统并实施。所用的技术路线是,通过人工智能、大数据算法实现对汽温的实时控制。项目做了近3年,成了烂尾楼。后来该项目给了我团队,我们用MPC控制,在现场花了3个星期即完成了辨识测试、模型辨识和控制系统的投运。

再一次提醒流程工业的朋友们,如果有供应商声称用“人工智能、大数据、深度学习”等等流行词为你实现生产装置的自动控制和运行优化,而不敢提“PID、MPC、RTO、工艺和运行知识(机理模型)、系统辨识”,小心,小心,小心。

现在解释为什么对自动控制来说大数据是大垃圾。对于自动控制,数据是用来计算被控对象的数学模型,也叫传递函数,然后用模型得到控制律。生产装置的运行有两种场景,一种是开环控制,即控制器没有运行,操作人员手动控制;另种是闭环控制,控制器投运,操作工不调节。开环控制时,如果操作工不调节控制变量(输入变量),那被控变量的变化完全由不可测干扰引起,数据的噪声水平是100%,模型是完全不可辨识的。如果操作工不时调节控制变量以稳定被控变量,数据信息量会增加,但不可测干扰引起的噪声水平一般占70-90%。注意这里的噪声是不可测干扰引起的,不是测量噪声,测量噪声一般很小。用这样的低质量数据,无论数据量多大,都得不到高精度模型。如果你运气好,有可能得到中-低质量模型。用中-低质量的模型只能得到中-低品质的控制器,且常掉链子,常需要维护。在国内,这是很多先进控制(APC)项目的现状。

正确的方法是,在输入信号上加激励信号进行系统辨识测试,以提高数据的信噪比;然后用系统辨识算法得到对象模型。系统辨识测试的时间为几小时到几天,是(微小数据。有人说加激励信号会干扰生产运行,厂里根本不让做。说这话的人,一定是在控制室的沟通能力不行,情商不高。干扰几小时到几天真的不行吗?我在流程工业做控制36年了,熟知国际顶尖自动化公司和生产厂家成功应用先进控制技术的正确方法。我再说一遍,系统辨识测试是可行的;系统辨识是流程工业建模效率和质量双高的技术。

闭环控制下的大数据更是大垃圾。闭环控制下,控制器自动控制,操作工就不调节了。懂点控制的人都知道,闭环控制中,控制变量到被控变量之间有两个关系(模型),一个是对象的模型,一个是控制器模型的倒数。用系统辨识理论可以证明,如果闭环控制条件下,不加激励信号,辨识的模型会收敛到控制器的倒数。这绝不是我们需要的模型。闭环运行场景下,一定要加激励信号才能做好系统辨识。好消息是,闭环辨识测试比开环测试要平稳很多。

再讲用大数据无法做实时优化(RTO),这里指寻优优化。以锅炉燃烧优化中的氧量优化为例。假设该锅炉高负荷的最优氧量是2.5%,但过去的10年运行的实际氧量是3.0-3.5%,大数据专家如何能从这10年的海量数据中找到2.5%的最优值?退一步说,就算过去十年中有时氧量划过了2.5%,但影响锅炉效率的还有n个变量,且不可测干扰水平70-90%,你怎么能确定这是最优值?一个优化变量都搞不定,如果燃烧优化再加入水煤比优化和二次风分配优化,复杂度倍增,大数据还怎么玩?

“给我海量数据,我就能为你实现自动控制和实时优化”,这句话你还信不?



https://blog.sciencenet.cn/blog-862928-1514564.html

上一篇:数据驱动控制与系统辨识控制
下一篇:为什么说流程工业大数据不可行?
收藏 IP: 115.205.149.*| 热度|

2 杨正瓴 李志林

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-17 03:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部