After50的个人博客分享 http://blog.sciencenet.cn/u/After50

博文

吴超:安全科学方法系列126:安全大数据方法

已有 356 次阅读 2024-6-18 07:47 |个人分类:安全科学理论|系统分类:科研笔记

吴超:安全科学方法系列126:安全大数据方法

    1.安全数据新内涵

以往普遍认为安全数据是与安全生产密切相关的数字化的信息记录,范围多局限在安全生产活动中,更多体现在安全数据体量上;在信息化时代安全数据是指企业安全生产、政府安全监管、社会个人参与以及与此关联的经济活动全过程所形成的文本、音频、视频、图片等所有存储在计算机里的各类信息的集合,范围扩展到安全生产、生活、生存等领域,属于大安全观下的思想范畴,越来越关注量和质两者相结合的变化。安全数据的来源对象包括监管机构、安委会成员单位、个人、企业、中介机构、互联网等;安全数据内容涵盖范围广,有事故信息、安全管理静态信息、安全管理动态信息、视频动态信息、生产图纸信息、调查报告等。安全数据根据不同的分类指标可以分为不同的类别,如按安全状态可以将安全数据分为静态安全数据和动态安全数据,静态安全数据可以是已发事故的数据、已有职业病数据、安全管理静态数据等,安全动态数据可以是视频动态数据、安全监管监测动态数据等;按数据系统来源可以分为自系统数据(安全系统内部数据)和它系统数据(非安全系统内部数据);按研究对象可以分为与人本相关数据、物本相关数据、事本相关数据。可以看出随着信息化进程,安全数据研究范畴更广泛、更具体、更全面。

    2.安全数据的“小”与“大”

两者在理论基础上有着本质不同,安全小数据以同质性为哲学基础,而安全大数据以异质性为哲学基础;安全小数据运行模式是人力为主,安全大数据运行模式是以机器为主;前者主要用于对单维非场景化静态数据进行描述,后者主要用于对多维甚至是巨维场景化数据进行预测分析;前者是建立因果关系模型,而后者是建立相关关系模型。在数据处理模式上,前者统计重心和难点是如何获取基础安全数据,是对安全数据做加法,“以小见大”,基于概率论和数理统计方法对样本数据进行预测分析,发现安全问题并探求随机现象的一般规律;后者是如何选择和处理有用的安全数据,是在原有数据基础上做减法,由繁入简,基于信息统计方法对全体数据进行非预测或者模糊预测分析,以获取全样本特征达到发现并解决安全问题的目的。尽管两者存在很大的不同,但都是通过对安全数据分析,科学总结与发现其中蕴含的模式,以揭示安全问题的一般联系和发展规律,以此来还原安全问题的本来面目,探求安全问题的本质。

需明确的是,安全数据产生速度快,安全大数据与安全小数据之间并没有明确的划分标准,“大”、“小”只是一个相对的概念,并不是大数据就一定比小数据的数量体大。安全大数据区别于小数据必须具备三个特性,一是“全体”特性,即是在一定条件下与安全有关的全体数据,数据量须达到一定的规模;二是“可扩充”特性,即安全数据容量可扩充,也就是说任何数据一旦发生就可以被记录、被吸收、被储存;三是“可挖掘”特性,以往有意收集有限的样本数据过程就是信息价值的利用过程,大数据时代下安全数据只有在挖掘以后才可能发现其价值,它更强调一种新的思维方式。同样,安全小数据并不是说数据量小,而是有针对性的、可用于进行安全分析、安全决策、安全控制的高质量数据,算法简单、计算可行;但当数据达到一定程度时一般的计算机方法和技术处理不了时的安全数据。

图1将安全大数据和安全小数据在理论、研究方法、具体分析方法、处理模式等方面进行比较。

图1 安全大数据与安全小数据的比较 

由图1可以看出,安全大数据并不是万能的,并不是在大数据时代就可以完全摒弃基于小样本的安全小数据,安全大数据不排斥安全小数据,不替代安全小数据所具有的安全功能和安全价值。安全大数据与安全小数据在理论层面的不同,必然影响各自的研究方式方法,图中列举了安全大数据和安全小数据几种典型的研究方法及其特性、适用范围以及优、缺点,结果显示,在现阶段应根据安全问题的具体条件理性选择相应的一种或者几种研究方法,得到的结果才更加科学合理。传统安全小数据分析一般是先根据统计目的来确定控制变量,统计重点是对安全数据的收集;安全大数据分析的样本为全体数据,其统计重点是对安全数据的处理。不同背景下要求两者的分析方法也会有所不同,图中列举了安全小数据和安全大数据常见的几种典型的具体分析方法,结果表明,两者的数据分析方法都有其应用价值和局限性,在现阶段大数据分析方法还不能解决安全领域的所有问题,两者的分析方法在各自的适用范围内仍占据着举足轻重的地位。基于安全大数据的安全数据统计是区别于传统安全小数据统计的一种新处理模式,图中描述了两者在处理模式层面的比较,尽管处理模式上存在不同,但其目的都是揭示安全问题的本质和一般规律,在对安全生产、生活规律进行预测和决策时提供理性而准确的参考意见。



https://blog.sciencenet.cn/blog-532981-1438618.html

上一篇:白云蓝天下的长沙后湖远看还是挺吸引人的。
下一篇:吴超:安全科学方法系列127:安全大数据与小数据的互用方法
收藏 IP: 58.20.26.*| 热度|

1 郑永军

评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-26 23:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部