After50的个人博客分享 http://blog.sciencenet.cn/u/After50

博文

吴超:安全科学方法系列127:安全大数据与小数据的互用方法

已有 367 次阅读 2024-6-18 07:48 |个人分类:安全科学理论|系统分类:科研笔记

吴超:安全科学方法系列127:安全大数据与小数据的互用方法

    1.安全大数据的局限性

通过比较分析可以发现,安全大数据有着传统安全小数据所没有的优势。安全大数据具有数量体大、数据多样性等特性,小样本不足以呈现的某些规律,安全大数据可以体现;样本不足以捕捉的某些弱小信息,大数据可以覆盖;样本中被认为是异常的值,安全大数据可以认可。有研究者预测,有了安全大数据的理论、方法和技术,可以不受安全问题的任何假设限制去寻找各安全因素间的关系,进而形成规律加以总结最终形成结论。但安全大数据仍有很多无法忽视的问题。首先,安全大数据来源更多的是通过计算机平台,有时只能收集到反映特定群体的特征,所参考的“全数据”具有相对性,而通过随机抽样所获得的安全小数据则更能反映全貌。安全大数据所呈现的某种规律或者结果只是动态的、具有阶段性数据信息特征重复结果,是机械性电子化的记录,加上大量虚假信息的干扰,价值密度低,并不会自动产生好的分析结果,只是对现象的一种描述,仍旧依靠人脑来判断、分析和使用。安全大数据中仍有很多安全小数据无法解决的问题,并不会随安全数据量的增加而消失,相反有时会更加严重。此外,安全大数据本身具有复杂性、不确定性和涌现性等特性,要想快捷有效解决复杂安全问题并不简单。

    2.安全小数据的必要性

安全小数据是针对安全问题特性和用户需求以最少数据获得最多信息为原则通过设计合理的统计方案运用随机抽样方法所统计而来的安全数据。安全小数据面向用户需求,有选择控制性地针对安全问题进行分析,在不可能获得全量数据的现实条件下,随机抽样调查是洞察全体最有效的首要选择,往往不需要高额的费用。安全大数据价值密度低,是小概率,安全小数据具有针对性,是大概率。安全大数据强调寻求相关关系,但是在安全科学领域仅仅知道安全因素间相关关系是不够的,还需要从以往经验教训数据信息中探求其原因,以进一步为类似安全现象提供预防和控制措施,事故致因理论还将继续是安全科学领域研究的热点,以因果关系为统计手段的安全小数据仍在事故调查中占主导地位。此外,安全大数据注重对群体行为描述和挖掘,安全小数据则更加注重个体行为的记录和描述,对重大工程的监测和防灾减灾、个人安全信息管理等发挥重要作用。

    3.安全大数据与安全小数据运用的一般规律

安全工作最基础研究就是对事故进行分析找到事故发生的本质原因与发展演化规律并提出有效预防和控制措施。事故具有普遍、随机、因果相关、突变、潜伏、危害大和可预防等特性,安全科学研究就是要从这种偶然性中找到安全规律,从必然性中挖掘隐藏的偶然现象,关注事故发生的万一”小概率事件。安全科学学科的这种特殊属性,要求必须重视安全小数据,理性对待大数据浪潮带来的转变,在进行安全数据分析时,需要明确安全科学领域是否和大数据有关系,要思考哪些数据可支撑达到安全科学目标、是否已先从现有的安全小数据中获得最大的价值、通过何种方式可以再从安全大数据中获取更大的价值等问题,需要理性科学进行安全科学研究。基于安全科学学科特性及现阶段安全技术现状,可归纳出以下5条安全大数据和安全小数据运用的一般规律:1)安全大数据思维,安全小数据运用;2)先用安全小数据,再考虑安全大数据;3从大数据中挖掘预测群体行为,从小数据中跟踪分析个人行为;4从大数据中得到安全规律,用小数据去匹配和检验安全现象;5把安全小数据作为安全大数据分析的对照基础和验证依据,把安全大数据作为探索性分析工具。

    4.安全大数据与安全小数据互为利用的一般方法

在安全数据中寻求一般安全规律,需要运用安全统计学的理论和方法。安全统计学研究人们在生产、生活领域中与安全问题相关的信息的数量表现和关系,揭示安全问题的本质与一般规律,对安全生产、生活规律进行预测和决策,并提出具体的应对措施,保障安全运行。它具有客观描述安全现象数量特征的功能,挖掘发现以形成“数据—信息—知识”统计关系链,从而发现安全现象各因素间的规律和关联关系。

传统安全小数据的量化处理已经有一整套较为完整的方式与过程,在大数据时代,传统的安全小数据理论、方法和技术已不能很好地解决巨型复杂安全系统的问题,而安全大数据的理论、方法体系和技术还未完全建立;安全科学的发展,需要紧跟时代步伐,与时俱进,需要将安全大数据的思想、理论、方法和技术运用到安全科学研究中,安全大数据自身局限性需要与安全小数据相互补充与融合。基于安全科学领域本身的学科特性,需要寻求安全大数据和安全小数据互为借鉴、互为利用的思维方式和一般方法。

1归纳推断法和演绎推断法并用。

归纳推断法是一种从个别安全现象中概括推断出一般安全规律的思维方法,能从大量以往事故等数据中找出普遍特征。演绎推断法通过运用一般安全科学原理对个别或特殊的安全现象进行深入、具体分析、推断,从而发现更深层次的关联关系的思维方法。利用安全大数据快速收集数据的特性,用归纳推断法概括出一般安全规律,再运用演绎推断法对安全小数据进行匹配,并对该安全规律进行检验判断。综合运用归纳推断法和演绎推断法,可从安全大数据的偶然性(价值密度低,概率小)中发现安全小数据的必然性(有针对性,概率大)并归纳成一般安全规律,又可以利用该安全规律去观察、认识、检验、利用偶然性。

2)相关分析法和因果分析法并重。

大数据时代相关关系将取代因果关系,即是什么”将取代对“为什么”的探索。基于安全科学的学科属性,事故致因理论始终是安全科学研究的基础和热点,要对事故原因进行溯源分析就必须运用因果分析方法。若只探求相关关系而放弃因果关系,则一旦发生事故就无从下手,而因果关系的研究需以相关关系为基础,利用安全大数据找出各安全因素间的不易察觉的关联模式,再利用安全小数据对该关联模式深层次分析。相关分析法和因果分析法不是相互对立、相互取代,而是相互补充。

3)安全系统思想和整体统计分析相结合。

随着安全数量体增多加上安全数据的涌现性、复杂性和多样性,需要对安全数据进行分布式存储、并行计算等碎片化处理。首先根据统计目的按照安全系统思想和整体统计分析的要求,科学合理地对收集到的安全数据进行子系统划分,通过并行计算等方法挖掘各子系统中所隐藏的信息,整体归纳出一般的安全规律。

(4)研究方法和具体分析方法互用。

通过将安全大数据和安全小数据在研究方法和具体分析方法层面进行比较分析,结果表明每种研究方法和具体分析方法都有其优越性和局限性,只运用某一种方法而忽视其他方法往往不能科学有效的解决安全问题,因此在对安全问题进行研究时应根据实际情况综合选择运用某一种或几种方法。各研究方法间的思维模式可以相互借鉴、利用以不断拓展其应用空间,不断完善和创新统计方法体系。把安全小数据作为安全大数据分析的对照基础和验证依据,把安全大数据作为探索性分析工具。

(5)传统统计技术和现代计算机技术融合。

目前,我国在对安全数据进行应用时还存在很多问题,如安全数据采集的基础支撑环境较弱、缺乏统一的数据交互标准规范、企业信息化能力弱、数据分析工具缺乏等,考虑成本、效率等因素,现阶段对安全科学进行研究时,要继续坚持“科技兴安”战略,继续采用传统统计方式方法去收集特定需要的数据,统计部门要以提高安全数据质量为重心,在不断创新和发展统计技术的同时,又要善于利用现代网络信息技术和各种数据源去收集一切相关的数据,达到优势互补的效果。

 



https://blog.sciencenet.cn/blog-532981-1438619.html

上一篇:吴超:安全科学方法系列126:安全大数据方法
下一篇:吴超:安全科学方法系列128:调查研究方法
收藏 IP: 58.20.26.*| 热度|

0

评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-21 09:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部