||
大数据时代档案工作的机遇、挑战与应对措施
李升伟
摘要: [目的/意义]大数据时代在不断改造传统产业的同时,也对传统档案管理模式提出了挑战,亟需我们对其反思与应对。 [方法/过程]文章明确了大数据的概念、特征与思维模式,强调“档案数据资源其实就是一种天然的大数据”,从思维、资源、服务、管理等角度分析了大数据促进档案行业变革的认识,讨论了大数据对档案管理的积极意义、机遇与挑战。在此基础上,展望了大数据时代档案工作的创新思路与具体措施。 [结果/结论]总之,大数据技术与档案管理实践的融合、联动,是档案事业顺应时代发展要求的必然选择。
关键词:大数据;档案管理;大数据特征;大数据思维;机遇与挑战;创新思路与措施
分类号:G270.7
一 大数据、大数据的特征与大数据思维变革[1]
“大数据”一词由英文“Big Data”翻译而来。麦肯锡全球研究所报告《大数据:创新、竞争和生产力的下一个前沿》对“大数据”定义如下:大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群。
大数据具有四个基本特征:一是数据体量(Volume)巨大,起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。二是数据类型(Variety)多样,现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。三是处理速度(Velocity)快,数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。四是价值密度(Value)低,但商业价值高。
大数据的本质是利用信息消除不确定性,大数据本身是一种技术革命,它给人类思维带来了颠覆性的革命:一是全本思维,即要分析与某事物相关的全样本(所有数据),而不是分析少量的数据样本;二是容错思维,即接受数据的混杂性,而不再追求精确性;三是相关思维,即对大数据的处理不再探求难以捉摸的因果关系,转而关注事物的相关关系;四是智能思维,“智能”“智慧”是大数据时代的标签,思维方式要从自然思维转向智能思维,不断提升机器或系统或社会计算能力和智能化水平。
二 大数据与档案
(一)档案数据资源其实就是一种天然的大数据[1]
第一,从数据体量来看,全国各档案馆档案资源总和是庞大的。2020年,各级国家档案馆馆藏已达3.3亿卷。第二,从数据来源来看,档案的来源分布非常广泛,档案数据不仅仅局限于档案馆馆藏,还广泛存在于政府、企业、金融、教育、军事、通信等各行业的档案保存机构中。第三,从数据结构来看,档案数据存在异构现象,档案数据由结构化数据、半结构化数据和非结构化数据组成,如文档、设计图、照片、录音材料、视频、GIS信息、水文气象信息等,数据的编码方式、数据格式都存在较大差异,整合难度大。第四,从数据价值来看,档案数据资源价值密度低。总之,随着我国数字档案资源建设战略的不断推进,馆际合作和资源整合成为发展趋势,要处理这些海量档案资源,需要借助大数据技术。
(二)大数据促进档案行业变革[2]
1. 思维角度。服务理念从供给导向转变到需求导向,从追寻“因果性”到审视“相关性”,从出现问题-逻辑分析-找出因果关系-提出解决方案的逆向思维模式到收集数据-量化分析-找出相互关系-提出优化方案的正向思维模式转变。
2. 资源角度。大数据时代,一切具有保存价值的文件、数据、视频、实物都被视为档案。因此,档案馆接收、征集和保存的资源不应当局限于政府的官方文件,而应当有意识、有针对性地收集能够突显社会发展脉络、反映时代特征全貌的网页、图片、音视频资料等大众化的信息资源,从而构建一幅反映国家与社会变迁的实时全景图。
3. 服务角度。档案服务将朝着社会化、多元化、开放性和先进性发展,以企业、客户个性化的需求为导向,提供网络化、智慧化服务。大数据的发展将实现真正的个性化服务,不仅为用户提供所需要的信息,还通过对用户需求进行分析,提供基于海量分布式资源的精细化知识组织输出,实现“信息+解决方案”的一站式服务。而且,档案业务流中产生的数据也是档案大数据的一部分,用户的查询和浏览数据是档案馆大数据来源的重要方面,充分挖掘利用这些数据中潜在的价值,可以大大提高档案馆的服务能力和服务水平。
4. 管理角度。与传统的手工管理不同,大数据时代的档案管理将向档案资源的数据分析、数据挖掘方向转移,做到实时收集,全流程控制。在数据分析方面,实现大数据处理方法和工具的简易化和自动化,在海量数据中快速而准确地检索到所需信息,可视化呈现最终结果。主动调查社会公众需求,建立各种数据模型,挖掘有用的信息和知识,合理开放,实现数据增值。
(三)大数据对档案管理的积极意义[3]
一是大数据成为档案管理的有效手段,基于网络化的大数据可以实现使得更多的业务信息整理成为可能,管理人员在电脑上通过相关数据库的查找,就可以有效得到相关的信息和资源,相关的信息成为现代单位档案管理的重要帮手。二是大数据促进档案管理信息化发展,大数据时代的到来,使信息的获取更加方便,信息化建设的步伐不断加速。大数据进入档案管理工作之后,需要管理人员掌握更加有效的信息化技术。在档案管理过程中,相关信息可以在网络上进行查找,这就需要相关的管理人员掌握网络查阅相关数据库的能力,不断拓展自己在信息化技术上的水平。
(四)大数据对档案管理工作带来的机遇和挑战[1]
1. 大数据为档案工作带来的机遇。一是档案资源选择性更大,大数据时代的档案管理工作不再受制于资源不足的难题,而是应该研究如何鉴别出更高质量和价值的档案。二是信息技术的迅猛发展为档案工作提供更多的支持,管理软件的普及使档案工作对计算机和网络技术的依赖性越来越强,现代办公软件的使用导致电子文件数量急剧增加,互联网、云计算和大数据等技术的应用使社会公众更加习惯于通过计算机产生和处理各类数据和信息,技术创新将更好地支撑档案工作的改革和发展。三是档案管理方式更加智能化,智慧档案馆的出现是大数据时代档案工作发展的一大亮点,充分利用物联网、云计算等大数据技术加强档案管理中人与人、人与物以及物与物的互通互联,实现档案数据的自动识别与管理、档案实体的智能化管理,实现档案服务的高质量和档案人员的高效管理。四是档案服务手段更加多样化。五是档案工作规划更系统更科学更有前瞻性。六是大数据将成为档案馆的核心资产,大量的多样的档案馆藏数据、档案利用者需求数据、档案服务痕迹数据等都能为档案馆未来发展、服务模式演变提供趋势分析的依据。
2. 大数据给档案馆带来的挑战[4]。一是档案馆功能定位的挑战,逐渐由管理型向面向社会公众的信息服务型发展,换句话讲,也是对档案管理理念的挑战;二是档案管理模式的挑战,大数据不仅意味着从信息爆炸时代中产生的海量数据,更意味着从无尽的数据中探寻出数据价值的能力。大数据时代档案的载体由传统形态向数字形态过渡,档案管理的对象由有形实体文档转变为无形虚拟信息,跨系统、跨部门、跨载体的电子文件使得档案馆的数字资源日益丰富,使得传统的“实体档案管理模式”不敷使用;三是档案信息需求的挑战;四是档案管理人才的挑战,要求档案工作者不仅要有档案学专业知识,还要有计算机技术、网络通信技术和信息处理技术知识,以及具备网络信息搜索能力和信息分析能力。
三 大数据时代档案工作的创新思路与具体措施[3]
(一)大数据时代档案工作的思考[1]
一是树立大数据时代的“大档案观”,强化数字档案资源的整合。大数据时代对档案数据的质与量都提出了更高要求,这就要求档案工作者积极构建适应大数据时代的“大档案观”,从社会历史记忆的角度确定档案资源的收集范围,构建以社会利用需求为导向的数字档案“大数据库”,使档案能够反映国家和社会在政治、经济、科技、文化生活等各领域的发展变化。二是创新档案数据保存策略,实现档案备份和归档的良性互补,实现备份与归档同步,既降低成本又便于统一保管,更重要的是降低档案产生与收集之间的时间差,提高归档保存的及时性和有效性。三是创新服务方式,实现档案大数据服务,大数据时代,大众的信息利用需求多样化,档案馆室所保管的档案数据信息具备其他资源无法企及的真实性、可靠性,具有更高的公信力,因此,档案利用者将更加广泛,这就要求我们树立“数据即服务”的理念,提供更为便捷的检索工具、扩大档案开放的范围、借助网络等多元形式主动提供优质高效的利用服务。并且要充分运用基于“全数据”的数据对比分析,用档案数据说话;利用知识挖掘技术,通过“数据加工”实现数据“增值”。四是构建大数据档案信息安全体系,包括档案数据采集安全、档案信息系统管理安全、档案数据利用安全。
(二)基于大数据理念下档案管理工作创新的具体措施[3]
1. 提升对大数据理念的认识。大数据是目前和今后社会发展的主流,也是我们获取信息数据的最为快捷、有效的手段。作为档案管理部门来说,我们需要进一步掌握大数据的相关理念和应用方法,在思想上认识到大数据对于档案工作的意义和作用,强化大数据对档案管理工作的影响。从分管领导到档案人员都需要不断强化对大数据的重视程度,为档案工作奠定思想基础和保障。
2. 强化档案人员的业务培养。大数据是一个新理念,传统档案工作中很少接触到这一理念,要想实现大数据在档案管理中的有效应用,就需要不断提升管理人员对其认识和理解,这样就需要不断强化大数据等现代信息化技术的有效培训。
3. 优化档案管理的规章制度。大数据背景下,档案管理制度出现了与时代发展不相适应的情况,需要进一步调整我们档案管理的规章制度。比如在制度上进一步强化管理人员的思想规范,做到涉密电脑不上网、上网电脑不涉密等等。
4. 创新档案管理的工作思路。大数据应用到档案管理工作中,可以实现档案工作效率的提升,查阅的资料更加丰富多样。一些档案管理人员的思想相对陈旧,需要进一步拓展我们的工作思想,在思想上接受大数据给我们带来的便利,不断探索档案管理工作和大数据的结合点,大胆应用大数据,实现档案管理工作的高效性、准确性和多元化。
5. 硬件设施的有效更新。传统档案管理工作对电脑、网络等配置不需要太高,更多强调的是纸质档案的保存,如档案室、档案柜等设备的配置。大数据融入档案管理工作,需要不断拓展档案管理的硬件设施,不仅需要有高速的计算机、网络之外,还需要购买和建立自己的信息数据库。进一步的工作还有建立档案管理的智能化机房,选购符合档案管理的数据库、管理系统软件等。还需要对相关的系统进行调试、人员培训等,有效构建大数据时代档案管理的基础设施,服务于档案大数据的管理与应用服务。
四 结束语
“十四五”时期,档案作为重要信息资源和独特历史文化遗产,对经济社会各项事业发展的基础性、支撑性作用将更加显现[5]。在大数据时代浪潮中,积极探索大数据技术与档案管理实践的有效融合、联动,是档案事业顺应时代发展要求的必然选择。面对大数据时代的机遇与挑战,需要我们增加信心、开拓创新,全力开创各级档案事业发展新局面。
项目:云南省档案局2021年度科技项目:档案大数据科学的知识基础、技术探索与实践展望(2021-38)。
参考文献:
[1]翟瑶,刘娜. 大数据时代档案工作面临的机遇与挑战[J]. 山西档案,2017(1):70-73.
[2]许桂清. 大数据背景下的档案行业发展[J]. 中国档案,2015(6):70-71.
[3]从俊. 大数据时代背景下的档案管理分析[J]. 科技与信息化,2016(6):14-15.
[4]向泽红. 跨界、融合、联动:论大数据时代高校档案事业发展的新思路[J]. 山西档案,2016(1):64-66.
[5]云南省档案局. “十四五”云南省档案事业发展规划[J]. 云南档案,2021(5):20-25+31.
Opportunities, Challenges and Countermeasures of
Archival Work in the Big Data Era
LI Sheng-wei
· Abstract: [Purpose/Significance] In the era of big data, while constantly transforming the traditional industry, it also poses challenges to the traditional archives management mode, which requires us to reflect on and cope with. [Method/process]The article clarifies the concept, characteristics and thinking mode of big data, emphasizes that "archival data resources are actually a kind of native big data", analyzes the understanding of big data promoting the reform of the archival industry from the perspective of thinking, resources, service and management, and discusses the positive significance, opportunities and challenges of big data on archival management. On this basis, the innovative ideas and concrete measures of archival work in the era of big data are looked forward to. [Result/Conclusions]In short, the integration and linkage of big data technology and archives management practice is the inevitable choice for archives to comply with the requirements of the development of the era.
Key words: Big data; Archives management; Characteristics of big data; Big data thinking; Opportunities and Challenges; Innovative ideas and measures
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 09:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社