|
2026年4月8日,国家档案局印发《关于推进人工智能在档案行业应用的意见》(以下简称《意见》),标志着我国档案事业正式迈入“人工智能+”协同创新的新阶段。
笔者认为《意见》的核心逻辑在于“以安全为底座,以数据为燃料,以场景为驱动”,旨在通过顶层设计解决人工智能在档案领域应用中的算力、算法和数据等方面核心痛点,为档案管理从“数字化”向“数智化”转型提供了制度性框架。
一、背景与价值
随着国家“人工智能+”行动的深入,档案作为国家基础性战略资源,其蕴含的原始性、真实性价值急需通过智能化手段进行深度挖掘。《意见》的发布具有两个重要价值:
一是推动档案管理从传统载体管理、简单的电子文件管理向基于语义理解的知识管理转型。
二是在大模型技术泛滥的背景下,明确了档案行业应用AI的“红线”与“底线”,确保国家记忆的安全可控。
二、要点解析
(一)数据基础
《意见》将数据基础置于首位,反映了档案工作重心的重大调整。档案数据不再局限于单一的文本或图像,而是向文字、语音、图像识别及多模态融合方向演进。同时强调档案著录的规范化与数据标注的探索。通过补正缺失、修正错误等操作,提升档案数据的可解释性与可用性,使之符合大模型训练的语料标准。
(二)场景驱动
《意见》精准划分了AI在档案行业的应用象限,优先培育成熟度高的三类场景。一是自动化处理类任务,如智能化接收、自动著录、盘库与数据清洗,旨在替代高重复性的人工劳动。二是内容治理类任务,如开放审核、脱密脱敏、算法监控,利用AI提升鉴定工作的精准度与效率。三是开发利用类任务,如知识图谱构建、专题库建设、档案知识服务。
(三)基础设施
《意见》明确要求档案数字资源总库不得部署在非自建算力平台上,防止核心数据外流。提倡“场景、模型、算力兼容适配”,反对盲目追求大规模参数,鼓励利用档案专业业务知识赋能,通过“小而精”的行业模型实现高效产出。
(四)安全治理
针对生成式AI可能带来的伦理与安全风险,《意见》建立了全生命周期的管理制度。一是算法备案与审计,防范后门攻击、数据污染与虚假信息生成。二是防范聚合泄密,特别是要防止多维度数据交叉关联、深度挖掘导致的泄密风险,这是AI时代档案保密工作的新挑战。
三、思考建议
加大专业语料库建设。档案部门应利用自身资源优势,针对科技档案、历史档案等特定领域,构建高质量的专业微调数据集,提升行业模型的垂直领域表现。
强化“人机协同”的工作模式。AI不替代职责履行。应建立“人在回环”的业务流程,确保每一份经过AI处理的档案,其真实性与法定效力仍由真人背书。
标准化先行。优先制定人工智能应用框架、档案数据标注规范及智能服务评估指标,通过标准化手段确保不同机构间的 AI系统能够互联互通。
四、不足与反思
《意见》强调“优先使用自建或本系统智能算力平台”,并明确“不得将档案数字资源总库部署在非自建算力平台上”。但是事实上,绝大多数地市级甚至省级档案馆,在财力与人力上根本无法支持自建、维护一个能够运行大模型的算力平台。如果强制要求“自建”,可能会导致两个极端:要么基层档案馆因无力建设而被迫在智能化浪潮中“掉队”;要么各地盲目上马、重复建设低效的“小烟囱”平台,造成国家财政资源的巨大浪费。而所谓的“本系统”似乎也语焉不详,政务、集团统建的大模型是否能接入档案应用?许多问题待明确。
《意见》提到利用人工智能进行档案编研、检索和知识服务。但是目前主流的大语言模型普遍存在“幻觉”(生成虚假事实)的问题。而且根据笔者自己的感知,随之大模型技术持续发展,人会越来越难以分辨 ai 生成的内容,可惜《意见》也没有针对人工智能生成合成内容标识相关要求。如果系统在档案编研或知识服务中自动生成了带有偏差甚至错误的历史叙事,这与档案工作“存真求实”的职业伦理是根本冲突的。仅仅依靠“业务部门审核确认”这一条保障,在海量自动化生成的背景下,极易流于形式。
《意见》要求构建“包含多模态数据的高质量档案数据集”。国家强调的高质量数据集是要供给人工智能训练使用的,如何不越过《意见》里面一直强调的安全红线,实务中感觉阻力不会小。整体的方向是正确的,但似乎是对数据清洗的巨大成本与技术难度是估计不足的,期待后续更加明确的实践案例和政策指引。
《意见》要求加强算法监控,防范后门攻击和设计缺陷。档案部门多是技术的“应用方”而非“开发方”。在面对专业AI公司提供的商用算法时,档案部门往往处于弱势地位。所谓的“备案审查”和“风险评估”在缺乏专业技术团队支撑的情况下,很难识别出算法深层的逻辑偏见或隐蔽漏洞。
总之,《意见》的发布是档案行业应对人工智能技术浪潮的主动抉择。作为档案工作者,我们还是应在坚持“稳妥探索、安全保密”的前提下,积极拥抱技术变革。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-4-12 22:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社