精选
|

施普林格·自然(Springer Nature)开展年度开放数据现状调研已持续了十年,十周年纪念报告——《2025年开放数据现状:十年发展与挑战》为了解研究人员对开放数据共享的态度、实践和经验打开了一扇独特的窗口。
下面,我们将剖析与研究人员关系密切的关键发现:科研文化发生了怎样的转变,不变的又是什么,以及这一切对您自己的科研数据实践有何影响(包括开放数据共享的小贴士!)。
科研数据是在研究中产生或分析的文件(数字或物理输出),是理解和解读研究所必不可少的。它们可以有多种形式,例如可视化内容、笔记、代码、电子表格和地图等。当科研数据达到开放、可访问以及可复用,便成为“开放数据”。
无论资助方或机构是否要求开放数据共享,或者您正在准备数据可用性声明、选择存储库,或者想要知道人工智能如何融入自己的工作流中,开放数据这一主题已成为学术研究交流和实践的一部分。
自 2016 年起,捕捉研究人员对于开放数据的看法
但是,仅靠数据要求并不能说明全部情况。开放数据现状调研自 2016 年起每年开展一次,已收集了来自 200 多个国家或地区的 43,000 多份回复。这项长期开展的调查旨在探究研究人员对开放其研究数据的态度及其面临的挑战。这些经验揭示了当今塑造开放科学现状的真正障碍、动机和文化变迁。
无论您是想了解同行面临的共同挑战,还是想评估自身学科或地区的进展水平,《2025年开放数据现状:十年发展与挑战》报告都将为您一一解答。

查看并下载《2025年开放数据状况:十年进展与挑战》报告,了解详情
十年开放数据现状调研的主要发现
回顾十年的调研数据,有几个主要趋势尤为突出:
对开放科学原则的认识显著提高,特别是 FAIR 原则(旨在提高数字资产的可发现性(Findability)、可获取性(Accessibility)、互操作性(Interoperability)和复用性(Reuse))。
对开放实践的支持度仍然很高,尽管在某些地区对强制要求的积极性有所下降。
“认可差距”持续存在,大多数研究人员仍然认为共享数据未得到足够的认可。
人工智能(AI)已迅速进入科研工作流,助力数据收集、数据处理和元数据创建。
学科和地区差异仍然显著,塑造了开放数据在实践中的采用方式。
这些趋势共同描绘了这样一幅科研生态图景:逐渐成熟,但是仍然不平衡,仍然面临结构性障碍和资源壁垒。
研究人员应该知道的关键发现
1. 认知度上升,但仅靠支持还不够
较显著的长期变化之一是对 FAIR 原则的熟悉度有所提高。2018 年的调研首次问及 FAIR 原则时,近 60% 的研究人员从未听说过。到 2025 年,这一数字已降至略高于 20%。
这种转变在各个学科中都可见到。曾经相对落后的领域,如商学、化学和材料科学,其认知度增长最为显著。目前工程学和生物学报告的熟悉度超过 40%,标志着从被动认知向主动参与的转变。
这对您意味着什么:如果之前不了解,那么现在是时候开始探索 FAIR 原则,并与同行一起践行。在准备经费申请、存放数据或开展跨团队合作时,遵循 FAIR 原则正成为越来越多资助方和机构的基本期望。
2. 强制要求“疲劳”真实存在
开放数据强制要求是指国家机构或科研资助方要求研究人员使其数据可公开获取的规定。这些强制要求旨在鼓励数据共享。但是从全球来看,对全国性开放数据强制要求的支持度发生了不均衡的变化。虽然乍一看全球支持度似乎保持稳定,但区域性模式揭示了一种更微妙的图景。
支持度下降较明显的国家是澳大利亚(从 2016 年的 63.2% 降至 2025 年的 27.4%)和巴西(从 2016 年的 64.7% 降至 2025 年的 39%)。与此同时,印度(2016 年 59.8%,2025 年的 54.7%)保持稳定。为何有此差异?报告指出,当研究人员遇到实际挑战,如指引不明确、标准不一致或机构支持不足时,早期对强制要求的积极性可能会消退。
这对您意味着什么:觉得政策要求令人不堪重负,并非个例。许多研究人员原则上支持开放,但在现实操作中不少碰壁。这向机构和资助方传递出一个信号:强制要求必须匹配切实的学科支持。
3. 开放实践广受欢迎,但认可滞后
尽管对强制要求看法不一,研究人员在 2025 年仍然强烈支持开放实践(n=3,959):
88% 支持开放获取
81% 支持开放数据
76% 支持开放同行评审
59% 支持预印本
但积极性并不能消除最大的文化障碍:缺乏对数据共享的认可。
自 2020 年以来,调研一致显示,大多数研究人员认为共享数据获得的认可太少。虽然差距略有缩小,但仍有近 70% 的人表示他们的努力未得到承认。
这种割裂对行为产生了影响。当数据共享需要大量时间、归档和专业投入,却只能产生很少的职业回报时,大家对此的接受程度参差不齐也就不足为奇了。
这对您意味着什么:曾认为投入精力准备开放数据得不偿失?您并非个例。但风向已变:数据集正被越来越多的机构承认为研究成果,社区倡议也在呼吁更公平地衡量各方贡献。
4. 人工智能正成为数据工作流的一部分
AI 应用是今年报告所揭示的变化较快的趋势之一。在 2024 年至 2025 年间:
使用 AI 进行数据处理的比例从 22% 跃升至 32%
使用 AI 创建元数据的比例从 16% 上升至 25%
使用 AI 收集数据的比例从 17% 上升至 24%
与此同时,不了解 AI 工具的研究人员比例大幅下降。
AI 正成为科研数据领域的标配,但其影响取决于如何与数据专业知识结合使用。当设计目标明确并遵循学科标准时,AI 通过自动化元数据创建等常规任务和简化数据准备工作流,促进 FAIR 数据共享。精心设计的 AI 工具并非取代专业知识,而是将其嵌入其中,指向一个数据更加 FAIR、更具可复用性且管理更高效的未来。
这对您意味着什么:AI 正迅速成为研究工具包的标配。使用 AI,可以自动化元数据创建等任务,并减少准备数据共享所需的时间和精力,促进开放数据共享并使数据符合 FAIR 原则。
来自专家的声音
除了数据,报告还汇集了全球各地的研究人员、图书馆员和数据专家的见解。他们的观点揭示了趋势背后的现实情况。有几个主题尤为突出:
基础设施是关键,但必须本地化
专家强调,全球性强制要求并不总能转化为本地实践。像非洲和亚洲这样的地区正在发展自己的开放基础设施生态,以适应本地文化和社区需求。基础设施与政策同步发展。在中国,北京科技大学国家材料腐蚀与防护科学数据中心张达威副主任指出:数据共享平台与标准取得了快速进展。这种标准的普及有助于解释为何跨学科领域对 FAIR 原则的认知度不断提高。
数据质量日益受到关注
北卡罗来纳大学教堂山分校的 Sarah Graham Kenan 杰出教授、美国医学信息学学院研究员(FACMI)Melissa Haendel 博士分享道,因应强制要求,出现了“数据倾倒场”:“大家在共享数据,但不一定使其可复用。”
图书馆员和数据管理员至关重要
许多研究人员缺少时间或存在专业盲区,难以准备高质量数据集。弗吉尼亚大学开放科学中心联合创始人兼执行主任、心理学教授 Brian Nosek 强调了支持的重要性:“真正需要的支持是:研究人员如何让别人能像他们自己一样了解他们的数据?”图书馆员和数据专业人员可以弥合这一差距,但这需要机构对他们进行投入。
必须改变认可机制
从细化署名规则到设立开放研究奖项,专家们列举了多种认可数据贡献的创新方式。这些举措都揭示了当机构真正重视数据贡献时会产生何种可能。然而,若缺乏更广泛的系统性支持,文化和行为的转变终究有限。
五个提升数据共享能力的实用技巧
帮助让数据更易被发现、可复用且更具影响力:
在研究中正确引用所有使用或生成的数据
识别并(在可能的情况下)共享研究的基础数据
处理敏感数据并以适当的方式共享
撰写数据可用性声明
考虑发表数据论文
点击浏览下载《2025开放数据现状报告:十年发展与挑战》报告全文,了解更多内容
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-16 13:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社