Springer Nature 科研服务分享 http://blog.sciencenet.cn/u/SpringerNature 汇聚施普林格、Nature Portfolio、BMC、Discover、帕尔格雷夫·麦克米伦和《科学美国人》等深得信赖的品牌

博文

数据共享如何产生深远影响?四个真实案例带你洞见价值 |《2025开放数据现状报告》 精选

已有 2363 次阅读 2026-5-29 10:18 |系统分类:观点评述

《2025开放数据现状报告》回顾了十年来研究人员的调研反馈,考察围绕开放数据的态度、行为和政策有何变化。本文从个人经历着手,深入探讨数据共享的影响力。当数据共享的障碍被克服之后会发生什么?共享数据又如何超越研究本身产生影响力?

通过开放和共享数据,研究人员能够为自己的工作赢得更高的知名度与可信度。数据一旦开放,单项研究便能更有效地支撑长期的科学进步,研究结果也因此得以验证,并有助于在不同学科之间催生新知识。

《2025开放数据现状报告》显示,研究人员不仅认识到了共享开放数据的益处,对 FAIR 原则(可发现、可获取、可互操作、可复用)的熟悉程度也显著提高。同时,报告也指出,在数据复用、成果认可和基础设施建设方面,研究人员仍然面临挑战。

2025 State of Open Data Report cover.jpg

查看并下载《2025年开放数据状况:十年进展与挑战》报告,了解详情

但在实践中,数据共享究竟会带来哪些益处、又面临哪些挑战?在撰写《2025开放数据现状报告》期间,我们与研究人员、图书馆员及数据专家围绕开放数据进行了深入交流。本文汇集了他们的真实经历,展示了数据共享如何塑造研究与协作。

从数据共享到促进规模化数据复用

数据一旦公开共享,便能成为远超其原始用途的可复用资源。美国弗吉尼亚大学开放科学中心联合创始人兼执行主任、心理学教授 Brian Nosek 通过他关于偏见的数据证实了这一点。

1998 年,Nosek 与 Mazarin Bonaji 和 Tony Greenwald 共同开发了“内隐项目”(Project Implicit)。这个广受欢迎的网站让人们可以衡量自身的隐性偏见。二十年间,每年有超过一百万人参与其中。

Nosek 解释说:“内隐项目产生了海量数据,可用于各类社会与行为研究。”2013 年,在他创建开放科学中心时,“内隐项目”团队建议将这些数据纳入其中:“没有其他人拥有这样的数据源,它是独一无二的。”

“内隐项目”的数据每年都会系统地共享,并已在流行病学、政治学、社会学和行为医学等领域催生了大量跨学科研究应用。Nosek 说:“这些应用远远超出了我们最初在隐性偏见方面所做的工作。如果没有当初的数据开放,这一切都不可能发生。看到数据以这种方式被重用,既令人兴奋,又令人欣慰。”

这个例子展示了开放数据能够产生多么出人意料而又丰富的贡献,也说明了持续的可用性和完善的文档记录可以带来长久的影响。

打通数据,解锁新洞察

整合多个数据集能够创造出单一数据集无法提供的知识。Melissa Haendel 博士、美国医学信息学院院士,现任美国北卡罗来纳大学医学院 Sarah Graham Kenan 杰出教授、精准卫生与转化信息学主任,同时担任转化与临床科学研究院计算科学副主任。她分享了通过打通数据、解读信息来改善患者结局的经验。

Haendel 与劳伦斯伯克利国家实验室的 Chris Mungall 合作,并在国际协作者的支持下,共同领导了“Monarch Initiative”项目。该项目将来自人类和模式生物的各种开放数据源汇集在一起。Haendel 解释说:“一旦我们整合了这些数据,就能用于改善罕见病患者的诊断,真正将这些开放数据资源带到临床护理点,并借助数据帮助改善罕见病患者的生活。

在另一项研究计划“All of Us”中,目标是从全美招募一百万名参与者,覆盖不同的种族、人口特征、社会结构和宗教信仰。该研究收集调查数据、可穿戴设备数据、基因组数据和电子病历数据。在数据链接与获取中心,Haendel 及其同事将这些数据与其他多种数据源进行链接。

她解释说:“参与者同意共享数据,但并非所有人都能将自己的数据纳入该计划。我们与国家级健康信息网络 eHealth Exchange 合作,获取他们的电子病历并将其导入系统。这是首次有人做到这一点,令人非常兴奋,因为我们终于能够真实地反映出他们在接受医疗护理地点的实际数据。”

Haendel 的工作表明,互操作性与链接能够产生有意义的影响。当数据可以组合在一起时,从研究到医疗乃至更广泛的领域,其价值便会显现

从开放数据到现实世界和社会性成果

诸如 Haendel 的“Monarch Initiative”这样的例子,也展示了数据共享如何直接支持文化、健康或社会性成果。肯尼亚 TCC Africa(非洲传播培训中心)创始主任 Joy Owango 指出,数据共享能够通过支持社区对知识的保存、管理和共享,产生社会影响

尼日利亚国家博物馆联系了 TCC Africa,因为他们正在进行数字化并准备推出自己的数字图书馆。这是数据管理的第一步:收集、整理、存储与共享。但随之而来的问题有很多:“如何存储?存储在哪里?他们现在正在考虑,可以使用哪种技术来共享我们的本土知识并保护我们的主权——即承认我们对研究的所有权和贡献。”Owango 解释道。

影响力并不局限于引用次数和论文发表。这一例子表明,关于伦理、所有权和信任的考量同样至关重要。

激发协作与范式转变

数据共享可以带来新的合作机会和更广泛的人际网络。张达威担任国家材料腐蚀与防护科学数据中心常务副主任、北京科技大学新材料技术研究院教授。他共享的数据促成了令人振奋的新合作,也开辟了该领域内的全新研究方向

张教授团队在全球范围内率先使用 AI 模型,处理中国典型大气环境中腐蚀传感器获取的数据。结果表明,高通量腐蚀数据与 AI 模型相结合,有助于理解乃至预测材料的退化方式。

“一位在比利时的克罗地亚顶尖科学家询问我们是否可以共享数据,”张教授分享道,“当时只有少数人愿意相信,这种数据驱动的机器学习模型(我们常称之为黑箱)能够带来真正具有变革性的成果。通过使用我们共享的数据,他们不仅发表了几项非常重要的研究,还帮助我们扩大了影响力,并将合作拓展到了许多其他国家。

如今,这些来自不同国家的合作者正在推动整个腐蚀研究范式的转变。张教授的经历说明,共享数据能够促成合作,从而加速新见解的产生、范式的转变以及科学的发展。

从数据共享到数据复用:您的数据需要什么才能产生影响力

《2025开放数据现状报告》显示,开放数据的基础已经成型。当务之急应是进一步夯实基础,使数据共享成为整个科研界的标准。以上关于影响力的故事只是全球各学科的缩影,它们展示了:只要数据得到妥善整理、记录和治理,主动共享能够创造多么重要的价值正如《2025开放数据现状报告》所揭示、以及这些故事所凸显的那样,仅靠开放本身是不够的。

让共享数据发挥作用,不仅要使其可获取,更要确保其能够以有意义的方式被复用。我们需要基础设施、标准和服务,帮助数据跨越地理区域和科学学科,产生更大的影响力。

这些影响力故事说明了当开放顺应目的和意图时,能够打开怎样的可能性。如果您的工作产出了高质量的数据,请将其共享出来,书写属于自己的影响力故事。把您的工作变成一种能够推动复用、合作和长期影响的资源。

点击浏览下载《2025开放数据现状报告:十年发展与挑战》报告全文,了解更多内容



https://blog.sciencenet.cn/blog-3432244-1536930.html

上一篇:3年,6本新刊︱2025-2027年《自然》系列全新期刊
下一篇:世界土壤科学大会 | Springer Nature与您相约南京
收藏 IP: 183.194.156.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-5-29 23:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部