||
Elsevier参照马斯洛层次模型,提出了科学数据可用性的10层要求,见下图
(1)保存(Stored): 研究数据需求层次的第一步是数据必须得到保存。
(2)存储(Preserved):除了保存,还需要以独立于格式的方式进行存储,否则就会面临数据过时的风险。
(3)可访问(Accessible): 即使数据得到了存储和保存,也并不一定意味着自动具备可访问性。研究人员和机器都可能需要访问数据,例如进行元分析(meta-analysis)或其他类型的重用。
(4)可发现性(Discoverable): 即使数据得到了存储和保存,且原则上也是可以访问的,但如果数据不能被他人发现,这就没有多大价值了。
(5)可引用(Citable): 数据共享的障碍之一是需要研究人员付出额外的工作,而回报却很少。数据引用有可能改变这种状况,因为数据引用可以很容易地纳入目前基于文章引用的奖励制度。
(6)可理解(Comprehensible): 为了使数据能够被重复使用,需要清楚地说明使用了哪些测量单位、数据是如何收集的,以及使用了哪些缩写和参数。数据出处对于理解至关重要。
(7)已审查(Reviewed): 对研究文章进行同行评审非常普遍,但对研究数据来说,这种做法还很不常见。不过,在数据的质量控制和可信度方面,这是非常重要的一步。
(8)可复现性(Reproducible): 研究成果的可重复性是科学界非常关注的问题。不可再现性往往源于研究数据中缺少实现相同研究成果所需的元素。例如,生物医学文献中报道的资源(如抗体、模式生物和软件)往往缺乏足够的细节,无法实现再现或重复使用。
(9)可重复使用(Reusable:): 共享研究数据给广大研究界带来的主要好处是能够重复使用这些数据。只有当研究数据具有足够的可信度和可重现性时,其他研究人员才会重用这些数据。
(10)集成(Integrated): 我们认为,集成“高效研究数据”的这九个方面非常重要。例如,数据应保存完好,以便重复使用。数据要可引用,就必须可访问。同时,在建立数据重用或数据引用系统时,还必须考虑到当前数据存储和共享系统的实际情况。
Elsevier指出:这九个层次和第 10 个整合步骤旨在作为指导原则,据此对研究数据管理实践进行排序和检查,而不是作为完美绩效的处方。
出处https://www.elsevier.com/about/open-science/research-data
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 01:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社