||
说明:本博客与微信公众号“林墨”同步更新,所有内容均为原创,可授权转载请扫码关注“林墨”公众号。
看到一项精彩的研究,你有没有想过联系作者要数据?我们会有顾虑。拿到数据之后该怎么用才不会侵权?我们会有担心。
孙红蕾 / 南京大学 & 李江 / 浙江大学
注:图片来源于EventBrite 网站
看到一项精彩的研究,你有没有想过联系作者要数据?你自己的研究发表后,有没有人联系你要数据?我们都会有顾虑。拿到数据之后该怎么用才能双赢?我们都会有担心。合作是一件很困难的事情。
科学数据共享很难
科学数据共享能够节省科研成本,缩短数据收集时间,提供新的研究机会,验证现有的研究结果,提高研究周期的效率,促进知识的有效交流等,将为学术界和社会带来巨大的收益。尽管美国的基金资助机构NSF、NIH、IMLS(国会图书馆的博物馆与图书馆服务协会)都已开始要求在申请科研项目时必须承诺公开研究数据,部分学术期刊例如《Plos One》也要求作者公开研究数据,但要让科学家普遍共享数据仍然非常困难,“公开数据的行为受到看得见的好处、坏处、耗费的时间与精力、对数据公开的态度的显著影响,也受来自行业规范的压力的显著影响”[1]。
数据再利用很难
如果科学数据公开之后,未被再次利用,那么这些数据的价值与未被公开前并无太大区别。接下来,我们讨论另一个话题——数据共享之后的再利用。
虽然近年来科学家们对于数据再利用的认知转变很大,数据再利用在高能物理、基因学、社会科学等一些学科内也有着较长的发展历史,但是对于大多数学科而言,数据再利用只是科学家个体行为,而非学科的常态。Youngseek Kim & Ayoung Yoon 在CoS(Community of Science’s)学者数据库中招募各个学科的科学家,通过在线调查的方式,对影响不同学科科学家数据再利用行为的因素进行了深入研究,为现有的一些关于数据再利用的未解之谜提供了答案。
调查涉及1538人,有效反馈1237人,占比80.43%。1237位科学家分别来自53个学科(依据自然科学基金分类法),占比最大的是:生命科学(占比34.8%);社会科学(占比14.1%);工程学(占比12.6%)。
Kim和Yoon发现:个体因素和学科因素都会对科学家的数据再利用意愿有显著影响。在学科因素中,在数据使用越便利(例如,建好数据库)的学科,科学家再利用数据的意愿越强。在个体因素中,影响科学家再利用他人数据的因素主要有:(1)再利用他人的数据所带来的好处(主要是提高发文量);(2)对于潜在风险如曲解和侵权的顾虑;(3)再利用数据的技术成本、人力成本、准入成本。值得注意的是,在对数据滥用的担忧上,没有数据再利用经验的科学家比有相关经验的科学家的担忧程度高很多。
如何鼓励科学家重复利用数据?
Kim和Yoon指出,一方面,对不了解或不确定如何再利用数据的科学家进行培训与指导,让数据再利用中的道德问题,方法问题以及法律问题迎刃而解。研究型图书馆可以主导这项工作,开设数据管理、共享与重复利用研讨课,为研究者与相关数据牵线搭桥,为科学家提供数据引用标准等等。另一方面,可以为科学家们提供足够的资源支持,如相关的技术、软件、程序、数据库等。
数据公开只是数据增值的前提,要将数据的价值最大化,还需推动科学家们反复利用这些数据。
调查(回答请留言):
你的研究过程一定积累下一些数据,你是否愿意共享给他人再利用?这个问题是有两个因素是确定的:1.数据共享不一定是复制一份是他人,而是为他人解决问题提供数据支持与分析;2.按国际惯例,再利用需要将数据拥有者列为论文作者。
Kim, Y., & Adler, M. (2015). Social scientists' data sharing behaviors. International Journal of Information Management, 35(4), 408-418.
Kim, Y., & Yoon, A. (2017). Scientists’ Data Reuse Behaviors: A Multilevel Analysis. Journall of the Association for Information Science and Technology, 68(12), 2709-2719.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 09:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社