黄晓磊(Huang Xiaolei )分享 http://blog.sciencenet.cn/u/book Nature is teacher | 诚实点,简单点,专业点 | 微博:weibo.com/naturethinker

博文

生物多样性数据共享现状和建议 精选

已有 15228 次阅读 2014-6-26 01:22 |个人分类:科学那些事儿|系统分类:科普集锦|关键词:数据共享,开放获取| 开放获取, 数据共享


数据共享对于科学发展和大科学研究模式至关重要,也是各国政府部门科学决策的重要基础,因此越来越受到关注。NatureScience杂志近期都曾发表社论和专刊讨论科学数据共享问题,一些国家也从政府层面积极推进数据共享。20123月,美国白宫宣布启动“大数据计划”,进而在20135月发布行政命令,要求联邦资金支持的研究项目所获得的数据向社会公开。

19926月,联合国环境与发展大会通过并公开签署了联合国生物多样性公约(Convention onBiological Diversity),致力于保护人类赖以生存的生物多样性,促进生物多样性的可持续性利用,并以公平合理的方式共享生物多样性资源的利益。然而,CBD签署后的二十年已经过去,生物多样性的流失依然严重,“2010生物多样性目标”远未实现,生物多样性科学研究和保护实践都面临着新的挑战。在信息时代的背景下,生物多样性领域面临的一个重要挑战是如何有效地共享及整合生物多样性数据。

生物多样性数据共享的重要性至少体现在三个方面:1)拓展生物多样性相关领域研究的深度和广度需要数据共享;2)制定切实可行的多样性和环境保护政策,需要对科学证据及原始数据开展系统分析,这在发展中国家尤为重要;3)科学可重复性一直是学术界关注的重要问题,而原始数据共享是检验研究结果可重复性最重要的前提。

1. 生物多样性数据共享现状

2001年3月,联合国环境规划署和多国政府启动了“全球生物多样性信息机构(GBIF)”,旨在促进全球生物多样性数据的共享。截止2014年1月14,GBIF及其节点机构已收集了1,426,888个物种的427,859,124条物种记录。虽然GBIF一直以来在整合生物多样性数据和数据共享策略方面做出了积极贡献,但其自上而下的运作模式(数据节点式管理,不直接面向个人用户),却不利于鼓励众多个体科学家共享数据。此外,GBIF所涵盖的生物多样性数据类型还很不够。

近几年数据共享呼吁在政府、资助和研究机构、数据保存机构、期刊等不同层面上越来越多。2009年5月,美国政府启动了国家数据网(www.data.gov),同年9月,中国科技部也启动了中国科技资源共享网平台(www.escience.gov.cn),都旨在促进数据资源共享。澳大利亚政府2010年10月启动了Atlas of Living Australia (ALA) (www.ala.org.au),近两年在生物多样性数据共享方面取得重要进展。虽然是GBIF的澳大利亚节点,但ALA允许个人用户提交共享数据,这是一个重要进步。

资助机构和研究机构也开始采取数据共享政策和措施。从2011年1月开始,美国国家科学基金会要求项目申请人在申请书中增加“数据管理计划”,写明数据保存和共享的承诺与措施;美国国立卫生研究院也有类似政策。英国生物技术和生物科学研究委员会于2010年6月发布了详细的数据共享政策;英国国家环境研究委员会、WellcomeTrust等也签署了联合声明,承诺促进研究数据共享。2014年5月15日,《中国科学院关于公共资助科研项目发表的论文实行开放获取的政策声明》和《国家自然科学基金委员会关于受资助项目科研论文实行开放获取的政策声明》同时发布,要求得到公共资金资助的科研论文在发表后把论文最终审定稿存储到相应的知识库中,在发表后12个月内实行开放获取。(我觉得这是个重要的进展,听到这个消息后的反映是:“期待比论文开放更进一步的数据共享政策的发布”)

科技期刊在数据共享进程中也起着重要作用。一些主流期刊,如NatureScience、PLoS和BioMed Central系列期刊,在其期刊政策中要求论文作者将论文数据共享。2011年,一些主流的生态学和进化生物学期刊与数据保存机构Dryad签署合作,承诺在投稿政策中鼓励作者将论文相关数据提交至Dryad保存并共享。Dryad为每个数据集分配一个DOI,使得数据集能够被引用和跟踪,数据集的可引用性将鼓励科学家更多的共享。然而,Dryad对于数据集没有格式要求,这给生物多样性数据管理和整合利用带来了不便。

虽然生物多样性数据共享被越来越多的呼吁,但理想和现实还差得很远。最近有研究发现,对于已发表的生态学论文,其原始数据以每年17%的速度快速丢失。这暗示需要完善的公共数据库和数据保存政策来推进数据共享。作为最主要的数据生产者、分享者和使用者,科学家群体(包括公众科学参与者)的态度和行为是数据共享能否有效推进和塑造数据共享文化的决定力量。我们近期开展的一项国际调查研究发现,生物多样性领域数据共享文化并不发达,科学家有一些技术和认知上的障碍(如需要对数据做更多分析、担心同行竞争、缺少回报、不熟悉数据保存机构、没有时间和经费来管理数据等)。实际上很多障碍跟科学家能否从共享获得回报(如数据所有权、更多引用、共同作者等)有关。

近来出现一些其他生物多样性数据共享策略。GBIF和出版商Pensoft在2011年提出了生物多样性数据论文,提议网络共享数据集的元数据文件可以用学术论文的形式发表,他们认为基于同行评审的数据发表将刺激科学家更多的共享,并可以控制数据集的质量。然而,数据论文能在多大程度上促进数据共享,还有待时间的检验。理想的生物多样性数据共享模式不但需要将更多数据收集至公共数据库,还需要严格控制数据质量并采用标准化的数据格式,因此有学者提出了数据库和科技期刊采用联合数据政策的建议。联合数据政策可以解决数据论文所关注的科研评价(DOI可引用)和数据质量问题(同行评审),并且能够在更大范围(更多数据库和期刊参与)促进数据共享。

中国的生物多样性数据共享主要体现在以政府部门为主导的物种数据库及共享平台建设方面。我国从20世纪80年代末开始物种数据库建设。21世纪初, 中国科学院生物标本馆网络信息系统建设项目启动, 并得到科技部“标本资源的标准化整理、整合与共享平台建设项目”的后续支持, 包括动物、植物、微生物等标本资源的国家标本资源共享平台(NSII, www.nsii.org.cn)于近期建成。该平台包括6个子平台, 参建单位达137个, 基本涵盖我国各类标本资源及主要的标本资源收藏机构, 收录1,000多万份各类标本及相关的名录、文献和照片等信息(许哲平等, 2014)。一些公众科学平台近年来也取得很大发展, 比如2007年成立的中国自然标本馆(CFH, http://www.cfh.ac.cn/)已建立了生物多样性基础信息共享、野外调查、物种鉴定、数据管理等系列功能体系, 并开始在生物多样性调查监测方面发挥重要作用。

然而, 与数据共享文化相对发达的美国、英国等科学强国相比, 我国生物多样性数据共享仍有很多工作要做。我国一直以来依靠自上而下的任务来推进数据共享, 长远来看这种模式是不可持续的。如何提高科学家群体的共享意识并促进其共享行为, 形成自下而上的、自觉的数据共享模式是未来工作的关键。此外, 我国公共生物多样性数据库的数据质量和更新周期也需要提高。

2. 一些建议

生物多样性数据共享需要所有利益方的共同努力。我们给出如下建议:1) 科学家应该关注数据共享方面的进展,并努力践行数据共享;公众科学在数据收集和共享方面的重要性值得关注;2) 数据保存机构应使用DOI来解决共享者关注的数据所有权和引用等问题,采用标准化的数据格式,控制数据质量,并开发易用的数据工具;3) 科技期刊和数据保存机构采用更加合理和严格的联合数据政策,将从数据数量和质量上大幅促进生物多样性数据共享;4) 资助机构和研究机构应当在数据共享中起到更重要作用,提供数据管理的详细政策,并改进科研评价体系,给予数据共享等公益行为足够的支持。

虽然中国的生物多样性数据共享近些年有较大进步,但共享文化仍不发达。除以上提到的普适性建议,我国生物多样性数据共享还需关注其他问题。比如,增强公益性项目的规划性,摒除重复资助、项目执行不力等问题,公共数据保存结构在数据规模和质量、可用性和易用性方面需要很大提高。


参考文献:1. 生物多样性数据共享现状和建议. 科技导报, 2014, 32(11): 12.

2. 生物多样性数据共享和发表: 进展和建议. 生物多样性, 22(3): 293-301.



http://blog.sciencenet.cn/blog-111883-806599.html

上一篇:9ISA专辑已正式发表并可免费下载

14 陈小润 赵斌 王秉钧 李学宽 黄永义 朱朝东 曹建军 杨正瓴 李璐 岳建军 cly85 biofans shenlu Vetaren11

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-11-22 02:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部