||
R语言在生态学研究当中的应用分析
编写代码处理数据已经成为很多生态学者日常的工作之一。能够用于编程的语言很多,近年来,R语言以其灵活、开源、易于掌握、免费等诸多优点,在生态学研究各领域迅速传播并赢得广大研究者的青睐。
为了研究R语言在生态学研究论文里面使用情况,我们通过逐篇查阅的方式,分析近10年来(2008-2017)30种影响因子3以上SCI生态学刊物60902篇研究论文(不包括综述)使用R语言作为数据分析工具的情况。结果表明,生态学研究论文使用R语言作为数据分析工具的比例从2008年11.4%线性增加到2017年58%(图1和图2),并在2016年已经超过50%,占居半壁江山,以不争的事实说明R语言已经成为生态学研究中最主要的数据分析工具。从10年平均水平来看,以英国生态学会刊物Methods in Ecology and Evolution最高,达到53%,其他几个跟宏生态学相关的刊物也有比较高的R语言使用比例,例如Global Ecology and Biogeography(51.6%), Ecography (50.9%)等 Diversity and Distributions(46.3%)等(图3)。
图1. 30种生态学SCI刊物(IF>3)从2008-2017年所发表研究论文使用R语言比例总体变化趋势(基于60902篇文献研究结果)
图2. 30种生态学SCI刊物(IF>3)从2008-2017年所发表研究论文使用R语言比例每种刊物变化趋势
图3 30种生态学SCI刊物(IF>3)从2008-2017年所发表研究论文使用R语言作为数据分析工具比例比较
在这6万多篇被调查研究论文中,总共有超过2,400个R程序包被使用,其中有31个包被使用超过100次(图4)。使用频次最多10个包是lme4, vegan, nlme, ape, MuMIn, MASS, mgcv, ade4, multcomp和car。通过NMDS排序图可以看出,杂志所涉及的领域相同,所使用的程序包的组成也比较一致(图5)。
图4 30种生态学SCI刊物(IF>3)从2008-2017年所发表研究论文使用R程序包使用频次排位
图5 基于刊物之间的程序包Bray-Curtis差异值的NMDS的排序图
R语言深受生态学者的青睐的原因很多,主要有资源丰富、免费开源和容易获得相关分析代码等因素。R语言在生态学者中的普及对于推动生态学研究成为开放科学(open science)起到积极作用。
本论文研究结果已经由美国生态学会刊物Ecosphere在2019年1月份以论文“Evaluating the popularity of R in ecology”在线刊出 https://esajournals.onlinelibrary.wiley.com/doi/full/10.1002/ecs2.2567。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 17:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社