|
R语言在光合作用研究当中的应用分析
Yasi Liu, Xiangping Wang , Dayong Fan*, Jiangshan Lai*
https://www.publish.csiro.au/fp/FP21102
光合作用研究正进入大数据时代,许多统计软件和编程语言已经成为光合作用研究中常见的分析工具。编写代码处理数据已经成为很多光合作用学者日常的工作之一。近年来,R语言以其灵活、开源、易于掌握、免费等诸多优点,在光合作用研究各领域迅速传播并赢得广大研究者的青睐。为了研究R语言在光合作用研究论文里面使用情况,我们通过逐篇查阅的方式,分析近10年来(2010-2019)94种影响因子2.5以上、标题包含“光合作用”的SCI刊物的2966篇研究论文(不包括综述)使用R语言作为数据分析工具的情况。结果表明,光合作用研究论文使用R语言作为数据分析工具的比例从2010年3.6%线性增加到2019年12.5%(图1),说明近十年来,光合作用研究者越来越倾向于使用R语言进行数据分析。以10年总发文量最多的文章来看,Plant, Cell and Environment最高,达到14.1%,其他拥有较高R语言使用比例的刊物还有Journal of Experimental Botany(10.5%), Frontiers in Plant Science (7.1%), PLoS ONE(5.8%)Photosynthesis Research(4.2%),Photosynthetica(1.7%)等。六个刊物中,R语言使用比例越高的刊物具有更高的影响因子(IF数据取自2020年),相关性显著。
图1 94种标题包含“光合作用”的SCI刊物(IF>2.5)从2010-2019年所发表研究论文使用R语言比例总体变化趋势(基于2966篇文献研究结果,置信区间为95%)
在这近三千篇被调查研究论文中,总共有109个R程序包被使用。此外,R-site search网站(http://finzi.psych.upenn.edu/nmz.html)还展示了另外37个与光合作用相关的R程序包,共计140个包。为了继续探索R程序包如何解决与光合作用相关的特定问题,我们详细记录了每个出现的R程序包及其函数的功能,根据实际用途分为三类:一般统计和作图包(G类,50.0%),光合作用专用包(S类,24.3%)和遗传进化专用包(E类,22.1%)。这意味着四分之一的研究人员,更倾向于在光合作用研究中使用R语言的专门分析包。
140个R程序包中,使用频次最多5个包(stats包除外)是nlme(G), lme4(G), multcomp(G), plantecophys(S)和ape(E)(图2)。使用频次最多的stats(G)是R的默认基础包,一些文章可能没有明确引用此包,因此不参与比较。
图2 94种标题包含“光合作用”的SCI刊物(IF>2.5)从2010-2019年所发表研究论文使用R程序包使用频次排位
G 类和 S 类的R程序包虽然具有不同的功能,但可能为拟合模型曲线等问题提供相同的解决方案。一些R包可以用来拟合常用的光合作用模型(表1,仅展示以光合作用专用包为主的R包)。
表1 用于拟合10种主要光合作用模型的R程序包
R语言深受光合作用研究者的青睐的原因很多,主要有资源丰富、免费开源和容易获得相关分析代码等因素。在Photosynthesis Research刊物中,R语言在近十年的使用频率与其它主要的编程语言/应用程序相比,增加趋势更为明显、稳定(图3)。这说明R 在解决光合作用问题方面具有前所未有的潜力。因此,我们积极鼓励更多的光合作用研究人员使用 R 语言或积极开发 R 程序包供同行将来使用。
图3 2010-2020年Photosynthesis Research刊物上主要编程语言/应用程序的使用频率趋势
本论文研究结果已经由刊物Functional Plant Biology在2021年10月份以论文“The use of R in photosynthesis research”在线刊出https://doi.org/10.1071/FP21102。欢迎大家引用!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-20 05:18
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社