zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

样本108,nature照样发!

已有 600 次阅读 2024-11-14 13:01 |系统分类:科研笔记

   假如你手头只有108个样本,或者说,你的数据只有108行,那该如何分析?将来能发啥样档次的论文?恐怕多数人觉得,数据量这么少,即使投一代神刊《巴基斯坦植物学报》也有难度。而下面这篇Nature大作就教育我们,数据不在多少,关键是如何分析,如何化简单为神奇。

图片.png

图片.png

       这是一篇典型的Meta分析研究,一共包含了108个案例(是108个案例,也就是数据只有108行,而不是108篇论文,论文数量远不及108,因为同一篇论文可以提取好几个案例)。作者首先采用典型的Meta分析方法分析了不同条件下,CO2升高对土壤C的影响。

图片.png

      而要发Nature,仅凭这些显然是不够深入的。作者们后面便将Meta分析和随机森林结合,把108行数据玩出了新高度,新境界:

1)在108行数据中,加入了19个解释变量(环境因子),用meta随机森林(metaforest)删选出其中对效应值比较重要的变量。

2)基于随机森林选出的比较重要的五六个环境因子,在metafor中,进行传统的线性模型模型选择,并加入这些因子之间的交互作用,再次评估不同因子对效应值的重要性。

图片.png

3)依据效应值和其决定性环境因子的关系,对效应值的全球格局进行预测。

图片.png

      所以说这篇靠着一百单八将能发Nature的案例,其统计技术应用超凡脱俗,看上去够炫酷,或许是个关键原因。其方法(传统Meta+随机森林)也确实值得学习,鄙人的Meta课程里也早已加入这个案例。但个人总觉得如果仅仅依据108行数据,就搞一个全球的分析,不管分析再花哨炫酷,其可靠性有多大呢,欢迎老铁们提出自己的见解!

参考文献:

Terrer, C. et al. A trade-off between plant and soil carbon storage under elevated CO2. Nature 591, 599-603, doi:10.1038/s41586-021-03306-8 (2021).

欢迎大家关注鄙人的微信个人公众号--二傻统计

二傻统计二维码.png



https://blog.sciencenet.cn/blog-3442043-1460001.html

上一篇:系统发育SEM, 闪耀今日Science!
下一篇:Science榜一大哥,今天给了Piecewise SEM!
收藏 IP: 210.72.152.*| 热度|

1 郑永军

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 20:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部