zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

混合模型为何能如此风靡?

已有 537 次阅读 2024-3-6 09:35 |系统分类:科研笔记

人在江湖,身不由己,想保持自己的所作所为不受他人影响很难。数据其实也一样,一个数据点,总会与其他数据点存在各种各样的相互关联,进而影响到其独立性。而独立性,又是数据分析的前提条件之一。所以独立性这个问题,说起来简单,事实上想把独立性这个问题完全解决了,尤其是对野外调查、观测数据而言,非常困难,有时候几乎不可能。

独立性的根本问题,其实是伪重复问题(Hurlbert 1984)。也就是说你看起来有100,由于数据存在的各种不独立性,导致你的独立样本并没有100个,这样如果你按100个独立样本来分析的话,犯第一类型统计错误(弃真)的概率就会增加,你的结果就会不靠谱(Hurlbert 1984)。而混合模型,则可以在很大程度上改善这一问题,这也是目前其风靡应用统计领域的最重要原因,也就是可以让你的结果更为可靠。关于这一点我们可以通过以下案例来说明。

Brian 和 Catford (2023) 在ecology letters发文,分析了本地中和外来种(这里定义为origin的类型)的植食程度的差别,一共包括1662个植食程度数据。我们可以先通过作图,看下本地中和外来种herbivory水平的差别。这里的植食程度,又分成了由不同类型的植食性动物造成的,这里把植食性动物分成了insects,arachnids,  multiple, gastropods,vertebrates, crustaceans这6种类型。这里来自同一种植食动物类群的不同数据之间其实就具有不独立的问题。那么

1)如果我们不考虑独立性问题,即我们认为这1662个数据是完全独立的,那么只考虑origin对植食程度的影响,那么就可以拟合模型:

图片2.png

这里,植食程度herbviory本身是自然比率数据,为了促进残差的正态性,进行logit转换。由上述anova结果可知,变量origin对herbivory是有显著影响的,且由summary模型结果可知,本地中的herbivory水平显著高于外来种。注意这里残差的自由度=n-自变量的个数-1=1662-1-1=1660。

当然,我们也可以依据F值和自由度在R里求出anova中的P值。

图片3.png

基于上述模型结果,我们便可以得出结论,本地中的herbivory水平显著高于外来种。但这个结果靠谱么?从原始数据的对比图来看,数据的格局似乎和模型结果存在明显差异,所以上述结论是否可靠存疑。

2)我们再用混合模型分析下这个数据。考虑到来自同一种植食动物类群的不同数据之间其实就具有不独立的问题,我们把植食动物类群(group)设置为随机效应。这次我们得到的结果为:

图片4.png

可见,结果发生了翻天覆地的变化,混合模型的结果显示,外来中和本地种的herbivory水平没有任何差别。

并且,注意看,该模型anova的F检验中,分子的自由度变成了1653.6, 已经不再是1660了。即模型已经认识到,你事实上并没有那么多的独立样本量,在计算中,已经修正了你的样本量。所以混合模型的结果更可靠,大大降低了我们犯第一类型统计错误的概率。

我们也可以直接出图,看下模型对本地中和外来种herbivory的预测值:

library(sjPlot)

plot_model(mod2, type = "eff", terms = "origin")

图片5.png

可见,混合模型认为,本地中和外来种的herbivory水平十分接近,二者没有本质差别。所以,让你的结果更可靠,不要动不动就取得了显著的“重大发现”,是当前混合模型如此风靡的根本原因之一。

参考文献:

Brian, J. I., and J. A. Catford. 2023. A mechanistic framework of enemy release. Ecology Letters 26:2147-2166.

Hurlbert, S. H. 1984. Pseudoreplication and the design of ecological field experiments. Ecological Monographs 54:187-211.

 

 图片6.png



https://blog.sciencenet.cn/blog-3442043-1424257.html

上一篇:他们重新分析了PlosONE上一篇论文的数据,转手发了Nature!
下一篇:时空自相关数据的处理--Science案例
收藏 IP: 210.72.152.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-28 23:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部