||
多元线性回归和约束排序中单个解释变量解释比例获取
赖江山
多元回归线性分析(multiply linear regression) 和约束排序(constrained ordination)是研究解释变量矩阵(通常是环境因子)解释响应变量(回归分析是单一向量,约束排序是多变量的矩阵)主要统计模型,广泛应用生态学与环境科学数据分析当中。在多元回归分析(multiply linear regression) 和约束排序(RDA和CCA)中,我们可以获得全模型(即包含所有环境因子)的解释率(在线性模型中称为R2),即响应变量总变量(total variation)能够被解释变量解释的比例。在很多的研究中,不仅要回答总解释率,也想获得每个解释变量(环境因子)所分配的解释率。理论上讲,如果解释变量之间存在共线性,不可能获得各个变量准确的解释率,因为解释变量之间存在共同解释部分,而共同解释部分到底是哪个解释变量解释的实际上很难辨别。在很多研究论文中,经常会看到使用回归或约束排序,不仅给出总的R2,还给出每个解释变量(环境因子)所分配的R2,这个分配R2实际上应该叫做条件效应(Conditional effect),然而条件效应并不是该环境因子真正的单独解释量。但很多文献没有交代每个环境因子的解释率(%)是条件效应,并不是单独解释率,实际上是对条件效应不理解。
本讲座首先厘清多元回归线性分析和约束排序中三种解释率:单独效应(Simple effect);边际效应(Marginal effect)和条件效应(Conditional effect),随后演示R程序包hier.part和rdacca.hp包获得单个解释变量解释率。这两个包都是利用层次分割(Hierarchical Partitioning)理论分别分解广义线性模型GLM(包括普通线性回归)和约束排序(RDA和CCA)获得每个解释变量解释率。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 06:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社