||
向经济计量学和统计学专家们请教一个问题:在论文中判断自变量间是否存在多重共线性时,看到经常使用的是所谓膨胀因子VIF,有的说小于5即可,有的说小于10就行。但是,膨胀因子与可决系数R2的关系是:
VIF=1/(1-R2)
R2越小说明多重共线性越弱。R2的平方根是相关系数,按理,相关系数应小于0.5才算有较弱的相关性,于是应该是:R2<0.25,那就应该有VIF<4/3。当VIF=10时,R2都达到0.9了,即使VIF=5,R2都等于0.8了,怎么还能说相关性较弱呢?
请相关专家帮忙解释一下。谢谢!
昨天仔细查阅了相关书籍:李子奈、潘文清的《计量经济学(第三版)》和杰弗里、伍德里奇的《计量经济学导论——现代方法(第六版)》(清华大学出版社)得到的答案是:”多重共线性的主要问题在于使参数估计量的方差变大,而随机干扰项的方差、变量的变异度与方差膨胀因子一起决定着参数估计量的方差。如果存在多重共线性,但随机干扰项的方差σ2很小,或变量的变异度很大,都可能得到较小的参数估计量的方差。这时,即使有较严重的多重共线性,也不会带来不良后果。因此,只要回归方程的参数标准差较小,t统计值较大,就没有必要过于关心是否存在多重共线性的问题。“ 这一段话是李子奈书上的,但两本书基本意思一样。
但是,我还是觉得不妥!李子奈书也指出了,除了影响参数估计量的方差外,多重共线性将严重影响对相关变量效应的解释。比如,因变量是Y,自变量X和Z存在严重相关性,那么,回归方程中X和Z前面的系数就不能反映二者各自对Y的作用量,因为两个是同时变化的,不存在单独效应。因此,多重共线性还是要严防,否则将得到错误的因果解释!
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 21:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社