wangfang0108的个人博客分享 http://blog.sciencenet.cn/u/wangfang0108 我来过,畅快地生活过!我无憾!

博文

统计中的回归分析

已有 11777 次阅读 2010-9-1 15:24 |个人分类:读书笔记|系统分类:人文社科

 
回归分析时,所有的自变量都需要是间距变量。如果想把某些分类变量也纳入其中,就必须通过TRNANSFORM菜单命令中的RECODE INTO DIFFERENT VARIABLE把其编码成K—1个二分类变量后,才能把这K—1个分类变量纳入统计分析之中。至于在应用虚拟变量回归时选择哪一类作为参照类,其实对回归结果没有实质性的影响。这就是说,尽管虚拟变量的回归系数会有所不同,但这只是因为换了参照类而每个系数的意义不同了,但是所计算的各类平均值他们之间的差不会发生任何变化,因而各类平均值之差的统计检验结果也不会发生任何变化。所以,如何选择参照类只是研究者自己的偏好,以满足在解释实际意义时的方便。
 
如果因变量是间距变量,那么就直接运用线性回归。在线性回归中,如果自变量中有分类变量,那么一定要事先把这些分类变量事先重新编码,生成K—1个二分类变量。
 
相反,如果因变量是分类变量,那么就需要运用LOGISTIC回归。其中,根据因变量分类的多少,又分为二元逻辑回归和多元逻辑回归。在二元逻辑回归时,如果对自变量中的分类变量进行重新编码,成为了虚拟变量,那么在纳入covariate对话框时进行运行时,无需进行其他的操作。如自变量中的分类变量没有进行重新编码形成新的虚拟变量,就需要点击categories按钮进行新的对话框后,把自变量中未重新编码的分类变量选入categorical covariates对话框中,然后点击继续按钮进行分析。需要注意的是,这时侯的对照类别reference category系统往往默认的是最后一组。
 
如果因变量是多分类变量,那么就需要运用多元逻辑回归。在因变量的多个分类中,到底选择哪一类作为参照组,可以点击对话框下面的reference category按钮来进行选择。在多元逻辑回归中,如果自变量中既有分类变量,又有间距变量,那么处理的方法也有两种。第一,就是把间距变量选入covariate对话框中,把自变量中未重新编码的分类变量选入factors对话框中,然后再点击“继续”按钮进行运行分析。注意的是,得出的结果中,自变量中的分类变量往往是以最后一个分类作为参照组。当然,这要在统计结果分析需要留心注意。第二种,就是在分析之前,把自变量中的分类变量进行重新编码,生成K—1个虚拟变量,然后直接纳入covariate对话框中进行分析。
 
在统计分析中,控制变量或协变量covariate一定是间距变量。如果需要纳入分类变量,一定需要事先重新编码生成多个二分类变量。
 


https://blog.sciencenet.cn/blog-298032-358277.html

上一篇:有人喜欢看,就有人写
下一篇:国人不仇富,但仇腐
收藏 IP: .*| 热度|

1 杨华磊

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 14:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部