|
在方差分析中,一般要求样本之间独立,这个是很好理解的,表示独立取样,样本间没有自相关。正态是指方差分析中每一组内样本符合正态分布,但是不同的组,不要求符合同一正态分布,只要求不同组正态分布的方差一致就可以,这就是同方差。
在线性回归分析中,独立很好理解,但是正态和同方差往往会被误用。很多人做线性回归之前,先检验响应变量y是否符合正态分布,这样做是不对的。这里说正态分布,是指每个y是从不同正态分布的样本里抽样出来,而不是所有y是同一正态分布抽样出来的。这一点可以理解为,每个y 相当于从每一组正态分布中抽取出来(如图),而不是从同一个正态分布随机抽取出来。因此,理论上,做线性回归先检验响应变量y是否符合正态分布是没必要的,因为对于某一个特定的x , 往往所对应的y样本量很少,所以检验每个特定x (相当于方差分析中每种treatment)下所对应的y 是否符合正态分布往往是不现实,也是没必要的。同方差就是指不同x 条件下,残差的大小不随x变化而变化(也就是残差随机)。如同残差不随机,说明普通线性模型不符合,得考虑其他类型模型。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 20:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社