开放的科研分享 http://blog.sciencenet.cn/u/chuchj 生态学 兰州大学

博文

重复测量方差分析1

已有 17674 次阅读 2007-10-14 22:08 |个人分类:生活点滴

最近分析数据需要用到重复测量的方差分析,就狠K了一番。翻译的比较匆忙,变看边写的没有什么思路。

1、利用SAS PROC GLM 程序进行重复测量的方差分析

本手册描述了如何利用SAS PROC GLM 程序进行重复测量的方差分析,包括对象间变量(a between-subjects variable)的分析。首先解释了何时该使用改方法;描述了本手册中用到的术语;给出了研究问题;最后,用一个详细的例子阐述了如何使用改程序。

假定你知道如何书写SAS的程序和导入数据文件以及运行SAS命令。此外,我们还假定你熟悉方差分析(ANOVA)的基本方法和假定。

2、何时使用重复测量的方差分析

任何方差分析都一样,重复测量的方差分析也是用来检验平均值的差别的。当在许多不同的条件下测量随机取样的所有成员时,使用重复测量的方差分析。由于样本是依次曝光于各个条件的,所以对因变量的测量是重复的。对此使用标准的ANOVA分析是不合适的,因为它不符合标准方差分析的前提假定:数据之间的独立性。需要注意的是,有些ANOVA设计综合了重复测量因子和非重复测量因子。只要有一个重复测量因子存在,就应该考虑使用重复测量的方差分析。

使用该方法有以下几个原因:

1)、一些研究的假说要求重复测量。比如,经度研究测量几个年龄的样本成员。在这个例子中,年龄应该是重复的因子。

2)、当取样成员之间存在很大的变异时,按标准方法得到的误差变异很大。对每个取样成员的重复测量可以减小改误差变异。

3)、当取样成员不宜获取时,重复测量的设计显得经济实惠,因为每个成员都可以用来曝光于所有的条件。

4)、注意的是重复测量的方差分析不能检验随机效应!

5)、当取样成员根据一些重要的特征配对后,也可使用重复测量方差分析。这里,每个配对的组具有相同的成员,组内每个成员都曝光于某个因子的不同的随机水平。当取样成员配对了,不同条件下的测量可以当作重复测量来看待。

比如,假定你选择了一组低气压对象,测量他们的气压水平,然后将那些具有相似气压水平的进行配对。然后给予每对中的一个成员低压处理,再次测量所有成员的低压水平。对此种情况,重复测量的方差分析是最有效的。当然,这里一个配对应当当作一个单一的取样成员。

应该认清重复测量设计和单纯的多变量设计之间的区别。对二者来说,都是多次测量取样成员,但是,在重复测量设计中,每次实验测量的是同一特征在不同条件下的数值。比如,你可以用重复测量方差分析来比较橘子树在不同年份所结的橘子的数目。测量的指标是橘子的数目,,这里的条件就是不同的年份。相反,对于多变量的设计,每次实验测量的是不同的特征。你不能够用重复测量的方差分析来比较橘子的数目、重量和价格。三个指标是数目、重量和价格,这些并不是代表不同的条件,只是不同的指标而已。

3、术语解释

对象:取样成员。

对象内因子:因变量多次测量,覆盖了所有的取样成员和一系列条件时,这一系列的条件就是对象内因子。

对象间因子:因变量多次测量,但是是基于所有成员的不同的独立的组,即成员已经分组了,这里每个组曝光于一个不同的条件,这里的条件就是对象间因子。

当分析里包含了双方时(对象内因子和对象间因子),就称为有对象间因子的重复测量方差分析。

4、实例研究

下面主要是举个例子来详细的说明如何使用重复测量的方差分析。假如你是一个健康问题专家,你期望弄清楚饮食习惯和锻炼对于脉搏速率的影响。为了达到这个目的,你收集了一组人的资料,并且根据他们的饮食偏好进行分组:肉食者和素食者。然后,在每个组内,又分成三个小组,每个小组随机配以下面三种锻炼中的一种:爬楼梯、短网拍墙球和重力训练。现在,你就设计了有2个对象间因子的实验:饮食偏好和锻炼类型。

5、确实数据的处理和非平衡设计

1)、对象内因子的主效应

运动的强度影响脉搏的速率(平均脉搏率在不同的实验水平上是否改变)。这就是对象内因子 运动强度 的主效应检验。

2)、对象间因子的主效应

饮食结构是否影响脉搏率(素食者与肉食者的平均脉搏率是否相等)?这就是对象间因子 饮食偏好 的主效应检验。

锻炼类型是否影响脉搏速率(爬楼梯的、打网球的与重力训练的平均脉搏率是否有差别)?这是对象间因子 锻炼类型 的主效应检验。

3)、对象间因子的交互效应

锻炼类型对脉搏速率的影响是否依赖于饮食结构。这是对象间因子 锻炼类型 与对象间因子 饮食结构 间的交互效应。也可以表示成饮食结构对脉搏速率的影响是否依赖于锻炼类型,结果是一样的。

4)、对象内与对象间因子的交互作用

饮食(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)?

锻炼类型(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)?

饮食(对象间因子)对脉搏速率的影响是否依赖于运动的强度(对象内因子)和锻炼类型?

6、零假说,Alpha,和P

记住的是,检验的无效假说都是假定所比较的平均值之间没有差别较大的F值对应着一个较小的P

1)、输出类型

当对象内影子超过两个水平时,PROC GLM 输出两个不同的结果:一个是使用多变量分析的结果;另一个是用单变量方法分析的结果。通常,这两种方法产生相似的结论。单变量分析来检验对象内因子的效应时要求球形假定。当至少有一个对象间因子有2个以上水平时,必须满足球形检验的条件。当你的对象内因子不满足球形假定,你要么用多变量分析方法,要么就校正单变量分析的结果(校正系数GGHF)。

2)、转换变量

球形假定是通过转换因变量来实现的。代表每次实验的原始变量根据正交比较进行转换。转换的形式通常不影响检验的结果,只要转换矩阵是正交的。

3)Mauchly球形检验和Epsilon校正系数

球形检验的结果只是决定你将要用哪种输出结果,单变量的还是多变量的。这里特别要注意:球形检验的结果不是决定你是否使用重复测量的方差分析(这是在实验设计时的事情),而是决定在重复测量方差分析之后你选择哪种输出结果。如果选择单变量的,要么它满足球形检验,要么你就必须对结果进行校正。通常,如果不满足,最好还是选择多变量的结果!

上面已经提到,另种方法就是校正你的单变量检验的自由度。通常有两种不同的校正因子,Greenhouse-Geisser Epsilon (G-G) Huynh-Feldt Epsilon (H-F)。一般使用HF校正系数,因为GG校正系数被证实太保守了从而不能够观察到组间的差别。默认状况下,系统会自动对每个单变量F检验(涉及到对象内因子的效应)输出经GGHF校正后的P值的。

正如上面提到的,即便球形假定不成立,多变量方法检验仍然是有效的。这就是说,当球形假定成立时,单、多变量的结果都可以用,差别不大;当球形假定成立时,要么用多变量的结果,要么就用校正后的单变量的结果!

在重复测量分析中,通常有四种多变量分析的方法,分别是:Wilks’ Lambda, Pillai’s Trace, Hotelling-Lawley Trace Roy’s Greatest Root。通常用第一种方法(Wilk)。

对于对象内因子的检验,上面说了可以有很多种检验的方法,单变量的多变量的,以及校正后单变量的。而对于对象间因子的检验,只有一种方法,也就是一般的线性模型。原文参考:http://www.ats.ucla.edu/STAT/sas/library/repeated_ut.htm 。

http://www.ats.ucla.edu/stat/Spss/code/rep_anova_sig.htm

http://www.visualstatistics.net/SPSS%20workbook/one-way_repeated_measures_anova.htm

http://www.lifesci.sussex.ac.uk/home/Zoltan_Dienes/SPSS%202-way%20rm.html

http://wwwstage.valpo.edu/other/dabook/ch12/c12-2.htm (推荐,使用SPSS进行数据分析!)



http://blog.sciencenet.cn/blog-4228-8968.html

上一篇:发表论文的策略和手段
下一篇:高校大跃进的困局与危境【转】

0

发表评论 评论 (5 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-1-20 22:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部