||
有序多分类logistic回归,需要满足比例优势假定proportional odds assumption(即平行性检验score test for the proportional odds assumption)。
1、 有的人认为累积比数模型对这一条件并不敏感,即条件不成立时参数估计仍然稳定。
模型中的这一条件只是理论上的一种假定,在多数情况下,并没有必要顾及这一假设是否成立,它所适应的范围是广泛的。由于这一模型较为稳健,实际划分反应变量的等级时,可根据专业需要适当的分得细一些。(陈峰. 医用多元统计分析方法,2007,第2版, P107)
2、 有的人认为比例优势假定不满足,提示数据不适合采用累积比数logit模型,可能会得到有偏的估计,应该换用其他模型如偏比例优势模型进行分析验证。当条件违背时,有时候会对结果造成较大影响,甚至会改变结论。(冯国双,医学案例统计分析与SAS应用,P188)
3、 有的人认为,适当合并因变量的分类,减少因变量的取值个数。(张家放,医用多元统计方法,P134)
比如三分类分为两分类,确实会损失有效信息,但是在数据分析的同时也需要考虑结果的可理解性和可应用性。分成二分类是在精确性和易用性上所作的折中,结果更容易理解和接受。
反对的声音当然会有,不能简单地将其中两个水平单独拟合二分类,损失了信息。
4、 有的人认为,平行性检验不符合,选择正确的拟合函数;按照无序多分类logistic回归处理。
如果平行性假设不能被满足,又当如何处理?
首先,有序logistic模型对此适用条件有一定的耐受性,当条件被轻微违反时(如P值很接近0.05),参数的估计仍然是较为稳定的。对此问题,国内的学者还进行过深入的研究,李康、郭祖超(1993年)等曾就此作过讨论。但是,如果平行性检验的P值非常小,是不能就这样蒙混过关的。
简单地说,可能导致该情形出现的原因主要有两个:连接函数选择不准确,或者系数的确在随着分割点发生变化。
这里先来讨论前者,在许多情况下,选择正确的连接函数就可以找到满足平行性假设的模型。如果对模型拟合没有特殊要求,尤其是反应变量水平数较少的情况下,建议大家使用默认的logit函数。如果各种连接函数都无法满足平行性假定,则需要考虑回归系数是否会随着分割点而发生改变。此时最好使用无序多分类的logistic回归进行模型拟合,然后再根据系数估计值考虑如何进行处理。
如果因变量为有序分类,但存在以下情况时也应该用无序多分类的logistic回归分析:
(1)Test of parallel lines检验P<0.05。
(2)专业上认为自变量在各回归方程的效应不同。
(张文彤.SPSS统计分析高级教程,2004. P194-196)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 00:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社