||
管理研究假设检验 (NHST)的基本大问题,我们的假设是否为Null hypothesis?
20210415 by Prof. Mac Shiau (Wen-Lung Shiau) 萧文龙教授
管理研究应创造有用且可靠的知识,其中有用的知识需要依赖可靠的知识累积,才能保证管理研究的应用可以真正产生效果。然而一个研究结果的可靠性,看起来方法严谨,但其实它的可靠性是有问题的。例如Mertens and Recker (2020) 回顾2013-2016 期间 AIS Senior Scholars’ 8大期刊的引用次数前100篇文章,发现 假设检验 Null Hypothesis Significance Testing(NHST)的重要议题,错误使用和错误解释的情形,依旧存在, 其中有高达 83.7%的文章未考虑或讨论假设检验type II 错误的问题。如同作者 Mertens and Recker所说,我们不是要批评文章,而是透过回顾发现一些问题,提供一些有用的指导原则,让未来的研究更好。
一般假设检验 NHST的基本问题,请参考Mertens and Recker (2020)的文章,现在我们讨论一个也曾经困扰个人很久的基本大问题:在一般实证研究中,我们的假设是否为Null hypothesis?
什么是Null hypothesis?
在大学的商业统计课程中,我们总是教学生作假设检定时,需要建立虚无假设或零假设(Null hypothesis)和对立假设(Alternative hypothesis),从Lin et al. (2013) 的研究文章中,可以看出Null hypothesis是检定是否零(零假设)或没有差异(no effect)的假设。
例如,
1.点估计,使用t检定平均数=0
2.多变数相关系数,使用t检定两个变数的平均数是否相等(no effect),
3.多元回归R平方(从0计算的离差):用F检验R平方=0
4.多元回归R平方的增加:用F检验新增加的RA,B的平方是否等于RA的平方(no effect)。
当我们的研究提出假設檢驗,并不是虛無假設(零檢驗或 no effect没有差异) 檢驗时,我们不禁回顾,难道我们教导谢学生们提出虛無假設(Null hypothesis)檢驗时,教错(对)了吗?
其实我们只教对了一半,而忽略了另一半,才会产生一知半解的情形,这需要回顾到虛無假設檢驗(零檢驗)的历史,早期Fisher在1935年提出的虛無假設檢驗(零檢驗),心理學家先熟悉和接受虛無假設檢驗(零檢驗),教科書和教學都使用Fisher的估計方式,後来Neyman and Pearson 的統計檢定力分析用來補強虛無假設檢驗(零檢驗)是適當的,到了1955年Fisher依舊拒絕了Neyman and Pearson所強調的檢定力分析,因为檢定力分析難以在虛無假設檢驗(零檢驗)中計算出來(Sedlmeier and Gigerenzer, 1989),也就是在計算型I錯誤(type I error)時,無法估計出型II錯誤(type II error)。雖然Neyman and Pearson的檢定力分析都寫入大部分的統計教科書了,然而,大部分的老师在教导提出虛無假設(Null hypothesis)檢驗时,聚焦在避免I錯誤(type I error)時,而忽略了避免型II錯誤(type II error)。
我们举例说明如下:
范例1,
我们假设满意度会正向显著影响忠诚度
当我们报告回归系数是在0.05显著水准下,满意度正向显著忠诚度,为了避免(a) Type I错误和决策方便,我们会说明我们的结果是在 95% confidence interval信赖水准(置信区间)下,回归系数为正向的事实,有95%的机会可以观察到满意度正向显著忠诚度的结果。
现在的管理研究(例如,信息管理)假设中,大量的使用X正向显著的影响Y,或者是X显著地关连(associate)Y, 是带要有方向和显着性的,这和Null hypothesis是一致的吗?这该如何检定和解释呢?Lin et al. (2013)在ISR顶刊中提出了相当好的说明,Lin et al. (2013) stated:
“…, The null hypothesis either contains only the nondirectional no effect scenario or it contains both the no effect scenario and the opposite directional scenario….”
Null hypothesis包含了:
A, nondirectional no effect。 非方向(正向或负向)没有差异(no effect)情境。
或
B, no effect and opposite directional scenario。两者没有差异(no effect)和相反方向情境
我们举例说明如下:
范例2,
我们假设满意度会正向显著影响忠诚度
当我们报告回归系数是在0.05显著水准下,满意度正向显著忠诚度,这是说明我们的结果是回归系数为0或负向的事实,只有5%的机会可以观察到这样的结果。
范例3,
我们假设大学生中,男生比女生更爱玩线上游戏,这时候,隐喻着Null hypothesis是没有性别差异(no effect)或者是女生比男生更爱玩线上游戏。
从上述2个范例可以发现,目前我们所建立的假设常常隐喻着是在统计学中谈到的对立假设(alternative hypothesis), 因此,正确可靠的对立假设是需要避免(β) Type II错误,也就是需要考虑(1-β), power statistics 统计检验力(功效),我们建议未来的研究,尽可能在研究设计中,就需要考虑避免Type II错误,也考虑报告(1-β)统计检定力(功效)。
Faul, F., Erdfelder, E., Lang, AG. ,and BUCHNER, A. (2007) G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods 39, 175–191 (2007).
Lin, M., Lucas, H. C., Jr., & Shmueli, G. (2013). Too big to fail: Large samples and the p-value problem. Information Systems Research, 24(4), 906–917. https://doi.org/10.1287/isre.2013.0480
Mertens, Willem and Recker, Jan (2020) "New Guidelines for Null Hypothesis Significance Testing in Hypothetico-Deductive IS Research," Journal of the Association for Information Systems: Vol. 21 : Iss. 4 , Article 1. DOI: 10.17705/1jais.00629 Available at: https://aisel.aisnet.org/jais/vol21/iss4/1
Sedlmeier, P., and Gigerenzer, G. (1989). Do studies of statistical power have an effect on the power of studies? Psychological Bulletin, 105, 309-316.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-20 00:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社