||
用数据说话系列(1): 样本数,数据顺序对 t test 的影响
Basic knowledge worth spreading!
用数据说话,一目了然,再也不用担心统计学理论晦涩难懂了。
文中分析所用数据及分析方法见文章后半部分。
same N表示两组样本数N相等,longer N表示比column A数据样本数N更多(多两个数据,i.e.,19和23)。reverse data表示column A数据的逆序排列,unordered data表示column A数据的乱序排列。
直接上干货:
t.test var.equal=T | |||||
column A | same N | longer N | reverse data | unordered data | |
t | control | -1.0323 | -1.7461 | -1.0323 | -1.0323 |
df | control | 18 | 20 | 18 | 18 |
p-value | control | 0.3156 | 0.09613 | 0.3156 | 0.3156 |
t.test 与数据顺序无关,与样本数N有关(随样本数N变化)。 |
t.test var.equal=F (Welch test) | |||||
column A | same N | longer N | reverse data | unordered data | |
t | control | -1.0323 | -1.8639 | -1.0323 | -1.0323 |
df | control | 14.869 | 15.539 | 14.869 | 14.869 |
p-value | control | 0.3184 | 0.08135 | 0.3184 | 0.3184 |
Welch test 与数据顺序无关,与样本数N有关(随样本数N变化); 另,它与t.test结果t值相同,df和p-value均不同。 |
Mann-Whitney U test | |||||
column A | same N | longer N | reverse data | unordered data | |
U | control | 40.5 | 40.5 | 40.5 | 40.5 |
df | * | * | * | * | * |
p-value | control | 0.4937 | 0.2082 | 0.4937 | 0.4937 |
Mann-Whitney U test 与数据顺序无关,与样本数N有关(随样本数N变化);另,它与t.test结果t值以及p-value均不同。 |
上图说明:TEST data1 和 TEST data2 为完全相同数据,进行t test等比较;TEST data3 为 TEST data2的数据逆序排列,TEST data4 为TEST data2 删除 longer N中不等长的2个数据(i.e.,19,23)变成样本数N等长的5组数据,进行ANOVA及Kruskal test比较。
附上R code截图:
纰漏和错误之处在所难免,恳请您批评指正!
系列文章>>
用数据说话系列(1): 样本数,数据顺序对 t test 的影响
用数据说话系列(2): 样本数,数据顺序对"聚类分析"的影响
用数据说话系列(3): 样本数,数据顺序对"方差分析ANOVA"的影响
用数据说话系列(4): 各种 t 检验 样本数 至少每组多少为宜
用数据说话系列(5): 非参数检验SteelDwass test和 Dunn test选谁
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 19:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社