||
T 检验是最基础的统计检验, 统计书中最开始的一章节, 主要用于连续变量的显著性检验, 分为:
与固定值的T检验
配对样本T检验
独立样本T检验
from scipy import statsimport pandas as pdimport numpy as npfrom statsmodels.formula.api import olsfrom statsmodels.stats.anova import anova_lmfrom statsmodels.stats.multicomp import pairwise_tukeyhsdimport matplotlib.pyplot as plt
这里, 与常量比较时, 用的是stats.ttest_lsamp函数
试验数据是一组5年生的树, 查看它们与8米的差异是否达到显著水平
dat = pd.read_csv("6.1.csv")
dat.head()
x | |
---|---|
0 | 8.0 |
1 | 7.9 |
2 | 7.9 |
3 | 8.1 |
4 | 8.2 |
print(stats.ttest_1samp(dat,8))
Ttest_1sampResult(statistic=array([4.51858295]), pvalue=array([8.49191658e-05]))
配对样本T检验, 用的是stats.ttest_rel()函数
paired = pd.read_csv("6.2.csv")
paired.head()
a | b | |
---|---|---|
0 | 16.68 | 18.68 |
1 | 20.67 | 23.22 |
2 | 18.42 | 21.42 |
3 | 18.00 | 19.00 |
4 | 17.44 | 18.92 |
stats.ttest_rel(paired["a"],paired["b"])
Ttest_relResult(statistic=-5.223707703484895, pvalue=0.0033994208029429042)
stats.ttest_1samp(paired,0)
Ttest_1sampResult(statistic=array([26.67732616, 27.63689361]), pvalue=array([1.38380926e-06, 1.16087330e-06]))
独立样本T检验用的是:statsmannwhitneyu()函数
duli = pd.read_csv("6.3.csv")
duli.head()
a | b | |
---|---|---|
0 | 16.68 | 18.68 |
1 | 20.67 | 23.22 |
2 | 18.42 | 21.42 |
3 | 18.00 | 19.00 |
4 | 17.44 | 18.92 |
stats.mannwhitneyu(duli['a'],duli['b'])
MannwhitneyuResult(statistic=4.0, pvalue=0.015319493968851633)
数据下载:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 01:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社