|||
地学中存在众多的时间序列变量,例如温度、降水,分析这些变量的趋势往往用到线性拟合趋势线,这趋势线的本质就是表达时间序列与变量之间的函数关系,若两者显著相关,则趋势线的预测就比较可信,反之则不可信。
本帖试举一例说明评价趋势线显著性的过程。
以美国某气象站1894~2010年连续的年降水量为例,该气象站降水量的年时间序列及其一元线性趋势线如图 1。
图 1
从图 1可得,时间序列的降水趋势线R2偏小,说明趋势线拟合的y’所包含的降水量信息偏少,但这不妨我们继续对它进行显著性检验。注意,y’表示在趋势线上x对应的y轴值。
统计上的显著性,指在一定显著水平之下,小概率事件不太可能因偶然性而发生(In statistics, a result is called statistically significant if it has been predicted as unlikely to have occurred by chance alone, according to a pre-determined threshold probability, the significance level.)。
t检验与F检验方法辨析
t检验与F检验都是多元回归分析常用的统计检验方法。前者是对单个变量显著性的检验;后者则是对检验解释变量(自变量)的整体对被解释变量(因变量)影响的显著性(靳庭良和张宝青,2009)。这种差异可从他们的零假设(Null Hypothesis)辨析:
t检验零假设H0:βi=0(i=0、1、2…k,β表示各因变量的系数);
F检验零假设H0:β1=β2…βk=0;
分析两种零假设的区别:t检验零假设是否至少有一个因变量的系数为0,F检验的假设是否全部因变量的系数为0。
那么,对于一元线性回归而言,两种假设检验是等价的,他们的零假设均为β1=0。因此,以下对一元线性趋势线的显著性检验将应用F检验,计算过程主要参考Matlab:F-statistic and t-statistic。
F检验
图 2
由图 2可知,自变量的系数为0.33689,常数项是444.66,R2为0.00464,表示趋势线可以解释0.464%的因变量,F统计量p-value(表示零假设发生的概率)等于0.465,通常以p-value≤0.05作为拒绝零假设选择备择假设(Alternative Hypothesis)的判断阈值,则该一元线性趋势线不能拒绝零假设—因变量系数为0,即该趋势线未通过α=0.05显著水平的检验,因此判定x与y相关性不显著。
F检验
图 3
由图 3可知,x的零假设概率p-value等于0.46546,仍然判定x、y之间相关性不显著。
图 2和3的一些统计参数的解释参考:Interpret Linear Regression Results。
小结
t检验与F检验相对于一元线性回归是等价的,无优劣之分,任选其一即可。
附上本例的代码(SIGNIFICANT.rar)。
regress函数运行结果同上。
栅格处理代码(program.rar)。
参考文献
[1] 靳庭良, 张宝青. 回归分析中t检验与F检验关系的进一步探讨[J].统计与决策, 2009, 21:7-9.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-16 04:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社