|||
相关系数是用以反映变量之间相关关系密切程度的统计指标。反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数)。还有曲线相关关系和复相关关系,这二者不是本帖讨论的重点,可能在以后有讨论。文末附有数据和代码。
Pearson相关系数也称通用相关系数,适用于线性相关与非线性相关情况的描述(张世强等,2009),MATLAB自带的corrcoef函数采用通用相关系数,其公式如下:
式中:。
另一相关系数公式来自孙佳(2008),谈论时间ti与变量xi之间的相关系数,公式如下:
本研究以美国某气象站1894~2010年连续的年降水量为例,试应用MATLAB分别计算这两种相关系数。
本例中年份与降水量的通用相关系数是0.0681,呈正相关,但两个序列相关性并不大。第二种相关系数是0.2022,相关性比通用相关系数增强很多,是前者的近3倍。
补充(2014.11.23):
上文的第二种相关系数计算过程没有消除不同变量量纲及数量级差异的影响,这可能会遇到结果异常(>1),这时候可以使用均值化处理变量再采用时间序列相关系数,附上代码(Equalization.m)。
注意,采用时间序列相关系数不可以对变量做标准化处理。
参考文献
[1]张世强, 吕杰能, 蒋峥, 张雷. 关于相关系数的探讨[J]. 数学的实践与认识, 2009,39(19):102-107.
[2]孙佳. 47年来石羊河流域气候变化趋势及突变分析[D]. 兰州: 兰州大学, 2008.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-29 04:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社