suwenxia的个人博客分享 http://blog.sciencenet.cn/u/suwenxia

博文

Pearson相关系数与Spearman相关系数

已有 35262 次阅读 2013-4-4 18:02 |系统分类:科研笔记| 系数

相关系数:

   相关系数,或称线性相关系数、皮氏积矩相关系数(Pearson product-moment correlation coefficient, PPCC)等,是衡量两个随机变量之间线性相关程度的指标。它由卡尔·皮尔森(Karl Pearson)在1880年代提出。

    相关系数(r)取值范围为[-1,1],r>0表示正相关,r<0表示负相关,|r|表示了变量之间相关程度的高低。特殊地,r=1称为完全正相关,r=-1称为完全负相关,r=0称为不相关。通常|r|大于0.8时,认为两个变量有很强的线性相关性。

      样本相关系数常用r表示,而总体相关系数常用ρ表示。
在线性关系不显著时,还可以考虑采用秩相关系数(rank correlation),如斯皮尔曼秩相关系数(Spearman's rank correlation coefficient)等。 
 
      Pearson 线性相关系数只是许多可能中的一种情况,为了使用Pearson 线性相关系数必须假设数
据是成对地从正态分布中取得的
,并且数据至少在逻辑范畴内必须是等间距的数据。如果这两条件
不符合,一种可能就是采用Spearman 秩相关系数来代替Pearson 线性相关系数。Spearman 秩相关系
数是一个非参数性质(与分布无关)的秩统计参数,由Spearman 在1904 年提出,用来度量两个变
量之间联系的强弱(Lehmann and D'Abrera 1998)。Spearman 秩相关系数可以用于R 检验,同样可以
在数据的分布使得Pearson 线性相关系数不能用来描述或是用来描述或导致错误的结论时,作为变

量之间单调联系强弱的度量。

    Spearman对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。理论上不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究 。

 

http://baike.baidu.com/view/172091.htm

http://hi.baidu.com/minggong90/item/d8f8ff333838a1b4633aff9d

http://wenku.baidu.com/view/ad01681cb7360b4c2e3f64fd.html

 



http://blog.sciencenet.cn/blog-757603-676904.html

上一篇:R语言做"heatmap"
下一篇:一代、二代、三代测序技术

3 彭勇 戎可 杨华磊

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-11-27 20:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部