anthonyfang的个人博客分享 http://blog.sciencenet.cn/u/anthonyfang

博文

我们为什么要用泰勒图验证模型模拟精度?

已有 5842 次阅读 2020-10-31 02:20 |系统分类:科研笔记

    老大难的博士生终于快把文章熬出来了,今天写到结果和讨论的时候突然拿到做出的泰勒图结果不知道该如何下嘴。是只看弧度轴的Correlation coefficient,就聊相关分析系数r 还是怎么去聊STD和RMSE。于是和我那些生态学出身的师弟们在实验室讨论了半天相关分析和回归分析,又和小司师弟通话了个把小时,感觉都没给我讲清楚。

    稍微写写对泰勒图的理解,也算是给晚上琢磨半天一个交代。(在这先给泰勒老爷子上柱香,上早了您也别怪我,没那个意思。)

    本来写了半天推相关系数意义的公式和文字,嫌太麻烦了。直接看这篇回答吧,讲的十分易懂很优秀。


如何通俗易懂地解释「协方差」与「相关系数」的概念? - GRAYLAMB的回答 - 知乎

https://www.zhihu.com/question/20852004/answer/134902061

  


标准差:


标准差描述的是变量在整体变化中偏离均值的幅度。


协方差:

[公式]



协方差除以标准差,把协方差中变量变化幅度对协方差的影响剔除掉,得到相关系数:


    所以相关系数强调的只是同向与否,并不管你两条线 波动范围/变化幅度 的大小,只是单纯反映两单位变量在每单位变化的时候的相似程度。



   相关系数只告诉我们,红(X)在往下走的时候,绿(Y)也在往下走,并不care(图2)红走了0.02单位,绿走了140的单位。所以泰勒图还有两个指标,RMSE和STD,STD是约束波动范围的。



两条线(两组值/两个变量),假想这两条线都是小时候吃的跟绳子一样的橡皮条软糖,怎么能把他严丝合缝的叠在(约束)在同一个位置上呢。


相关系数r:让这两条线的波动、走向是同一个方向的。我往上走你也得往上走,我往下走你也得往下走,不管我走100步,你走1步,但你的方向、节奏得和我一致。


标准差是约束两条线的波动幅度得是一样的,我往上走一步,你也得往上走一步,你走半步两步都不行,必须走的量度是一样的。


这样看似好像两条线的形状可以约束的一模一样了吧,但是像上图情况1的情景就是BUG了。你走的方向、幅度什么都和我一样,但是我在北京走,你在纽约走,那有个什么用啊。纽约吃不着北京的门框胡同,北京也看不着纽约的自由女神像,还是差了十万八千里嘛。


所以泰勒图有第三个约束

RMSE:


而RMSE是约束两条线(红、绿)之间的距离(yi、 yi尖看成 红、绿),RMSE=0的时候,我们就合体了。


你要和我同方向走,你要和我走同样的步子,你要和我之间的距离是0。啪 这下两条线就严丝合缝的重合了。

所以,在泰勒图中,预测点要和基准点在空间位置上重合的时候(STD:预测=基准   RMSE=0  r=1 ),表示您这模型就神了,100%模拟现实了。其余时候,离基准点越近,模拟效果越好!


后记:写个啥太累了,我自己论文还没写完呢。如果我这个QQ空间有啥写错的,逻辑 词语啥的不对不标准的,您直接留言纠正就行了,反正我是不想再改了23333。








https://blog.sciencenet.cn/blog-3321945-1256415.html

上一篇:[转载][R语言绘图]绘图样式设置(符号、线条、颜色、文本属性)
收藏 IP: 159.226.112.*| 热度|

1 曹俊兴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 16:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部