檀成龙的个人博客分享 http://blog.sciencenet.cn/u/zhgatcl 博客主题:超深盆地调水增雨,改变气候改善生态,造福中华造福全人类。

博文

请教⑶:某二元拟合公式的指标参数不满足理论要求,为什么?

已有 2803 次阅读 2018-6-19 18:46 |个人分类:求教|系统分类:科研笔记| 多元拟合公式, 主要影响因素, 次要影响因素, 指标参数


某二元拟合公式的指标参数不满足理论要求,为什么?

 


本文试图回答的思考题(设问):原来的二元拟合公式的指标参数非常优秀,把其中的一个自变量地面水汽压换成相对湿度以后,指标参数就满足不了理论要求,为什么?

也可以这样设问:多年平均降水量P与相对湿度U和海拔高程H的二元拟合公式,指标参数满足不了多元拟合的理论要求,为什么?

还可以这样设问:中国各地多年平均降水量P3个自变量(eUH)的三元线性拟合公式的4类指标参数非常优秀;去掉海拔高程H或者去掉相对湿度U再拟合的二元拟合公式,4类指标参数也非常优秀;但去掉地面水汽压e再拟合的二元拟合公式,指标参数就满足不了多元拟合的理论要求,为什么?


由前期研究可知,中国各地多年平均降水量与平均地面水汽压一元线性拟合的相关判定系数R2=0.8019R=89.5%),中国各地多年平均降水量与平均相对湿度一元乘幂拟合和线性拟合的相关判定系数分别为R2=0.7854R=88.6%)和R2=0.7084R=84.2%)。由此可知,中国各地多年平均降水量与以上两个水汽参数一元拟合的相关判定系数R2相差不大,似乎两个水汽参数的差别不大,年降水量与相对湿度一元拟合的相关判定系数R2稍微小一点。

由前期研究可知,中国各地多年平均降水量P与平均地面水汽压e和海拔高程H二元线性拟合的公式为P=95.46e+99.64H-390.19,  R2=0.827815R=0.91公式的4类指标参数相关判定系数R2Significance FP-valuet Stat)非常优秀,把以上二元线性拟合公式的平均地面水汽压e换成平均相对湿度U,进行中国各地多年平均降水量P与平均相对湿度U和海拔高程H的二元拟合研究,那线性拟合的4类指标参数将怎样?

把平均相对湿度作为第1个自变量X1,海拔高程作为第2个自变量X2,多年平均降水量作为因变量Y,据此进行中国各地多年平均降水量P与平均相对湿度U和海拔高程H的二元线性拟合研究,由Excel可输出如下拟合成果(原始数据详见配套Excel,下载网址是http://prep.nstl.gov.cn/preprint/main.html?action=showFile&id=2c9282826370f94001640b894219015f)

2.jpg

由以上拟合结果得到的二元拟合公式为 P=3650U+17.37H-1633R2=0.70926虽然R2较大,但第2个自变量X2也就是海拔高程HP-value=0.443904675>0.05,与多元拟合的理论要求相差很远(按多元拟合理论,P-value越小越好,一般要求小于0.05),所以,该二元拟合公式不可信(该二元拟合公式中,海拔高程H的回归系数为17.37,而四类指标参数非常优秀的二元线性拟合公式P=95.46e+99.64H-390.19和三元线性拟合公式P=70.19e+1375.67U+100.94H-1003.46中,海拔高程H的回归系数在100左右,两者相差很大,后者是前者的5.76倍)。中国各地多年平均降水量P与平均地面水汽压e和海拔高程H的二元线性拟合公式P=95.46e+99.64H-390.194类指标参数非常优秀,把其中的一个自变量平均地面水汽压e换成平均相对湿度U以后,再拟合得到的中国各地多年平均降水量P与平均相对湿度U和海拔高程H的二元线性拟合公式P=3650U+17.37H-1633的指标参数就不符合多元拟合的理论要求,为什么?



作者的认识是:中国各地多年平均降水量与平均地面水汽压一元线性拟合的相关判定系数R2=0.8019R=89.5%),中国各地多年平均降水量与平均相对湿度一元乘幂拟合和线性拟合的相关判定系数分别为R2=0.7854R=88.6%)和R2=0.7084R=84.2%)。虽然中国各地多年平均降水量与以上两个水汽参数一元拟合的相关判定系数R2相差不大,似乎两个水汽参数的差别不大,但地面水汽压e是年降水量的主要影响因子,相对湿度U是年降水量的次要影响因子(该认识详见http://blog.sciencenet.cn/home.php?mod=space&uid=1458267&do=blog&id=1119001),海拔高程也是年降水量的次要影响因子。

在中国各地多年平均降水量P与平均地面水汽压e和海拔高程H的二元拟合研究中,一个自变量平均地面水汽压e是主要影响因子,另一个自变量海拔高程H是次要影响因子,即自变量中有主要影响因子,所以,该二元拟合研究的4类指标参数非常优秀,公式可信。

海拔越高,水汽层的厚度越小,地面水汽压越小;海拔越低,水汽层的厚度越大,地面水汽压越大;海拔高程与地面水汽压负相关,两者之间的拟合关系详见下图,指数拟合的相关判定系数R2=0.4242,相关系数R=-0.651在中国各地多年平均降水量与平均相对湿度和海拔高程的二元拟合研究中,没有主要影响因子地面水汽压,两个自变量都是次要影响因子,并且,一个次要影响因子相对湿度与主要影响因子地面水汽压正相关(详见前面博文的插图,对数拟合时相关判定系数R2=0.7169),另一个次要影响因子海拔高程与主要影响因子地面水汽压负相关,缺乏主要影响因子的二元线性拟合公式P=3650U+17.37H-1633把主要影响因子地面水汽压贡献的权重强行分派给予两个相互矛盾的次要影响因子(次要影响因子平均相对湿度与主要影响因子地面水汽压正相关,次要影响因子海拔高程与主要影响因子地面水汽压负相关),这样的“强行分派给予”很难保证两个次要影响因子的P-value符合要求。以上分析用数学语言描述就是:中国各地多年平均降水量P与三个自变量的三元线性拟合公式为

P=70.19e+1375.67U+100.94H-1003.4670.2(e-2.27)+1376(U-48.6%)+101(H-1.74)

R=92.8%,式中地面水汽压e是主要影响因子,去掉主要影响因子地面水汽压e以后强行拟合,三元拟合公式P=70.19e+1375.67U+100.94H-1003.46变成了二元拟合公式P=3650U+17.37H-1633R2=0.70926,比较以上两个拟合公式可知,相对湿度的回归系数成倍增加(由1375.67增加到3650),海拔高程的回归系数不增反减(由100.94变成17.37),这样的“强行分派给予”很难保证两个次要影响因子的P-value符合要求。所以,该二元拟合公式的指标参数不能满足多元拟合的理论要求(相对湿度的P-value=0.443904675>0.05,不合要求),简单表述就是该二元拟合公式缺少主要影响因子,所以不可信。


 以上拟合研究告诉我们,在多元拟合公式中,必须包含主要影响因子,否则拟合公式的可信度存疑;没有主要影响因子的多元拟合公式,即使某个自变量的P-value0.05,肯定不是主要影响因子,仍有可能是次要影响因子;实际工作中,必须高度重视主要影响因子的研究工作,否则,研究走弯路的可能性很大

我的以上认识正确还是错误?请您客观评价。

2.jpg

 




https://blog.sciencenet.cn/blog-1458267-1119765.html

上一篇:请教⑵:年降水量的主要影响因子是地面水汽压还是相对湿度?
下一篇:请教⑷:年降水量与两个次要影响因子一元拟合的效果大相径庭,为什么?
收藏 IP: 113.76.219.*| 热度|

1 张学文

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 22:46

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部