|||
年降水量与两个次要影响因子
一元拟合的效果大相径庭,为什么?
本文试图回答的思考题:
地面水汽压是多年平均降水量的主要影响因子,相对湿度和海拔高程都是多年平均降水量的次要影响因子,相对湿度和海拔高程对多年平均降水量的影响相差不大。年降水量与平均相对湿度一元拟合的效果很好,年降水量与海拔高程一元拟合的效果很差,年降水量与两个次要影响因子一元拟合的效果大相径庭,为什么?
1 有主要影响因子参与的一元和多元拟合公式
1.1 有主要影响因子参与的三元线性拟合公式
由前期研究可知,中国各地多年平均降水量P与平均地面水汽压e、平均相对湿度U和海拔高程H的三元线性拟合公式为P=70.19e+1375.67U+100.94H-1003.46≈70.2(e-2.27)+1376(U-48.6%)+101(H-1.74),R2=0.860818,R=92.8%,该多元拟合公式的4类指标参数(相关判定系数R2、Significance F、P-value、t Stat)非常优秀,这充分证明平均地面水汽压e、平均相对湿度U和海拔高程H都是年降水量的影响因子。进一步的研究证明,平均地面水汽压e是主要影响因子,平均相对湿度U和海拔高程H都是次要影响因子。
1.2 有主要影响因子参与的二元线性拟合公式
中国各地多年平均降水量P与平均地面水汽压e和平均相对湿度U的二元拟合公式(以上三元拟合公式去掉了自变量海拔高程H)为P=59.983e+1361.31U-797.526≈60(e-2.27)+1361(U-48.6%),R2=0.8342,R=91.3%。
中国各地多年平均降水量P与平均地面水汽压e和海拔高程H的二元拟合公式(以上三元拟合公式去掉了自变量平均相对湿度U)为P=95.46e+99.64H-390.19≈95.5(e-2.27)+100(H-1.73),R2=0.8278,R=91.0%。
以上二个二元拟合公式都有主要影响因子地面水汽压e的参与,二个拟合公式的4类指标参数都非常优秀,再次证明平均地面水汽压e、平均相对湿度U和海拔高程H都是年降水量的影响因子。二个二元拟合公式的相关系数R相差很小(分别为91.3%和91.0%),说明两个次要影响因子(地面水汽压和海拔高程)对年降水量的影响相差不大。
1.3 有主要影响因子参与的一元线性拟合公式
中国194个国际交换站1971~2000年平均降水量P与平均地面水汽压e的线性拟合公式为P=85.124(e-2.27),R2=0.8019,R=89.5%。
以上4个拟合公式都有主要影响因子地面水汽压e的参与,所以,拟合效果都非常理想,充分说明主要影响因子的重要。
2 没有主要影响因子参与的多年平均降水量与平均相对湿度的一元拟合研究
中国194个国际交换站1971~2000年平均降水量P与平均相对湿度U的一元乘幂拟合公式为P=3619.1U4.2631,R2=0.7854,R=88.6%;中国各地多年平均降水量P与平均相对湿度U的一元线性拟合公式为P=3582.7(U-44%),R2=0.7084,R=84.2%。由此可知,多年平均降水量P与平均相对湿度U的一元拟合效果较好。平均相对湿度U只是多年平均降水量P的次要影响因子,那么,多年平均降水量P与次要影响因子平均相对湿度U的一元拟合效果较好,为什么?
作者对以上问题的认识:在博文《请教⑵:年降水量的主要影响因子是地面水汽压还是相对湿度? 》中,作者谈了多年平均降水量P与次要影响因子平均相对湿度U拟合效果较好的认识,主要观点是,次要影响因子相对湿度U与主要影响因子地面水汽压e正相关,两者之间的相关性较好(两者之间对数拟合和线性拟合的相关判定系数R2分别为0.7169和0.684,相关系数R分别为84.7%和82.7%);在年降水量与相对湿度的一元拟合公式中,相对湿度U既代表相对湿度本身承担次要影响因子对年降水量的贡献职责,在一定程度上也代表地面水汽压e承担主要影响因子对年降水量的贡献职责(打一个小于1的折扣),所以,多年平均降水量P与平均相对湿度U的一元拟合效果较好。
3 没有主要影响因子参与的年降水量与海拔高程的一元拟合研究
中国194个国际交换站1971~2000年平均降水量P与海拔高程H的拟合关系详见下图, Excel输出的线性拟合成果详见下表。由以下图表可知,数据点分散,拟合效果很差,平均降水量P与海拔高程H的一元线性拟合公式为P=-188.48H+901.79,R2=0.1351,R=-36.8%;一元对数拟合公式为P=-148.06LnH+557.1,R2=0.2598,R=-51.0%。当海拔比较低时,对数拟合曲线急速变化,很难把握。
以上成果中,平均降水量P与海拔高程H的一元线性拟合公式为P=-188.48H+901.79,R2=0.1351,R2太小,拟合公式可信度很低。全球各地都是山地降水量大于平原降水量,按理应该是其它条件相同时,年降水量与海拔高程正相关,在多年平均降水量与3个自变量(e、U、H)的三元线性拟合公式P=70.19e+1375.67U+100.94H-1003.46≈70.2(e-2.27)+1376(U-48.6%)+101(H-1.74)和多年平均降水量的二元线性拟合公式P=95.46e+99.64H-390.19中(以上两个多元拟合公式的4类指标参数非常优秀),降水量与海拔高程都是正相关并且海拔高程H的回归系数都在100左右,以上一元线性拟合公式却是负相关,为什么?还有,平均降水量P与平均相对湿度U一元线性拟合公式P=3582.7(U-44%)的相关判定系数R2=0.7084,比以上一元线性拟合公式的相关判定系数R2=0.1351大很多,海拔高程H和平均相对湿度U都是多年平均降水量P的次要影响因子,同样都是次要影响因子,同样都是一元线性拟合,两者相关判定系数R2相差很大,为什么?
作者对以上问题的认识:平均降水量P与海拔高程H的一元线性拟合公式受两个方面的影响,一方面,全球各地都是山地降水量大于平原降水量,在其它条件相同时年降水量与海拔高程正相关,在多年平均降水量三元线性拟合公式P=70.19e+1375.67U+100.94H-1003.46和多年平均降水量二元线性拟合公式P=95.46e+99.64H-390.19中(以上两个多元拟合公式的4类指标参数非常优秀),降水量与海拔高程都是正相关并且海拔高程H的回归系数都在100左右,所以,在其它条件相同时,年降水量随着海拔高程的增加而增加,随着海拔高程的减少而减少,即海拔高程与年降水量正相关。因为海拔高程只是年降水量的次要影响因子,所以,“海拔高程与年降水量正相关”只能在其它条件相同时才有明显表现,否则表现不明显。
另一方面,海拔越高,水汽层的厚度越小,地面水汽压越小;海拔越低,水汽层的厚度越大,地面水汽压越大;海拔高程与地面水汽压负相关,指数拟合的相关判定系数R2=0.4242,相关系数R=-0.651,详见上一篇博文的插图。海拔高程与地面水汽压负相关,而地面水汽压是年降水量的主要影响因子,与年降水量高度正相关,所以,随着海拔高程的增加,地面水汽压减少,年降水量减少;随着海拔高程的减少,地面水汽压增加,年降水量增加,即海拔高程与年降水量负相关。按中国194个国际交换站1971~2000年平均值的统计分析,海拔高程与地面水汽压指数拟合的相关系数R=-0.651,地面水汽压与年降水量的相关系数R=0.895,所以,“海拔高程与年降水量负相关”的表现比较明显又不特别明显(要经过2次传递)。
以上两个方面的影响截然相反,海拔高程与年降水量负相关是主要矛盾,所以,在多年平均降水量P与海拔高程H的一元线性拟合公式P=-188.48H+901.79中,平均降水量P与海拔高程H负相关。由Excel分析的以上成果表可知,该公式的4类指标参数中3个指标参数优秀(Significance F、P-value、t Stat),但关键的指标参数相关判定系数R2太小(R2=0.1351),拟合公式不可信(在以上拟合图中,数据点分散,拟合效果很差)。
在本文第2节作者已经阐述年降水量与相对湿度拟合效果较好的原因,即次要影响因子相对湿度U与主要影响因子地面水汽压e正相关,两者之间的相关性较好(两者之间对数拟合和线性拟合的相关系数R分别为84.7%和82.7%)。
在年降水量P与海拔高程H的一元拟合公式中,海拔高程H既代表海拔高程本身承担次要影响因子对年降水量的贡献职责,这方面的表现是其它条件相同时海拔高程与年降水量正相关,因为海拔高程只是次要影响因子,在多数情况下这方面的表现不会特别明显;海拔高程H在一定程度上也代表地面水汽压e承担主要影响因子对年降水量的贡献职责,这方面的表现是海拔高程与年降水量负相关,因为海拔高程H与主要影响因子地面水汽压e的相关性不是很强(指数拟合和线性拟合的相关系数R分别为-0.651和-0.56),所以,“海拔高程与年降水量负相关”的表现比较明显又不特别明显。以上正相关和负相关的表现都不是特别明显,两股力量不能形成合力还要相互内耗,所以,随着海拔高程的增加或者减少,年降水量的增加或者减少都不是特别明显,所以,多年平均降水量P与海拔高程H的一元线性拟合的相关判定系数R2比较小(R2=0.1351),拟合公式不可信,数据点分散,拟合效果很差。
综上分析可知,虽然相对湿度只是年降水量的次要影响因子,但相对湿度与主要影响因子地面水汽压正相关并且相关性较好(对数拟合和线性拟合的相关系数R分别为84.7%和82.7%),所以,年降水量与相对湿度一元拟合的效果比较好;海拔高程也是年降水量的次要影响因子,海拔高程与主要影响因子地面水汽压的相关性一般并且是负相关(由前一篇博文可知,指数拟合和线性拟合的相关系数R分别为-0.651和-0.56),公式内部的两股力量不能形成合力还要相互内耗,所以,多年平均降水量与海拔高程一元拟合的效果比较差(数据点分散,拟合公式不可信)。
4 本文研究得到的启示
因变量与自变量一元拟合的相关性较好,不等于该自变量就是因变量的主要影响因子,例如,中国各地多年平均降水量与平均相对湿度一元拟合的相关性较好,平均相对湿度只是年平均降水量的次要影响因子;因变量与自变量一元拟合的相关性不好,只能证明该自变量不是因变量的主要影响因子,不能证明该自变量不是因变量的次要影响因子,该自变量仍有可能是因变量的次要影响因子,例如,海拔高程是年平均降水量的次要影响因子,但中国各地多年平均降水量与海拔高程一元拟合的相关性不好。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 00:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社