|||
在两条曲线谁顺眼问题的背后
张学文,2015/11/26
昨天我根据两组有800多个数据而求得了两个统计曲线,随后我发一博客http://blog.sciencenet.cn/home.php?mod=space&uid=2024&do=blog&id=938503 征集大家对它们之中谁更美观,合理,科学的看法…感谢几位朋友在博客评论中发表了自己的见解。
我问的问题是否应当有答案?什么样的答案比较合理,科学,有依据?
对此我现在不好随便说,但是
但是现在我需要告诉大家:其实这两组数据来自一个数据源(的不同数学处理)!
让我举个例子:
如果一个学校有800名学生参加百米短跑测验。于是老师就有800个学生百米短跑成绩的数据800个。对这些数据的统计就可以获得不同百米成绩的学生各有多少的对应曲线(学生个数-百米成绩关系曲线)。对吧,我们把它称为曲线1.
其实我们还可以分析每个学生的跑百米的速度,于是获得800个学生的800个速度的数据。面对这些数据,也可以分析不同百米速度的同学各有多少以及它对应的(速度-学生人数)曲线。我们把它称为曲线2.
于是针对学生的百米成绩,我们就可以分析两组曲线,一个是不同百米秒数的学生各有多少,另外一个是不同百米速度的学生各有多少。
显然百米的秒数越小,速度就越大,所以以上两个统计分布曲线的含义是不同的,其外观也是不同的。
同时,大家也会觉悟到百米秒数与百米速度成绩是互为倒数的。
于是我们的两个分布曲线(频数分布,对应概率密度分布函数)实际是两个互为倒数的随机变量的概率分布曲线。
这个分析说明我们:仅从数学角度看,我们似乎无权说哪个曲线是漂亮的,而另外一个是别扭的,不科学的。在数学面前它们的地位应当是相同的!
好了,关于两组随机变量互为倒数的数组,关于其概率分布的外貌似乎我们无权说谁好看,谁不好看…
以上就是我企图表达的问题的数学内容。不过,800学生百米成绩是个容易让大家理解问题的例子。不是我的博客中的原始数据的含义。我的原始数据是檀成龙给的71个气象站的12个月的降水量与水汽压力的再计算的比值,以及此比值的倒数。这些比较专业的变量不利于大家理解本问题的核心点,所以我淡化了它,而改用学生百米成绩与速度的相关例子了。
也许下面的话是初步结论:
取值只能大于0的随机变量x的概率密度分布函数与该随机变量值的倒数(1/x)的概率密度分布函数在物理上可能都具有物理意义。它们的概率密度函数是不同的,但是他们的概率密度应当是有关的。这个关系是什么呢—我提出这个疑问,不知道概率论中是否有答案。
至于我关心的降水量与水汽压力的比值问题概率分布函数,以后会继续具体分析,现在就不具体议论了。
补(2015.11.26,21时)
姬扬 这个问题是标准教材里的内容Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-5 13:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社