考槃在涧-心外有物趣男分享 http://blog.sciencenet.cn/u/考槃在涧 坐在垃圾堆上仰望星空

博文

概率的鬼影

已有 4306 次阅读 2008-1-21 13:12 |个人分类:天问

概率这个问题,不但普通人似是而非,连很多专业工作者也似是而非。半年前一位朋友就《三联生活周刊》知名科技记者“土摩托”博客里的几篇文章问过我,这几篇文章讨论的就是概率问题。

土摩托仔文章中说,“我觉得,这个问题和你问谁有关。假如你问父母,他们告诉你说,他们的两个孩子至少一个是男孩,那么,另一个是女孩的概率是2/3,我的答案没错。但是,假如你问一个男孩,他告诉你说,他是他们家两个孩子中的一个,那么,另一个是女孩的概率就是1/2了,我的答案就错啦。”

土摩托还翻译了这个问题,“一家有两孩子,一个是男孩,另外一个孩子是女孩的几率是多大?可能直觉告诉我们另外一个孩子是女孩的几率应该是1/2, 或50%, 但是数学家反驳道正确的几率可能是2/3, 或67%(假设生男孩或女孩的概率相等),为什么呢?使用对这个问题的一个命题分析,我们随意选择一个有两个小孩的家庭。一旦选定了家庭,我们判定至少一个孩子是男孩。(例如,从所有有两个孩子的母亲当中,我们选一个问她是否至少有一个儿子。)在这个情况下,对问题明确的陈述可能是:从这种有两个孩子的所有家庭里的设定中,有一家被随意选定,且发现有一个男孩。另外一个孩子是女孩的几率是多大?让我们来看看两个孩子可能的组合。我们用B代替男孩,G代替女孩,每一次组合我们先列出大的一个。有四种可能的组合:BB BG GB GG。BG 与 GB分别列出,因为BG表示家中大的一个孩子是个男孩,而GB代表家中大的一个孩子是女孩。上述的组合都是同等可能的。既然我们得知一个男孩(不知道具体是哪一个)是男孩,我们排除GG的组合。这样,我们剩下的可能组合是:BB BG GB。现在我们想要数“另外一个”小孩是女孩的组合的个数。有两个组合:BG 和GB,由于可能的家庭共有三个组合数,在其中两个组合里有一个是女孩,该概率为2/3。”

关于土摩托的这几篇文章,请看链接:刚吵了一场高质量的架(http://www.sohoxiaobao.com/chinese/bbs/blog_view.php?id=669905),感谢读者棒棒儿(http://www.sohoxiaobao.com/chinese/bbs/blog_view.php?id=670071

朋友问我之后,我写了篇文章作答,分析不一定对,要请大家批评。以下是我的回复:

第二个孩子是男是女的概率究竟是多少?这个问题看似很简单,要说清楚其实很复杂。首先要明白几个概念。

独立事件:指在概率运算中,和其他事件的发生并无关联的事件;

相关事件:指在概率运算中,和其他事件存在相关关系的事件;

系统:指存在一定的关系的事物的总和(粗略的定义);

预期:指事件发生前对事件“预先”的期望;

参照系:指在考察一个事件的概率是,把它放到那个系统中去思考,等于是使用什么参照系来考察。

 

我们先从较简单的扔硬币来说这个事情。我在高考的时候就选择哪个学校很头疼。于是决定扔硬币。我决定,扔到背选北大,扔到花选北师大。第一次我扔到背。于是我说,扔一次随机性太大了,扔三次比较有把握。我再扔了两次,都是背。于是我又说,扔三次还是太武断,扔十次。我连续扔了九次背。我第十次会扔出什么玩艺呢?如果我们要计算第十次扔出背的概率,那么就不能只考虑一只硬币只有背和花,于是扔到二者的概率都是1/2;而是必须要把十次事件看成一个“相关事件”,最后一次的概率必须把前面的结果也考虑进去。在这个例子中,第十次仍然扔出背的概率是1/2的的十次方,也就是1/1024,扔出花的概率将是1023/1024。但是要注意,这里第十次扔出背的概率是1/1024是有前提的,前提是前面九次扔出的都是背,而最后一次的概率计算把前面的也考虑进去了。因此,这里第十次的概率计算是要有严密的数学表述的:连续十次扔出背的概率是多大?这就是一个相关事件的概率计算。假如你连续扔了一亿次背,那么第一亿零一次扔出花的可能性极大。我们打牌的时候经常说,连拿了十把烂牌,这把总该拿一次好牌了吧。这个常识在统计上讲是站得住脚的。但是,我们经常发现,有时候打牌一晚上总是拿好牌,有时候总是拿坏牌,这又是怎么回事呢?这就是预期在作怪。好牌坏牌,是根据打牌的规则定义的,它体现了人的预期。在一个牌局中,参与者有3-6人不等,于是,这个时候好牌出现的概率,是要选用整个系统作为参照系。我们假定一场牌局中会出现好牌,烂牌,所每种牌出现的概率都是1/2,当一个人拿到好牌,同时必然有另一个人拿到了烂牌。只是,“概率”可不管谁想拿到好牌,谁想拿到烂牌,从整个牌局来说,好牌烂牌出现的概率都是1/2。如果要计算每个人拿到好牌的概率,计算方法就比较复杂了,如果要计算每个人连续拿到烂牌或者好牌的概率,情况将更为复杂。事实上,如果一个人一晚上打了二十局双抠,连续拿了二十把烂牌的概率其实很小,但是我们发现这样的事例经常出现,为什么呢?原因在于,这个世界上每天都有人打双抠,一天晚上二十局,在所有对局中是一个极小的数量,当数量达到一定程度的时候,任何事情都有可能发生,这就是所谓的大数定理。我们经常发现,在买彩票的时候,总有那么一些人,对足球一窍不通,仅仅机选了5注,就中了500万,但我们自己买的时候,怎么买都买不到。原因在于,就单个人来说,机选5注的概率是百万分之一,但是,如果有一千万个人买彩票,几乎一定会出现大奖(如果有的话),因为就整个系统来讲,购买彩票的数量已经达到了临界值,这个时候随机事件变成了必然事件,只是,这个奖落到谁的头上还是一个随机事件,单个人中奖的可能性都是百万分之一。我们说中奖的这个人运气好,并不是胡说。这是一个社会性尺度的问题。如果只关注个体,很容易落入社会性尺度误区,所以我们在看待社会问题的时候,要看到一个群体而不是个体。

因此,就扔硬币事件来说,单次扔硬币的概率(独立事件),永远是1/2,因为硬币只有两面,但是考虑一个连续时空内(这个地方比较复杂了,比如,你每年扔一次硬币,扔100年,那么第一年和第一百年的情况能够放在一起考虑吗?)的扔硬币事件时(相关事件),概率计算就发生了改变。出现这个情况的原因是,事件所处的系统,也即参照系不同了。

再回到男女问题。

生男生女其实有两个意义,一个是遗传学意义,一个是社会学意义。遗传学的意义是指,因为遗传的特性决定,生下来的孩子不是男孩就是女孩。我们不去考虑中性人和两性人,因为我们知道,那是遗传学上的缺陷和变异,不在我们的讨论之中那本身也是一个极小的概率的事件。所以,遗传学意义上的生男生女,概率都是1/2。所以如果我们考察“一个”怀孕的母亲即将生的孩子是男孩还是女孩时,概率永远都是1/2,不管她之前已经生了一个加强连的男孩,她下一个是男孩的概率仍然是1/2;而社会学意义是指,不管单个母亲生男生女,整个人类社会的性比比例,自然状况下都是11,也就是一半团脐一半尖脐。聪明的读者会发现,性别的社会学意义其实是由遗传学意义决定的。为什么要把这两个概念分开呢?因为当你选择一个子系统的时候,情况会发生改变。我父母所在的学校,20个教师子女连我在类一共3个男孩,其它十几个全是女孩。这绝对是一个小概率事件,也绝对不符合遗传学,但是它确实发生了,发生的原因仍然在于,相对于整个社会,相对于人类历史来讲,20个孩子是一个极小的群体。举个例子,一个母亲已经生了10女孩,名字分别是大弟,亚弟,招弟,望弟,盼弟,念弟,迎弟,思弟,小弟,小弟弟,那么,第十一个总该是男孩了吧!其实,概率仍然是1/2。为什么呢?如果你把生孩子看成一个连续的相关事件,你就不能只计算自己的孩子的性别,因为人类社会是一个共变的大系统,要么,你只考量个体,要么,你必须把参照系放在整个人类的大背景下面。所以你必须把所有人的性别都计算在内,这种情况下,你先前生的10个弟跟100亿的数量级比起来,简直微不足道,因为100亿人中,肯定已经有50亿男,50亿女,如果100亿人都是女的,那么下一个是男孩的概率将极其大,大到肯定会是男的,但我们知道,这是不可能的,是一个伪命题。所以,最后的结论是,当一个母亲怀孕时,不管她前面生了多少个女孩,她这个孩子是女孩的概率仍然是1/2。这里其实有一个隐含的结论,那就是,生男生女不只由自己决定!它体现的是一个物种的自组织和自协调,也就是说,在某一个给定的时间段内,如果其它母亲生的都是女孩居多,那么你生男孩的可能性就极大。因为整个物种要维持性别的平衡。但是,单个母亲的预期是无法改变这一事实,也就是说,你想要男孩,除了自己多喝点酸梅汤外,还要看别的母亲生的是什么。这有点不符合常识,这里没有篇幅详细解决,有疑问的朋友可以去看系统论、协同学和极限定理。还需要提出的是,性别并不是受精那一刹那决定的,但是,性别一当形成,就无可更改。所以,当一个母亲怀孕到达一定的时间后,讨论她下一个孩子性别的概率,根本失去意义她的孩子的性别已经是一个必然事件或者说唯一事件,而不再是一个随机事件了。心理学上叫全或无。

土摩托的这个例子,是有问题的。他说,如果一个母亲有2个孩子,已经知道一个是男孩,那么另一个是女孩的概率是2/3,原因是 BBBGGBGG,去掉GG(两个都是女孩,因为已经肯定有一个男孩了),一共3种可能,是女孩的可能出现了2次,所以是2/3。这样的分析方法有问题,因为加入了排列在其中,使得概率的计算被混淆了。举一个在数学上具有同等意义的例子:假定有一个无限大的袋子(人类社会),里面装着无限多的两种颜色的球(人类社会无限多的男性和无限多的女性),现在有个人(母亲)从其中取出了两个球,已知一个球是红色的(已知一个是男孩),那么另一个是绿球的概率是多少呢(女孩)?你绝对不会去考虑红-绿,绿-红,红-红,绿-绿这种情况的,因为红-绿,绿-红二者的意义是完全一样的。土摩托的这个例子引入了兄弟或者说排行的概念,使得这个命题成为一个混合命题,也就最终成为了一个伪命题。所以,这个例子的概率仍然应该是1/2,因为排行是人类社会的等级符号,不具备数学意义和社会学意义,兄-妹和姐-弟,没有概率上的意义,即便是有,放在社会性大尺度下去思考,也是微乎其微的,通过复杂计算最终将得到一个近似于1/2的概率。也就是说,当“母系统”倾向于无限时,子系统的概率最终取决于母系统的状态。

解释到这里,情况应该比较明白了,如果有疑问的地方,可以抛开那些跟量子力学和系统论有关的术语不看。

重申一下基本结论:每一个母亲单次生男生女的概率都是1/2,不管她此前生育孩子的状况;母亲生男孩的概率还要受到其它母亲的影响,这个时候是一种“共变的”、“协同的”关系

(去掉了后面批评“土摩托”的部分)



https://blog.sciencenet.cn/blog-2638-14778.html

上一篇:静夜狂思(2)
下一篇:二奶靠脸,英雄靠磨
收藏 IP: .*| 热度|

0

发表评论 评论 (9 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-6 19:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部