天空中的一个模式分享 http://blog.sciencenet.cn/u/jiangxun 本博将以数学杂文为主,科技杂文为辅,其它杂文为补。

博文

从一个与统计有关的笑话说起:地理系毕业生的起薪最高 精选

已有 25444 次阅读 2015-10-14 07:14 |个人分类:谈数学|系统分类:科普集锦| 数学, 统计, 乔丹

作者:蒋迅

讲一个笑话:据说,美国北卡大学(University of North Carolina)地理系做了一次统计,看其毕业生的收入如何。他们发现地理系毕业生的平均起薪比同校其它系和其它学校地理系的毕业生的起薪都高。於是得出结论:要想起薪高,就得上北卡大学,上地理系。

其实事实是:迈克尔·乔丹(Michael Jordan)正好上的是北卡大学的地理系。他的“专业”是文化地理学,属人文地理的一个分支。所以,这个统计数据由於原始数据不准确而得出了错误的结论。我们都知道,一般在处理统计数据时,会把最高值和最低值去掉。体操比赛中去掉一个最高分,去掉一个最低分就是这个道理。

这里我们不妨引伸一点。比如说,强国论坛做一次社会调查,看看中国人民是不是觉得自己幸福。它得到的结论能够代表全中国人民吗?不太可能,因为许多社会群落的人不会到那里去投票。同样的道理,有人搞了一个下辈子是否还愿意做中国人的调查,其结果也不可靠。我不是说他们不可以做类似的调查,也不是说他们的结果不说明任何意义,但是怀疑他们的结果是不是一个科学的结果。

社会调查是一门学问。取样有学问,设计题目也有学问。按照预想的结果来设计除了宣传外没有别的意义。

现在一个很时髦的单词是“大数据”,大数据确实给我们带来很多好处。但是,随之而来的是滥用大数据。数据太多,总可以找到一些巧合,有些人就用这些巧合大做文章。一篇讽刺这种滥用的文章说,全球温度增加与海盗数递减相关系数达99%。要阻止全球变暖,最有效的办法是大家都去当海盗。

还有一个统计笑话,说一位统计学家过河时淹死了。这条河的平均深度是3英尺。

下面4张图,有相同的均值,相同的中值,和相同的方差。结论:一定要可视化。

这四张图叫作“安斯库姆四重奏”(Anscombe's quartet),是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个 (x, y) 点。这四组数据由统计学家安斯库姆(Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及离群值对统计的影响之大。

乔丹说,在他的职业篮球生涯里,他有九千多次投球不中,打输过三百多场球。曾经有26次,他被任命去投最后一秒钟的关键的球,但是他没能投中。他曾经失败过很多次。“这就是我为什么成功了。”把这句话送给我的读者吧。

有时候,乔丹会输得很瓷实。如此山寨不算侵权?乔丹败诉 无奈称尊重中国司法




https://blog.sciencenet.cn/blog-420554-927975.html

上一篇:蒋式瑆诗作一首
下一篇:这根冰棍够数学的
收藏 IP: 23.118.54.*| 热度|

73 刘洋 尤明庆 吕洪波 姬扬 李学宽 杨远源 王春艳 康建 史红全 张科兴 秦伟 应行仁 梁进 武夷山 黄永义 谢平 高建国 刘光银 田青 徐令予 高义 文克玲 田娟 冯兆东 黄仁勇 杨正瓴 赵美娣 李建国 黄荣彬 薛冰 杨奕 孟佳 朱平 周春雷 李世春 曾宇怀 陈楷翰 石磊 沈乐君 张江敏 胡小宁 李毅伟 徐耀阳 黄兴兴 路卫华 水迎波 余新亚 钱磊 李亚平 胡飞龙 陈筝 毕重增 张越 刘忠波 戴小华 曾新林 白图格吉扎布 徐传胜 张云 檀成龙 强涛 段含明 redastro biofans shenlu jiareng qzw chenhuansheng aliala yzqts copier cloudyou zoujinkexue11

该博文允许注册用户评论 请点击登录 评论 (31 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 13:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部