DFLISWX的个人博客分享 http://blog.sciencenet.cn/u/DFLISWX

博文

平均数与中位数

已有 47 次阅读 2026-6-9 05:37 |系统分类:观点评述

平均数与中位数都是基础统计概念。

平均数(均值):是一组数据的算术平均值,计算方式为「所有数据之和 ÷ 数据总个数」,属于对全部数据信息的加权整合,每个数据的变化都会直接影响最终结果。

中位数:是将一组数据按从大到小或从小到大排序后,处于最中间位置的数值(若数据个数为偶数,则取中间两个数的平均值),仅和数据的排序位置有关,不受极端值(极大/极小值)的直接影响。

当数据呈对称分布(如正态分布)时,平均数和中位数的数值几乎一致,二者都能准确反映数据的集中趋势。

当数据呈偏态分布(存在极端值)时,二者会出现明显偏差。比如统计某行业薪资,若少数高管薪资极高,平均数会被拉高,远高于大部分普通员工的薪资水平,此时平均数失真,无法代表多数人的真实收入。而中位数仅取中间位置的值,不受极端高薪资的影响,更能反映普通从业者的收入情况。

简单说:平均数在乎总量,中位数在乎位置。

假设一个小团队有5个人,年薪分别是:`4, 5, 6, 7, 100万。

平均数:(4+5+6+7+100) ÷ 5 = 24.4

中位数:排序后正中间是第三个人 6

如果你被问这家公司员工待遇如何,哪个数字更靠谱?

24.4万(平均数):老板的百万年薪把平均值拉高到了天际,让前4位员工被平均了。这个数字严重失真,无法代表大多数员工的真实收入。

6万(中位数):它告诉我们,至少有一半的员工收入在6万以上,另一半在6万以下。这个数字更能反映普通员工的典型收入水平。

当你的数据中存在少数离谱的极大值或极小值时,中位数通常比平均数更能反映大多数的情况。 比如:国民收入,房价,明星片酬。

当数据分布比较均匀,没有特别离谱的极端值时,平均数能很好地利用所有信息。 比如:平均成绩,平均气温。     

可以把平均数想象成一个社交达人,它热情地和数据集里的每一个数字交朋友,所以有个别富豪或穷光蛋朋友就会大大影响它的身价。

而中位数则像一个冷静的中间派,它只相信排序后的秩序。无论队伍两头来了什么大神,它只信任站在最中间的那个家伙,所以显得特别可靠。




https://blog.sciencenet.cn/blog-729911-1538216.html

上一篇:从Science撤稿说起
下一篇:谈大学生的语文水平



    
收藏 IP: 119.130.153.*| 热度|

1 檀成龙

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-6-9 10:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部