|
平均数与中位数都是基础统计概念。
平均数(均值):是一组数据的算术平均值,计算方式为「所有数据之和 ÷ 数据总个数」,属于对全部数据信息的加权整合,每个数据的变化都会直接影响最终结果。
中位数:是将一组数据按从大到小或从小到大排序后,处于最中间位置的数值(若数据个数为偶数,则取中间两个数的平均值),仅和数据的排序位置有关,不受极端值(极大/极小值)的直接影响。
当数据呈对称分布(如正态分布)时,平均数和中位数的数值几乎一致,二者都能准确反映数据的集中趋势。
当数据呈偏态分布(存在极端值)时,二者会出现明显偏差。比如统计某行业薪资,若少数高管薪资极高,平均数会被拉高,远高于大部分普通员工的薪资水平,此时平均数失真,无法代表多数人的真实收入。而中位数仅取中间位置的值,不受极端高薪资的影响,更能反映普通从业者的收入情况。
简单说:平均数在乎总量,中位数在乎位置。
假设一个小团队有5个人,年薪分别是:`4万, 5万, 6万, 7万, 100万。
平均数:(4+5+6+7+100) ÷ 5 = 24.4万
中位数:排序后正中间是第三个人 → 6万
如果你被问这家公司员工待遇如何,哪个数字更靠谱?
24.4万(平均数):老板的百万年薪把平均值拉高到了天际,让前4位员工被平均了。这个数字严重失真,无法代表大多数员工的真实收入。
6万(中位数):它告诉我们,至少有一半的员工收入在6万以上,另一半在6万以下。这个数字更能反映普通员工的典型收入水平。
当你的数据中存在少数离谱的极大值或极小值时,中位数通常比平均数更能反映大多数的情况。 比如:国民收入,房价,明星片酬。
当数据分布比较均匀,没有特别离谱的极端值时,平均数能很好地利用所有信息。 比如:平均成绩,平均气温。
可以把平均数想象成一个社交达人,它热情地和数据集里的每一个数字交朋友,所以有个别富豪或穷光蛋朋友就会大大影响它的身价。
而中位数则像一个冷静的中间派,它只相信排序后的秩序。无论队伍两头来了什么大神,它只信任站在最中间的那个家伙,所以显得特别可靠。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-9 10:59
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社