||
李老师说:“把原始文献给您的目的,在于澄清Lorenz原始定义的横轴和纵轴都是累积百分比,这跟您先前的说法不同。”
答:是的,我也是在别的参考文献上看到:Lorenz是用标准定义的个人收入的。在那篇文献中,刚开始,也是这样。英国税收数据,也是按岁入分组,统计每组人数的。从1877年到1886年最低收入(150-500磅)人数从28.6万增加到34.7万;中间组(500-1000磅)人数基本不变(3.2万);高收入组(1000-5000磅)人数略有下降。这个结果,是严格按累计分布定义的。看起来不漂亮(穷人组太多,但只占收入横轴很短一点长度)。所以Lorenz采用了德国人Wolf的分组方式,即横轴也按累积百分比分组,这样就可以把穷人组拉宽一些,一些穷人能挤入中产,而少量中产能挤入高产。而国民总收入增加每组多少都能受益。Lorenz就采用了Wolf定义作了曲线图。但并未从数学上给出任何证明:新的定义与数学定义等效。也没有关于右下方的教条。所以,我们可以更有把握地讲,目前应用中所谓Lorenz曲线并不是严格定义的pdf的累积曲线。但要更有说服力,还得作一些工作。
“由于横轴的累积收入百分比是从低收入向高收入逐级累积的,所以那条Lorenz曲线必然是单调递增而且任何一点的切线斜率是递增的。因为这个由穷向富累积的特性,您说的双峰在Lorenz曲线上被平滑掉了,”
答:所谓“横轴的累积收入百分比是从低收入向高收入逐级累积”的是最有欺骗性的一点。个人收入也是从低到高排列。但是,从低收入向高收入逐级累积(乘上收入,再分组,就可能扩大多人密集形的基底宽度。单峰没有问题的,超“最高收入”的人数并入最高收入那一组。大家一般都接受。
“因为所谓“峰“代表高收入的话,这部分人都被集中放到后面了。。。”
答:不对,“峰“可以代表任何收入。比如照片的剪影、夜景,就是典型的黑白双峰。通常遥感图像的分类,基本上不能不考虑双峰甚至多峰。而计算机自动分类,就严重需要分布函数的数学表达。
“双峰或者多峰,已经因为排序的原因而消失了。”排序
答:排序是基本要求,双峰或者多峰的消失,只能靠玩分组来削峰填谷。
“我对数字图像处理完全外行。不过,我理解您的双峰问题,是个寻找合适的概率分布函数的问题,这时候横轴是收入水平,纵轴是频率。现在拉上Lorenz曲线,可能偏离了方向,因为概率分布函数和lorenz曲线的两轴定义并不相同。”
答:数学是一样的。
“要说联系的话,理论上说,已知 Lorenz曲线,应该可以还原出原始的概率分布。不知我猜得对不对?”
答:严格讲,分组后不可能。但如果能保留分组时组内分布参数,马马虎虎也能搞出个大概。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 03:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社