lix分享 http://blog.sciencenet.cn/u/lix

博文

老邪补考:答李宁老师

已有 3482 次阅读 2013-7-9 10:36 |个人分类:课件科普|系统分类:科研笔记

李老师说:“把原始文献给您的目的,在于澄清Lorenz原始定义的横轴和纵轴都是累积百分比,这跟您先前的说法不同。”

 

答:是的,我也是在别的参考文献上看到:Lorenz是用标准定义的个人收入的。在那篇文献中,刚开始,也是这样。英国税收数据,也是按岁入分组,统计每组人数的。从1877年到1886年最低收入(150-500磅)人数从28.6万增加到34.7;中间组(5001000磅)人数基本不变(3.2万);高收入组(1000-5000磅)人数略有下降。这个结果,是严格按累计分布定义的。看起来不漂亮(穷人组太多,但只占收入横轴很短一点长度)。所以Lorenz采用了德国人Wolf的分组方式,即横轴也按累积百分比分组,这样就可以把穷人组拉宽一些,一些穷人能挤入中产,而少量中产能挤入高产。而国民总收入增加每组多少都能受益。Lorenz就采用了Wolf定义作了曲线图。但并未从数学上给出任何证明:新的定义与数学定义等效。也没有关于右下方的教条。所以,我们可以更有把握地讲,目前应用中所谓Lorenz曲线并不是严格定义的pdf的累积曲线。但要更有说服力,还得作一些工作。

 

“由于横轴的累积收入百分比是从低收入向高收入逐级累积的,所以那条Lorenz曲线必然是单调递增而且任何一点的切线斜率是递增的。因为这个由穷向富累积的特性,您说的双峰在Lorenz曲线上被平滑掉了,”

 

答:所谓“横轴的累积收入百分比是从低收入向高收入逐级累积”的是最有欺骗性的一点。个人收入也是从低到高排列。但是,从低收入向高收入逐级累积(乘上收入,再分组,就可能扩大多人密集形的基底宽度。单峰没有问题的,超“最高收入”的人数并入最高收入那一组。大家一般都接受。

   

“因为所谓代表高收入的话,这部分人都被集中放到后面了。。。”

 

答:不对,可以代表任何收入。比如照片的剪影、夜景,就是典型的黑白双峰。通常遥感图像的分类,基本上不能不考虑双峰甚至多峰。而计算机自动分类,就严重需要分布函数的数学表达。

 

“双峰或者多峰,已经因为排序的原因而消失了。”排序

 

答:排序是基本要求,双峰或者多峰的消失,只能靠玩分组来削峰填谷。

 

“我对数字图像处理完全外行。不过,我理解您的双峰问题,是个寻找合适的概率分布函数的问题,这时候横轴是收入水平,纵轴是频率。现在拉上Lorenz曲线,可能偏离了方向,因为概率分布函数和lorenz曲线的两轴定义并不相同。”

 

答:数学是一样的。

 

“要说联系的话,理论上说,已知 Lorenz曲线,应该可以还原出原始的概率分布。不知我猜得对不对?”

 

答:严格讲,分组后不可能。但如果能保留分组时组内分布参数,马马虎虎也能搞出个大概。

 

 



https://blog.sciencenet.cn/blog-2984-706570.html

上一篇:初评小邪作业,也交自己作业
下一篇:再答李宁老师、黄小邪
收藏 IP: 123.119.250.*| 热度|

5 赵美娣 李宁 陈楷翰 xqhuang qqlisten

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 03:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部