cauioz的个人博客分享 http://blog.sciencenet.cn/u/cauioz

博文

从科学网博客点击量来看二八定律

已有 3615 次阅读 2017-11-20 22:14 |个人分类:数学之美|系统分类:论文交流

从科学网博客点击量来看二八定律

刘新宇1*

1 沈阳师范大学生命科学学院

*通讯作者E-mail:xyliu@synu.edu.cn

1 研究背景

通俗地讲,二八定律可以指排名前20%的人做了占总量80%的事情。比如说20%的人拥有80%的财富或科研经费;20%的人做出了80%的科研成果或写出了80%的文章;20%的人拥有80%的论文引用量或博客点击量。

二八定律是意大利经济学家帕累托发现的,也叫不平衡原则,能够帮助我们理解公平的非绝对性。

本研究目的是为了检验科学网博客点击量是否符合二八定律,具有重要的理论和实践意义。

2 研究方法

20171120日,对科学网博客排行进行了统计分析。科学网博客排行分为单周博客排行、博客总排行和博文平均点击量排行三个部分,每个部分按点击量多少列出了前100名。对这三个榜单的前20名、后80名和总100名的点击量进行了加和,并分别计算出前20名、和后80名的点击量占榜单100名总点击量的百分比。

3 实验结果

单周博客排行。前100名总点击量392,042次,其中前20名总点击量204,803次,占总量的52.24%,后80名总点击量187,239次,占总量的47.76%

博客总排行。前100名总点击量646,987,904次,其中前20名总点击量294,519,344次,占总量的45.52%,后80名总点击量352,468,560次,占总量的54.48%

博文平均点击量排行。前100名总点击量445,103次,其中前20名总点击量157,339次,占总量的35.35%,后80名总点击量287,764次,占总量的64.65%

4 讨论分析

二八定律并非要求数值上绝对符合20%80%,而是强调少数人做了多数事。从上述实验结果可看出,排行榜单上人群的点击量并非完全平均分布,以单周博客排行为例,前20名的点击量占了总点击量的一半以上,平均点击量是后80名的4倍多。

三组实验数据均说明,科学网博客排行前20%的点击量,均没有达到总量的80%,统计时间较长的博客总排行和博文平均点击量排行,前20%点击量之和甚至都没有达到总量的50%。作者分析原因可能有以下几点:

1)本次统计数据来源于科学网排名靠前的群体,能够进入榜单的博主都十分优秀,相互之间的差距可能没有二八定律描述的那么大。

2)科学网管理者可能会采取一定措施,平均各个博主的曝光度,从而有效降低点击量的贫富差距。

3)作者智商较低,不懂统计,抽取样本存在严重偏差,无法代表总体,实验设计存在严重缺陷。

5 参考文献

http://blog.sciencenet.cn/blog.php?mod=list


6 补充内容

张学文老师的问题:具有中国特色的社会主义的社会财富在人群中的分布,是什么分布?与资本主义相同?都服从这里介绍的分布?我们精准扶贫可以改变这个分布?

答:以美国和中国社会财富为例,可以做个比较。

网上查到的数据:“《财富》杂志2017年公布,美国500强公司加在一起的总收入为12万亿美元,相当于美国国内生产总值(GDP)的2/3。美国500强公司在全球共有雇员2820万人,美国总人口数约3.2亿。”根据这些数据,是否可以推论说:美国500强企业中员工数占全国人口不到10%,贡献了美国GDP的近70%

“2016中国企业500强的营业收入总额达到了59.46万亿元, 500强营收总额相当于2015年中国国内生产总值(GDP)67.67万亿元的87.87%,比值连续两年下降。”我没有查到中国500强企业的员工数,但是大部分500强企业员工数不超过20万,所以中国500强企业的员工数应该在1亿以下。是否可以根据这些数据来推测说:中国500强企业员工数占全国人口不到10%,贡献了本国GDP的近90%

如果上面推论成立,可见中国和美国的财富分布都比较接近二八定律的分布,但是与美国相比,中国的财富分布的贫富差距更大,说成是一九定律更为合适?

报道中提到中国500强财富占GDP的比值连续两年下降,是因为500强企业经营出现问题,还是精准扶贫让这些企业收入降低?我不知道,请各位老师帮忙分析一下。


喻海良老师认为前100名的统计结果,可能与整体的结果不一样。统计科学网所有作者,可能不太现实。我做了一个投机取巧的统计,或许能从一定程度上说明这个问题。

科学网还有博文周排行,记录了最近一周的所有博文的点击量和评论数,我把一周所有博文进行了一下统计,看其点击量和评论数是否符合二八定律。2017年11月21日的博文周排行中,共有博文837篇,总点击量为473,572次,总评论数724次。点击量前167篇(前20%)博文的点击量为336,657次,占总点击量的71.09%。评论数前167篇(前20%)博文的评论数为664次,占总评论数的91.71%

从选取的一个小整体(一周所有博文)进行统计分析的结果更接近二八定律,有意思的是,这和上面描述的优秀群体(前100名)的统计结果非常不同。相比于点击量,评论数这一指标更能反映读者的主动性,这一指标的贫富差距也更大。





https://blog.sciencenet.cn/blog-1359077-1086099.html

上一篇:责备别人其实是在不满自己
下一篇:合师生之私,成大学之公
收藏 IP: 59.46.70.*| 热度|

2 徐耀 王德华

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 05:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部