||
百名博主朋友数量的一个统计分析
张学文,2014/5/24
Ø 科学网已经存在了8年,作为一个网站,具有一定的代表性.这里提供一个关于它的统计分析,它是关于博主的朋友的数量的。
Ø 资料:依据科学网总浏览量前100名的博客主人的有关数据,我统计每位博主的朋友数量(2014年5月21日-24日的)。
Ø 最多与最少的朋友数量:值得一提的是这前100名的博主中,朋友数量最多的博主是饶毅,他有4216位朋友。另外有3位博主的朋友数量是0。给我印象深刻的一件事是某博主在有人要求做其朋友,没有被批准,他说科学网的所以浏览者我都认为是我的朋友,所以,我就不必要列出朋友名单了。
Ø 介于朋友数量介于0到4219的前100名博主的名单我不一一列出了。下面是对这个资料的一些统计
朋友数量 | 博主人数 |
0-300 | 22 |
300-600 | 23 |
600-900 | 16 |
900-1200 | 14 |
1200-1500 | 10 |
1500-1800 | 5 |
1800-2100 | 4 |
2100-2400 | 3 |
2400-2700 | 1 |
2700以上 | 2 |
Ø
Ø 如何分析这个图?一个思路是分析其概率分布.从其外形看,它类似所谓Gamma分布。我目前没有更深入的分析。
Ø 我还根据原始数据分析了等累积百分比所对应的博客人数,获得了下面的表:
等权点位置 | 等权上界点 |
10 | 112 |
20 | 251 |
30 | 390 |
40 | 555 |
50 | 652 |
60 | 877 |
70 | 1069 |
80 | 1246 |
90 | 1771 |
100 | 4216 |
Ø 这个表说明(例如):100%的博主的朋友数量不大于4216, 50%的博主的朋友数量不大于652,,1 0%的博主的朋友数量不多于112。下面是对应的图
Ø
Ø 这个图大致对应过去统计学中的概率累积图。不过这里是等概率间隔的。如何从这里获得新知识?我现在还在考虑中…它能提示一种新的分析思路?不好说。
附言:100人的姓名与名次表,见:http://blog.sciencenet.cn/blog-2024-798975.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 00:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社