姬扬的个人博客分享 http://blog.sciencenet.cn/u/jiyang1971

博文

点击数公式之观测验证

已有 4166 次阅读 2016-3-28 20:46 |个人分类:察见渊鱼者不祥|系统分类:科普集锦

实践是检验真理的唯一标准

 

首先,祝贺黄安年老师的博客访问量突破了三千万

 

大约一年半以前,黄老师的博客访问量突破了两千万。当时我用了个简单的模型,给出了科学网博客点击数之经验公式。现在正好可以检验一下。

 

当时我预计到,再过660天,黄老师将达到三千万的点击数,因为点击总数与上网总天数(或者博文总数)“大约是个平方关系”。现在只用了554天,误差为16%。应该不算太糟糕

简单地检验一下数据,可以发现,黄老师在两千万到三千万期间,平均每天发表博文大约是4.76篇(2650/554),而其全时期的平均每天发文数为4.81篇(15900/3309),并没有显著的差别。这是估计值与实际天数差别不是太大的主要原因。

需要指出,黄老师的点击历史只能说明平方关系是成立的,但是其系数并不符合我以前给出的经验公式。当时我就知道这一点——这是因为黄老师博文写得太多了。

 

最近我注意到,杨正瓴老师的博客可以检验这个经验公式。杨老师和黄老师一样,非常仔细地记录了自己的博客点击数的变化情况。我现在没有时间来验证平方关系了,只验证另一方面吧。

杨老师总共发表了1099篇博文,他的第一篇博文是2008121,距今共2674天。由经验公式可以得到,其总点击数应该是344万,而他的实际点击数是257万。相对误差是25%——也还可以吧。

 

这两个例子大致能够说明,我们关于点击数的模型还是比较正确的——“任何一篇普通博文,过了起初的两三天以后,每天给你带来大约2个点击。你的博文每被点3-5次,博客就会额外多点一次,也就是说,20%的人对下蛋的母鸡感兴趣。”

这个模型比较合理的本质原因,自然就是我们揭示过的博文点击数的奥秘

 


附录:
普通博文的点击数公式,更精确点的形式是这样的
$\alpha  \sum _i p_i$
其中,对所有的博文求和,$i$是博文的序数,$p_i$是第$i$篇博文发表至今的天数
$\alpha$ 是个参数,依赖于每个具体的博主,
博文发的多了,$\alpha$ 就小一些
博文被精选的多了,$\alpha$ 就大一些
为了简单起见,我以前随便猜了个数值,即$\alpha \approx 2$
如果你写博文一直很有规律,像黄老师那样,

那么上述公式就可以简化为 $\alpha \times $博客总天数 $\times $ 博文总篇数 $ /2$

 

有些人似乎看不懂这个模型的含义,其实它很简单,也很无聊:
长期来看,任何博文都是一样的,平均每篇每天被点击的次数是一致的(略为依赖于博文作者),大致是2次每篇每天,误差大约是$\pm$3dB,也就是在1-4次之间。
精选和热门推荐的作用仅在博文刚发表的那几天起作用。

 

 

 

学网博客点击数之经验公式

http://blog.sciencenet.cn/blog-1319915-829993.html 

 

博文点击数的奥秘

http://blog.sciencenet.cn/blog-1319915-866307.html 

 

黄安年:80岁博主累计访问量突破三千万的感受

http://blog.sciencenet.cn/blog-415-965437.html 

 

 

杨正瓴:科学网博客“博客总排行”第77名

http://blog.sciencenet.cn/blog-107667-959979.html 

 

在线日期计算器 时间,日期,天数计算器
http://www.beijing-time.org/riqi.htm

 



博客感言
https://blog.sciencenet.cn/blog-1319915-965608.html

上一篇:谈谈民科的基本素质
下一篇:最近的几本书
收藏 IP: 124.193.162.*| 热度|

8 武夷山 李颖业 徐晓 徐令予 赵美娣 赵建民 张学文 ep4h

该博文允许注册用户评论 请点击登录 评论 (22 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-21 08:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部