x0xu0008的个人博客分享 http://blog.sciencenet.cn/u/x0xu0008

博文

从博客点击率想到的 精选

已有 7560 次阅读 2013-3-11 09:00 |个人分类:科研 产业|系统分类:观点评述

    十几天前我逃离新浪,进入科学网博客。我在新浪呆了半年多,文章写了几十篇,博客点击加起来才1000多;到了科学网,刚把一篇文章贴上去,就看点击量象火箭蹿升般嗖嗖的上涨,分明是让博客飞啊!只一天,第一篇博客点击就超过我新浪所有文章半年的点击量。我就想,哥这步走对了,站在巨人的肩膀上,不见得保证成功,但一定能让更多人看到你。

        我很感兴趣的一个问题是:如何预测出一篇博客的点击率?需要说明的是,评论和推荐都算在点击阅读里,不单独考虑。想到这个问题,我就想什么能影响一篇博客的点击率?想到的因素有:

1、          编辑推荐:这个恐怕最能影响点击率了,编辑抬抬手,够你跑到天黑黑的;

2、          谁写的:很显然要是饶毅施一公这样的大科学家,或者喻海良这样的名人,或者黄安年许培扬陈安武夷山这样的知名博主,那本身就是点击率的保证;

3、          博客内容:不解释;

4、          题目:这个很重要,好的题目赚取点击率的一半;您要是给博客起名字比如“x通过调节y从而影响z过程”,那您等着哭吧;

5、          博主有多少注册用户朋友:这个能让你有更广泛的链接,从而被更多人看到;

6、          发表时间:编辑倾向于而且推荐人们也倾向于阅读最新的文章。另外不知道科学网博客有多少人使用,中外分布比例,这样发表的早晚时段也会影响最初发表之后一段时间的点击率。

暂时就想到这么多。但是我想总结出一个简单的关系,可以用来预测最终点击率,而不需要考虑所有这些因素,这才是科学预测的意义所在,就像牛顿第二定律,不管各种力如何作用,都是简单的F=ma

        当我把所有上述因素忽略,只集中在最初点击率和最终点击率,我发现最初半小时到一小时的博客点击量,能很大程度反映出24小时的点击率,而24小时的点击率,基本上就是最终博客点击率。于是我总结出:

博客点击第一定律:一篇博客的24小时点击率大约是半小时后点击率的20倍,24小时后,博客的点击率基本保持稳定。简称20倍定律。

这是一个定律,考虑的是理想情况,所以在应用时,需要考虑一些具体情况:

如果考虑编辑的推荐,那么要从编辑推荐后的半小时,来预测之后的24小时以及最终点击率

如果发表时间在半夜无法被编辑和其他人看到,这个半小时要相对延长到大多数人在线的时间

如果文章经由分享或者推荐到别的博客群,那么在新的博客群里面,依然遵循二十倍定律,但是不同博客必须分别计算

        从我的几篇博客的点击来看,这个预测基本符合实际(如下图)。这个定律的好处在于,你不用考虑太多的因素,只要抓住最初时间的点击率,就能大致预测以后的点击率。这个曲线基本符合逻辑斯蒂曲线。而根据逻辑斯蒂曲线的前一段可以预测最终的走向,则是这个定律揭示的。

        在这里,博客点击选择的是半小时用以预测更长时间比如24小时和更久。但是这个定律还可以推广到更广泛的领域。要做就做大。不妨把所有信息传播概括为:

信息传播定律:一个信息的传播总量可以由最初的时间段传播量来预测,他们之间的关系是:信息传播总量=最初时间段传播量×k

最初时间段由该信息的接受时间决定,最初时间段的选择应该比信息的接收时间超过一个数量级。比如一篇2000字的博客,可能两分钟就读完了,所以最初时间段可能就是20分钟到一个钟头;比如一部电影,一般是1.5小时,最初时间段应该就是1天到两天,以此类推。

• k值在博客点击可能是20,在别的领域会有波动,不过应该也差不多,欢迎大家修正。

        我们来看看用这个信息传播定律能做哪些预测。事实上,这个定律非常强大,可以预测很多东西。我们先从不太popular的科技文章引用说起,然后在说说每个人都关心的东西。

某个领域研究文章总数的预测

        生物类文章一般的周期都要用年来计算,所以最初时间段大约是10年或者20年的样子。我们来看看p53文章在最初时间段的数目。在NCBI中按年份输入关键词p53,在1980年,p53的文章数是0,到1990年,总文章数是591,到了2000年,这个数字增长到20594,如下图。我把最初时间段定到20年,最初时间段的文章数是20594,我把k值定为20,那么我估计,p53的研究文章最终会稳定在20594×30,大约60万的样子,也就是再有十几年,p53的研究将会停滞。

        再看microRNA研究的例子,如下图,2000年还没有microRNA的文章,2010年是1万多一点,现在科技发达,信息便捷,大家对同一个热门领域的追逐更快,所以最初时间段就定为10年,考虑到microRNAp53一个基因涵盖更多内容,所以k值定为100,那么microRNA的研究文章总数就是大约100万篇,还有20几年,microRNA研究也将进入停滞。

        除了上面列举的,还可以解决诱导干细胞可以火多久等等。

下面谈几个在文化娱乐领域的例子。

西游降魔的最终票房

        上文分析过,电影的最初时间段大约是1天或者两天,西游降魔210日首日票房8162万,创华语票房首日记录,到310日,票房达到12亿。我们把k值定位20,那么总票房是8162×20,大约16亿的样子。这和最终票房已经很接近了。泰囧的首日票房3650万,乘以20,七个亿多一点,最终是10亿多,也相当接近。

芙蓉姐姐还能火多久?

        芙蓉姐姐本身不是一个信息。一个信息一经出现,马上变成过时的信息。人不一样,她可以不断制造新闻。但是面孔不会变,所以还是存在最初的关注和最终的影响这样一个简单数学关系。芙蓉姐姐出道已经有78年了吧?根据最初关注度和最终关注之间的关系,芙蓉姐姐现在的关注已经保持稳定,即使她还会炒作,但是人们已经不再感兴趣,所以她会在两三年内淡出人们的视野。

 其它的,比如红翻全球的江南style最终点击率能有多少都可以用这个定律来预测。

        另外,信息社会,人们生活在网络里:太多的搜索引擎;太多的社交网络,比如国外的FacebookLinkedin,国内的人人,校内,QQ,微博;太多的公共媒体和论坛。那么这些载体上信息的传播是不是也遵循这个信息传播定律呢?我想答案是肯定的:最初的关注,影响最终的关注度。还可以用这个定律来估计谣言或者传言的影响力。

        在谈几个社会生活领域的例子。

三岁看大,七岁看老

        再扯远点,中国有句话叫“三岁看大,七岁看老”,就是这个最初的关注,影响最终的关注度的例子。古人选择3岁和7岁这个时间段,是很有道理的,这是儿童最初表现出自己的各种品质的阶段,以后,基本就定型了。

        医圣张仲景,十岁时同乡何颙给他看相,说他“用思精而韵不高,后将为良医”。当然这话是10岁时说的,当时何颙作为同乡,早就了解张仲景,所以才有这番话,所以三岁看大,七岁看老确实是可信的。何颙还给曹操看过相,说曹操“汉室将亡,安天下者,必此人也”。这话什么时候说的已经不可考,但既然是预测,肯定是很早的时候就是了。

        下围棋有言:二十岁不成国手,终生无望。最近中国小将范廷钰夺得应氏杯,他的前途很长,但是肯定很光明就是了。

        除了科学,娱乐,社会生活,还有其它的领域比如夫妻相处,经济发展,战争进程等等,都可以找到类似的例子,真是车载斗量,想说的话,三天三夜说不尽。不信,大家可以在自己的生活中,一一对照。


博客感言
https://blog.sciencenet.cn/blog-876720-669167.html

上一篇:是时候创办一本只接受负结果的科学杂志了
下一篇:写博客就像打水漂
收藏 IP: 136.165.158.*| 热度|

49 许培扬 刘全慧 李伟钢 鲍海飞 彭思龙 刘洋 韩枫 王守业 武夷山 王浩 逄焕东 朱晓刚 陈冬生 张洁 柯江 周锋 王修慧 王府民 侯高垒 刘钢 张启峰 吉宗祥 曹聪 王号 徐大彬 曹建军 丁国如 刘亚雷 何代杰 陆雅莉 戴德昌 喻海良 彭真明 陈沐 郑新奇 高建国 郭志成 黄明清 严家新 傅蕴德 张骥 唐凌峰 李咏 毛培宏 张永富 biofans s11s ddsers gxs2012

该博文允许注册用户评论 请点击登录 评论 (33 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-4 13:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部