||
十几天前我逃离新浪,进入科学网博客。我在新浪呆了半年多,文章写了几十篇,博客点击加起来才
1000多;到了科学网,刚把一篇文章贴上去,就看点击量象火箭蹿升般嗖嗖的上涨,分明是让博客飞啊!只一天,第一篇博客点击就超过我新浪所有文章半年的点击量。我就想,哥这步走对了,站在巨人的肩膀上,不见得保证成功,但一定能让更多人看到你。我很感兴趣的一个问题是:如何预测出一篇博客的点击率?需要说明的是,评论和推荐都算在点击阅读里,不单独考虑。想到这个问题,我就想什么能影响一篇博客的点击率?想到的因素有:
1、 编辑推荐:这个恐怕最能影响点击率了,编辑抬抬手,够你跑到天黑黑的;
2、 谁写的:很显然要是饶毅施一公这样的大科学家,或者喻海良这样的名人,或者黄安年许培扬陈安武夷山这样的知名博主,那本身就是点击率的保证;
3、 博客内容:不解释;
4、 题目:这个很重要,好的题目赚取点击率的一半;您要是给博客起名字比如“x通过调节y从而影响z过程”,那您等着哭吧;
5、 博主有多少注册用户朋友:这个能让你有更广泛的链接,从而被更多人看到;
6、 发表时间:编辑倾向于而且推荐人们也倾向于阅读最新的文章。另外不知道科学网博客有多少人使用,中外分布比例,这样发表的早晚时段也会影响最初发表之后一段时间的点击率。
暂时就想到这么多。但是我想总结出一个简单的关系,可以用来预测最终点击率,而不需要考虑所有这些因素,这才是科学预测的意义所在,就像牛顿第二定律,不管各种力如何作用,都是简单的F=ma。
当我把所有上述因素忽略,只集中在最初点击率和最终点击率,我发现最初半小时到一小时的博客点击量,能很大程度反映出24小时的点击率,而24小时的点击率,基本上就是最终博客点击率。于是我总结出:
博客点击第一定律:一篇博客的24小时点击率大约是半小时后点击率的20倍,24小时后,博客的点击率基本保持稳定。简称20倍定律。
这是一个定律,考虑的是理想情况,所以在应用时,需要考虑一些具体情况:
• 如果考虑编辑的推荐,那么要从编辑推荐后的半小时,来预测之后的24小时以及最终点击率;
• 如果发表时间在半夜无法被编辑和其他人看到,这个半小时要相对延长到大多数人在线的时间;
• 如果文章经由分享或者推荐到别的博客群,那么在新的博客群里面,依然遵循二十倍定律,但是不同博客必须分别计算。
从我的几篇博客的点击来看,这个预测基本符合实际(如下图)。这个定律的好处在于,你不用考虑太多的因素,只要抓住最初时间的点击率,就能大致预测以后的点击率。这个曲线基本符合逻辑斯蒂曲线。而根据逻辑斯蒂曲线的前一段可以预测最终的走向,则是这个定律揭示的。
在这里,博客点击选择的是半小时用以预测更长时间比如24小时和更久。但是这个定律还可以推广到更广泛的领域。要做就做大。不妨把所有信息传播概括为:
信息传播定律:一个信息的传播总量可以由最初的时间段传播量来预测,他们之间的关系是:信息传播总量=最初时间段传播量×k
• 最初时间段由该信息的接受时间决定,最初时间段的选择应该比信息的接收时间超过一个数量级。比如一篇2000字的博客,可能两分钟就读完了,所以最初时间段可能就是20分钟到一个钟头;比如一部电影,一般是1.5小时,最初时间段应该就是1天到两天,以此类推。
• k值在博客点击可能是20,在别的领域会有波动,不过应该也差不多,欢迎大家修正。
我们来看看用这个信息传播定律能做哪些预测。事实上,这个定律非常强大,可以预测很多东西。我们先从不太popular的科技文章引用说起,然后在说说每个人都关心的东西。
某个领域研究文章总数的预测
生物类文章一般的周期都要用年来计算,所以最初时间段大约是10年或者20年的样子。我们来看看p53文章在最初时间段的数目。在NCBI中按年份输入关键词p53,在1980年,p53的文章数是0,到1990年,总文章数是591,到了2000年,这个数字增长到20594,如下图。我把最初时间段定到20年,最初时间段的文章数是20594,我把k值定为20,那么我估计,p53的研究文章最终会稳定在20594×30,大约60万的样子,也就是再有十几年,p53的研究将会停滞。
再看microRNA研究的例子,如下图,2000年还没有microRNA的文章,2010年是1万多一点,现在科技发达,信息便捷,大家对同一个热门领域的追逐更快,所以最初时间段就定为10年,考虑到microRNA比p53一个基因涵盖更多内容,所以k值定为100,那么microRNA的研究文章总数就是大约100万篇,还有20几年,microRNA研究也将进入停滞。
除了上面列举的,还可以解决诱导干细胞可以火多久等等。
下面谈几个在文化娱乐领域的例子。
西游降魔的最终票房
上文分析过,电影的最初时间段大约是1天或者两天,西游降魔2月10日首日票房8162万,创华语票房首日记录,到3月10日,票房达到12亿。我们把k值定位20,那么总票房是8162×20,大约16亿的样子。这和最终票房已经很接近了。泰囧的首日票房3650万,乘以20,七个亿多一点,最终是10亿多,也相当接近。
芙蓉姐姐还能火多久?
芙蓉姐姐本身不是一个信息。一个信息一经出现,马上变成过时的信息。人不一样,她可以不断制造新闻。但是面孔不会变,所以还是存在最初的关注和最终的影响这样一个简单数学关系。芙蓉姐姐出道已经有7,8年了吧?根据最初关注度和最终关注之间的关系,芙蓉姐姐现在的关注已经保持稳定,即使她还会炒作,但是人们已经不再感兴趣,所以她会在两三年内淡出人们的视野。
其它的,比如红翻全球的江南style最终点击率能有多少都可以用这个定律来预测。
另外,信息社会,人们生活在网络里:太多的搜索引擎;太多的社交网络,比如国外的Facebook,Linkedin,国内的人人,校内,QQ,微博;太多的公共媒体和论坛。那么这些载体上信息的传播是不是也遵循这个信息传播定律呢?我想答案是肯定的:最初的关注,影响最终的关注度。还可以用这个定律来估计谣言或者传言的影响力。
在谈几个社会生活领域的例子。
三岁看大,七岁看老
再扯远点,中国有句话叫“三岁看大,七岁看老”,就是这个最初的关注,影响最终的关注度的例子。古人选择3岁和7岁这个时间段,是很有道理的,这是儿童最初表现出自己的各种品质的阶段,以后,基本就定型了。
医圣张仲景,十岁时同乡何颙给他看相,说他“用思精而韵不高,后将为良医”。当然这话是10岁时说的,当时何颙作为同乡,早就了解张仲景,所以才有这番话,所以三岁看大,七岁看老确实是可信的。何颙还给曹操看过相,说曹操“汉室将亡,安天下者,必此人也”。这话什么时候说的已经不可考,但既然是预测,肯定是很早的时候就是了。
下围棋有言:二十岁不成国手,终生无望。最近中国小将范廷钰夺得应氏杯,他的前途很长,但是肯定很光明就是了。
除了科学,娱乐,社会生活,还有其它的领域比如夫妻相处,经济发展,战争进程等等,都可以找到类似的例子,真是车载斗量,想说的话,三天三夜说不尽。不信,大家可以在自己的生活中,一一对照。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-17 19:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社