||
有报道:文章题目越短,引用次数越高[1,2]。我怀疑这个结论。
进一步想:移动互联网时代,文章题目和点击率有啥关系?点击率不等于引用次数,但是无疑点击越高,被引用的机会就越大。
如何解决这样的疑问呢?
也许,分析一下我自己的博客文章的点击率,应该能得到些结论。
结果令人大吃一惊,嘿嘿,我发现了你们(也包括我)指尖上的秘密!
数据选择
考虑到被编辑加精会严重增加点击率,仅选加精的博文,从而把“编辑选择”这一因素排除在外。当然编辑的选择本身也受文章题目的影响,但这里我们把编辑理解成理性负责的俊男靓女(一定是这样滴!),从而简化计算。
时间越早一般点击率越高。但是考虑到广大网友但见新人笑,旧人高颜值大长腿性格美好也不在乎,主要的点击率来自博文发表后的几天之内。因此由于发表时间先后造成的点击差异被我忽略了,以简化计算。博文点击率以2015年9月5日晚11时30分的数据为准。最新一篇博文还没有脱离它的传播期,不计算在内。
写作质量也会影响点击阅读,不过一般来讲写作质量不会差别太大,我在此也忽略不计,同样是为了简化计算。
数据的分类
文章题目长短,是我感兴趣的因素之一。说明下,有英文的,我把英文单词记为一个词,标点符号不计算在题目长短里面。为了保证各组文章数大致相当,我把题目字数1-7作为一组,8-10作为一组,11-15作为一组,15以上作为一组,每组的文章数分别是16,18,18和11。
我更感兴趣的是文章题目中的一些关键词同点击的关系。就是看看科学网上,我们这些标榜科学理性的人,是否也会受到标题党的引诱。因此,我把同赛克斯相关的题目(一日夫妻啦,金风玉露啦,欲火啦等等),同基因相关的题目,同癌症相关的题目,同写作当时热点相关(比如世界杯,大阅兵等等)的题目等进行不同的分组,其余的算作其它组。
数据分析
用的是IBM出的统计软件SPSS19.0,简单的多样本单因素方差分析(One-way ANOVA),P值0.05作为统计显著性数值。
结果
啥也不说了,直接上data!
博文名称,名称长度以及点击率:
标题长度同点击率的关系:
依据博文关键词的分类:
标题关键词同点击率的关系:
讨论
最好能在别人的博客里面验证我自己的推断。本来想在饶毅先生的博客里面做个统计,反正数据是现成的,无奈他博文太多,太累,敏感词又太多,这个坏人就你们来做吧,哈哈哈哈。大家感兴趣的把结果反馈给我哈。
结论
结论1:文章的题目长短同点击率有关系,但并非越短越好,可能一定的长度是必须的,比如8-10个词。因此,文章长短同点击率不是简单的负相关关系,而是可能是先高后低的关系,峰值在8-10个词左右。
结论2:呵呵
结论2,就是本文题目的由来。
引申
我不同意认为这样的研究没有意义的说法。
这种研究可能是广告文案的基础。我们常常网购,淘宝京东唯品会上的推荐,就是基于个人搜素偏好大数据之上的最优算法。
另外这样的研究可能指导网上数据的整合。比如2009年Nature上的一篇文章发现在线搜索能够提前一周预报流感的发生[3]。
扯得更远点,通过网络点击,可能预测股市(不是有女性裙子长短同经济发展关系的研究么?),甚至发现不同时代不同时期人们关注点的不同,从而把握社会动向,揭示潜在社会矛盾,以防微杜渐。
附:科学网编辑,后台数据有么?我们一起做个分析,不能发Nature,得个搞笑诺贝尔奖也行啊。
[1]Letchford, A. et al. R. Soc. Open Sci. http://dx.doi.org/10.1098/rsos.150266 (2015).
[2]http://blog.sciencenet.cn/blog-41174-916059.html
[3]Detecting influenza epidemics using search engine query data.Nature Vol 457, 19 February 2009,doi:10.1038/nature07634.
喜欢我的文字?并想获得更快捷和亲切的阅读体验?
请微信搜索Science_Cooker或扫描屏幕下方的二维码
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-24 11:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社