x0xu0008的个人博客分享 http://blog.sciencenet.cn/u/x0xu0008

博文

谈什么科学?你们只是一群性趣盎然的家伙! 精选

已有 11241 次阅读 2015-9-6 17:30 |个人分类:科研 产业|系统分类:科研笔记

有报道:文章题目越短,引用次数越高[1,2]。我怀疑这个结论。

进一步想:移动互联网时代,文章题目和点击率有啥关系?点击率不等于引用次数,但是无疑点击越高,被引用的机会就越大。

如何解决这样的疑问呢?

也许,分析一下我自己的博客文章的点击率,应该能得到些结论。

结果令人大吃一惊,嘿嘿,我发现了你们(也包括我)指尖上的秘密!

数据选择

考虑到被编辑加精会严重增加点击率,仅选加精的博文,从而把“编辑选择”这一因素排除在外。当然编辑的选择本身也受文章题目的影响,但这里我们把编辑理解成理性负责的俊男靓女(一定是这样滴!),从而简化计算。

时间越早一般点击率越高。但是考虑到广大网友但见新人笑,旧人高颜值大长腿性格美好也不在乎,主要的点击率来自博文发表后的几天之内。因此由于发表时间先后造成的点击差异被我忽略了,以简化计算。博文点击率以2015年9月5日晚11时30分的数据为准。最新一篇博文还没有脱离它的传播期,不计算在内。

写作质量也会影响点击阅读,不过一般来讲写作质量不会差别太大,我在此也忽略不计,同样是为了简化计算。

数据的分类

文章题目长短,是我感兴趣的因素之一。说明下,有英文的,我把英文单词记为一个词,标点符号不计算在题目长短里面。为了保证各组文章数大致相当,我把题目字数1-7作为一组,8-10作为一组,11-15作为一组,15以上作为一组,每组的文章数分别是16,18,18和11。

我更感兴趣的是文章题目中的一些关键词同点击的关系。就是看看科学网上,我们这些标榜科学理性的人,是否也会受到标题党的引诱。因此,我把同赛克斯相关的题目(一日夫妻啦,金风玉露啦,欲火啦等等),同基因相关的题目,同癌症相关的题目,同写作当时热点相关(比如世界杯,大阅兵等等)的题目等进行不同的分组,其余的算作其它组。

数据分析

用的是IBM出的统计软件SPSS19.0,简单的多样本单因素方差分析(One-way ANOVA),P值0.05作为统计显著性数值。

结果

啥也不说了,直接上data!

博文名称,名称长度以及点击率:

标题长度同点击率的关系:


依据博文关键词的分类:


标题关键词同点击率的关系:


讨论

最好能在别人的博客里面验证我自己的推断。本来想在饶毅先生的博客里面做个统计,反正数据是现成的,无奈他博文太多,太累,敏感词又太多,这个坏人就你们来做吧,哈哈哈哈。大家感兴趣的把结果反馈给我哈。

结论

结论1:文章的题目长短同点击率有关系,但并非越短越好,可能一定的长度是必须的,比如8-10个词。因此,文章长短同点击率不是简单的负相关关系,而是可能是先高后低的关系,峰值在8-10个词左右。

结论2:呵呵

结论2,就是本文题目的由来。

引申

我不同意认为这样的研究没有意义的说法。

这种研究可能是广告文案的基础。我们常常网购,淘宝京东唯品会上的推荐,就是基于个人搜素偏好大数据之上的最优算法。

另外这样的研究可能指导网上数据的整合。比如2009年Nature上的一篇文章发现在线搜索能够提前一周预报流感的发生[3]。

扯得更远点,通过网络点击,可能预测股市(不是有女性裙子长短同经济发展关系的研究么?),甚至发现不同时代不同时期人们关注点的不同,从而把握社会动向,揭示潜在社会矛盾,以防微杜渐。

附:科学网编辑,后台数据有么?我们一起做个分析,不能发Nature,得个搞笑诺贝尔奖也行啊。


[1]Letchford, A. et al. R. Soc. Open Sci. http://dx.doi.org/10.1098/rsos.150266 (2015).

[2]http://blog.sciencenet.cn/blog-41174-916059.html

[3]Detecting influenza epidemics using search engine query data.Nature Vol 457, 19 February 2009,doi:10.1038/nature07634.

喜欢我的文字?并想获得更快捷和亲切的阅读体验?

请微信搜索Science_Cooker或扫描屏幕下方的二维码





https://blog.sciencenet.cn/blog-876720-918927.html

上一篇:科学桃葡藤 第一季
下一篇:沉默的杀手
收藏 IP: 112.54.84.*| 热度|

29 武夷山 姬扬 蔡小宁 孙学军 王春艳 李颖业 董焱章 朱延平 杨建军 张家峰 胡荣桂 薛宇 赵凤光 杨正瓴 彭真明 朱冬青 代恒伟 金耀初 李明富 白龙亮 唐凌峰 王瑞 杨月琴 樊采薇 wuxiangchao realyyy biofans zjzhaokeqin ericmapes

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 03:25

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部