智商情商网熵田园分享 http://blog.sciencenet.cn/u/Liweigang 数字之美,美于形式,更在内涵。

博文

微博研究系列:奇妙的微博转发和互粉 精选

已有 7035 次阅读 2012-4-18 07:28 |个人分类:社交网络|系统分类:科研笔记| 科学网, 微博, Twitter, 新浪微博, 腾讯微博

奇妙的微博算得上2000年来人类最伟大的科技、人文创新之一。活活鲜鲜的事件、清清秀秀的人物能在瞬间穿越时空,通过新浪、腾讯和推特等微博平台,跃出读微界面,令君眼热心跳。而网上频频出现的追粉(Follow)及转发(Retweent)等靓词潮语,即使对于新新人,亦是接应不暇。


微博不微,在这浩瀚的虚拟世界,不同类型的用户都能乐此不疲,妙不可言。大家疯来疯去,一个字:酷!不过商家玩的可不仅限于个人或群组的冲浪体验,而是垂诞那滚滚而来的无限商机。


时代机遇总是促进社会发展的原动力,微博的神奇,激发着学术界的研发热情。从事网络信息等相关领域研究的学者们关注的是微博的关系结构和传播机制。这些腕级高手们两年来都倾情于微博的转发预测(Retweet prediction)


在科学网微博呼之欲出,网友博主翘首以待的日子里,笔者将不定期推出本团队等对微博研究若干成果,为科学网微博建言献策,为博友玩转微博加油添彩。


1. 微博简介


新浪和腾讯微博是国内十分流行的微博服务平台。新浪微博巧夺先机,于20114月更名网域为Weibo,成为和西方推特(Twitter)齐名的微博类社交网络。因为在西方,人们都不大说Micro-blog,而直接讲Twitter。由于叫得顺口,Twitter就是微博,微博就是Twitter。所以在中国,新浪此举的确具有战略眼光,其微博的注册用户已超过3亿,用户每日发博量超过1亿条,日活跃用户比例为9%[1]


新浪微博有两个重要特点[1]:一是2011年的增长极其迅猛,全年新浪微博注册用户实现了2亿的增长,平均每月新增用户超过1600万。网络品牌广告业务增长27%,也创下历史新高。二是新浪清晰认识到多形式挖掘微博的商业价值,截至2月底,共有13万余企业开通新浪微博。有143家世界500强企业开通新浪微博,占比达到29%。而在中国500强企业中,207家已开通新浪微博,占中国500强企业总量41%


同时,据腾讯公司2011年第四季度财报披露,腾讯微博注册用户数已超过3.73亿,日活跃用户数达到6800万,成为中国最大的微博[2]


2. 微博关系与机制研究ABC


伴随以上大气候,研究微博关系结构和传播机制的商业和学术意义十分重大。一条140字符内的微博在虚拟社区内发出,用户、企业、微博运营商等有关部门都想知道,此信息在网络上的发布源、传播路径、转发量、转发者以及传播范围等等。这样,用户微博转发预测(Retweet prediction)议题就成为有关人员研究的热门话题[3]


首先,为何推特(Twitter)的每个微博(Tweet)信息量是140个字母?由于全球移动电话的短信服务(Short Message Service - SMS)协议约定,一则短信的信息量约1607位字元(seven-bit)。考虑到微博的主要传播媒介是移动通讯,推特的发明者就参照SMS协议,取140个字符为每个微博的长度,留下20个字符的空间为发微博者的用户名和电话号码等。新浪和腾讯等国内微博服务商引进了此概念,新浪的微博长度为140个汉字,腾讯的微博长度为70个汉字。科学网刘国巍博主转载的沈浩老师发表的关于微博140字的三十条分析,较全面介绍微博使用和机制,有兴趣的读者可参考[4]


在推特微博社区内,如果用户A关注B,称AB的粉丝(Follower),称BA的关注人(Followee)。如果AB的粉丝,B亦是A的粉丝,称AB为互粉(R-friends)。用户发信息称为微博(Tweet),其他用户转发此微博称为转发(Retweet)。新浪微博在推特的基础上,结合中国用户特点,增加发微博的附加图形和微博转发的评论等功能,可以说是青出于蓝胜于蓝。


在此关系定义下,进一步的研究是利用图论等建立关系模型,进行用户微博传播机制和转发预测。


3. 微博商业价值挖掘第一步


挖掘微博的商业价值有很多工作要做。这里先介绍第一步:用户关系初步定量分析[5]。通过正式渠道获得的一组新浪微博数据包括58百万用户。在这些用户间,已建立2.65亿某种粉丝关系,但互粉关系只有7百余万。



图一 新浪微博用户的粉丝分布


图一示新浪微博用户的粉丝分布情况,看得出尽管新浪微博注册用户数激增,但粉丝的形成并非具备相应规模。仅从这一组数据看,95.19%的用户没有粉丝、92.16%的用户关注数少于10人、98.37%的用户没有互粉关系。



图二 新浪微博用户的互粉分布


图二示新浪微博用户的互粉分布情况。在此组数据内,这几项指标的最大值分别为:一位用户的粉丝数达22万、一位用户关注10万网友、一位用户的互粉数达1万。其中0.31%的用户拥有100以上粉丝、0.29%的用户关注100以上网友、0.20%的用户有10位以上互粉网友。


这些统计结果只是新浪微博的一组局部数据分析结果,但基本上说明了微博粉丝、关注和互粉的关系现状。这些分析是挖掘微博的商业价值的基础工作。


4. 一个实际问题


在研究新浪和腾讯微博时, 如果使用中文描述微博的关系与机制,基本上还可以。但用英文描述时,问题就来了。例如,在西方有关微博研究中,推特(Twitter) 几乎就是微博(Micro-blog) 的代用词。说微博的短信(Message)就是:Tweet,转发这些短信就是:Retweet


在新浪或腾讯微博内能发Tweet吗?能Retweet吗?一些英文研究报告在对新浪或腾讯微博的描述时,就是这样怪怪的写道。众所周知,到目前为止新浪、腾讯微博还没和推特 (Twitter) 整合到如此亲密程度...


笔者认为,在国际上有关专家们开始此项研究时,新浪或腾讯应对此事引起重视,制订相应技术规范,明确新浪或腾讯微博的信息和转发等专有名词的英文表述。因为目前已有约已成俗的趋势,学者们已开始用TweetRetweet来描述新浪或腾讯微博的相应关系等等。应该说,这不是一件小事。因为将来有一天,新浪微博、腾讯微博以及推特等平台整合时,会带来不必要的麻烦。


5. 小结


巴西利亚大学李伟钢团队(TransLab)从事社交网络影响力研究,侧重点在跨平台的用户影响力研究等,详情参考[6]wentropia.com。近年始于微博关系结构和传播机制研究。本文是系列文章的开篇报告,和科学网博主交流,欢迎广大网友批评指正。



参考资料


[1] 张伟,新浪微博注册用户突破3亿 今年欲再投1.6亿美元,《中国经济周刊》,2012

       http://news.sina.com.cn/m/news/roll/2012-03-31/003724202903.shtml

[2]  腾讯科技讯, 腾讯第四季度收入79.225亿元 同比增长43.4%2012

      http://reteng.qq.com/info/16476.html

[3] Kwak, H., Lee, C., Park, H., and Moon, S. (2010). What is twitter, a social network or a news media? In the ACM proceedings of the World Wide Web, pp. 591-600. Raleigh, USA

[4] 沈浩,关于微博140字的三十条分析,科学网刘国巍博客转载文章,2011http://bbs.sciencenet.cn/home.php?do=blog&id=418967&mod=space&uid=313680

[5] Edans F. O. Sandes, Li Weigang, and Alba C. de Melo, Optimizing social network queries: Weibo case study. Research report, University of Brasilia, 2012

[6] Li Weigang, Zheng, Jianya and Li, Daniel, 2011. Analysis of W-entropy Index: the Impact of Members on Social Networks. In the proceedings of the IADIS International Conference WWW/INTERNET, Rio de Janeiro, Brazil, pp. 171-178. Best Paper Awards




http://blog.sciencenet.cn/blog-652078-560604.html

上一篇:e类最爱-航空卡收藏精品绝版
下一篇:百度开始收录快照科学网博客

6 许培扬 赵凤光 李欣海 唐常杰 赵大良 appleson166

该博文允许注册用户评论 请点击登录 评论 (10 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-3-5 00:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部