swb0802的个人博客分享 http://blog.sciencenet.cn/u/swb0802

博文

Earthquake Shakes Twitter Users

已有 3478 次阅读 2013-3-31 15:22 |系统分类:论文交流| Twitter, users

   本文将Twitter用户看做是传感器(sensor)。当地震发生时,Twitter用户会大量发布相关的微博,被看做是传感器感应并发送的信息。文章先通过一个分类器,监测到target event,然后通过一个概率时空模型(probabilistic spatiotemporal model)找到事件位置的中心和动态。

       

   Figure1是Twitter用户的分布图,Figure2是地震分布图。可以看出,日本是两图红点的密集地区。作者(日本人)选择在日本进行试验还是很符合现实情况的。

   将用户看做传感器,一大弊端是,传感器噪声(noisy)很强。一个用户不像传感器那样“尽职尽责”地监测事件,一个用户由于各种原因(不在线、不关心事件)等等并不能在事件发生时,传递出消息。所以,作者使用了信号处理方向经常使用到的算法:Kalman Filter来过滤噪声。

   Twitter用户与传感器的相似之处如下图所示:

   在对Twitter上的target event做监视,主要考虑到类似地震的事件具有如下的特征:

       1、规模很大(They are of large scale)

       2、对用户生活影响很大(They particularly influence people's daily life)

       3、它们具有时空区域特性(They have both spatial and temporal regions)

   文中用到了SVM分类器做分类。采用的特征如下:

       Feature A:(Statistical Features)Twitter消息的单词数目,以及查询词项在消息中的位置。

       Feature B:(Keyword features)the words in a tweet.

       Feature C:(word context features)查询词项前后的单词


【WWW-2010】Earthquake Shakes Twitter Users Realtime Event Detection by Social.pdf





https://blog.sciencenet.cn/blog-795423-675576.html

上一篇:Reading list-2013
下一篇:话题模型——隐含狄利克雷分布
收藏 IP: 210.30.97.*| 热度|

1 魏东平

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 10:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部