||
本文将Twitter用户看做是传感器(sensor)。当地震发生时,Twitter用户会大量发布相关的微博,被看做是传感器感应并发送的信息。文章先通过一个分类器,监测到target event,然后通过一个概率时空模型(probabilistic spatiotemporal model)找到事件位置的中心和动态。
Figure1是Twitter用户的分布图,Figure2是地震分布图。可以看出,日本是两图红点的密集地区。作者(日本人)选择在日本进行试验还是很符合现实情况的。
将用户看做传感器,一大弊端是,传感器噪声(noisy)很强。一个用户不像传感器那样“尽职尽责”地监测事件,一个用户由于各种原因(不在线、不关心事件)等等并不能在事件发生时,传递出消息。所以,作者使用了信号处理方向经常使用到的算法:Kalman Filter来过滤噪声。
Twitter用户与传感器的相似之处如下图所示:
在对Twitter上的target event做监视,主要考虑到类似地震的事件具有如下的特征:
1、规模很大(They are of large scale)
2、对用户生活影响很大(They particularly influence people's daily life)
3、它们具有时空区域特性(They have both spatial and temporal regions)
文中用到了SVM分类器做分类。采用的特征如下:
Feature A:(Statistical Features)Twitter消息的单词数目,以及查询词项在消息中的位置。
Feature B:(Keyword features)the words in a tweet.
Feature C:(word context features)查询词项前后的单词
【WWW-2010】Earthquake Shakes Twitter Users Realtime Event Detection by Social.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 14:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社