zhanghaifeng的个人博客分享 http://blog.sciencenet.cn/u/zhanghaifeng

博文

利用google、twitter可以预测流感传播趋势

已有 12304 次阅读 2012-12-20 17:45 |系统分类:科研笔记| google, 流感预测

最近在忙着写基金的本子,所以在进行新一轮的文献调研。在此过程中看到一些”个人感觉很不错“的文章推荐给感兴趣的朋友。


一个很直观的感觉——在流感爆发季节,人们会通过google等搜索工具了解流感的爆发情况以及应对流感的一些措施,那么在这段时间内某些与流感的关键词,如流感、勤洗手、带口罩、流感疫苗等会高频率出现。同样地,在流感爆发季节,人们也会通过twitter等工具反映用户本人、朋友是否感染流感,或者与流感相关的信息等。因此利用google/twitter等工具抓取与流感相关的关键词,通过分析这些关键词的频率发现,相对于传统的疾病监测系统,这种方法可以很好预测流感的传播情况,尤为重要的是,这种方法的代价低而且仅仅比流感爆发的时间晚1天!

这些在线工具还可以预测很多东西,比如有可能的暴乱、股市的走势、房屋价格、大选结果以及失业率等等。反正被说的很牛叉。当然它也有不足的地方,比如有一个超级明星在某个时间段发了一条关于自己得流感的微博,马上这条消息可能被大范围的传播,但是这并不代表流感已经是大范围传播了。因此在研究中要充分考虑不同的噪音的影响。


关于这方面的研究最近超级火爆,对于会处理大型数据的人这个方向应该不难,有兴趣的可以看看下面几篇文献,
1,Ginsberg J, Mohebbi MH, Patel RS, Brammer L, Smolinski MS, et al. (2009)
Detecting influenza epidemics using search engine query data. Nature
457(7232): 1012–4.(已经被引用600+,另外从网站找到了这篇nature的中文翻译,《利用查询数据探测流感传播》,中国计算机学会通讯、第 7 卷 第 8 期 2011 年 8 月。)
2,Signorini A, Segre AM, Polgreen PM (2011) The Use of Twitter to Track Levels
of Disease Activity and Public Concern in the U.S. during the Influenza A H1N1
Pandemic. PLoS ONE 6: e19467.
3,Salathe M, Khandelwal S (2011) Assessing Vaccination Sentiments with Online Social Media: Implications for Infectious Disease Dynamics and Control. PLoS Comput Biol 7(10): e1002199. doi:10.1371/journal.pcbi.1002199

google流感预测(转载http://www.google.org/flutrends/intl/zh_cn/about/how.html)
它的工作原理是怎样的?
我们发现,某些搜索字词非常有助于了解流感疫情。Google 流感趋势会根据汇总的 Google 搜索数据,近乎实时地对全球当前的流感疫情进行估测。

全球每星期会有数以百万计的用户在网上搜索健康信息。正如您所预料的那样,在流感季节,与流感有关的搜索会明显增多;到了过敏季节,与过敏有关的搜索会显著上升;而到了夏季,与晒伤有关的搜索又会大幅增加。所有这些现象均可通过 Google 搜索解析进行研究。 但是,搜索查询趋势能否为实际现象建立一个准确可靠的模式而提供依据呢?

我们发现,搜索流感相关主题的人数与实际患有流感症状的人数之间存在着密切的关系。当然,并非每个搜索“流感”的人都真的患有流感,但当我们将与流感有关的搜索查询汇总到一起时,便可以找到一种模式。我们将自己统计的查询数量与传统流感监测系统的数据进行了对比,结果发现许多搜索查询在流感季节确实会明显增多。通过对这些搜索查询的出现次数进行统计,我们便可以估测出世界上不同国家和地区的流感传播情况。我们的研究结果发表在美国《自然》杂志上。

历史估测数据查看以下国家/地区的数据:         奥地利           澳大利亚           比利时           波兰           德国           法国           荷兰           加拿大           美国           南非           挪威           日本           瑞典           瑞士           乌克兰           西班牙           新西兰           匈牙利    
美国流感疫情
流感估测病例数 Google 流感趋势估测数据  美国的数据

美国:流感样疾病 (ILI) 数据由美国疾病控制中心提供。

这些图表显示了根据历史查询所得的不同国家和地区的流感估测结果,以及这些结果与官方的流感监测数据的对比。从图中可以看出,根据与流感相关的 Google 搜索查询所得到的估测结果,与以往的流感疫情指示线非常接近。当然,过去的表现并不能保证以后的结果一定准确。

我们为何要不厌其烦地根据汇总的搜索查询来估测疫情呢?传统的流感监测系统非常重要,但大多数卫生机构都只关注单个国家或地区,而且每隔一个星期才会更新一次估测数据。目前,我们已在全球的若干国家/地区推出 Google 流感趋势,此产品的数据每天都在更新,可为现有的流感监测系统提供有益的补充。

详细了解 Google 流感趋势背后的研究过程:

阅读美国《自然》杂志发表的文章“运用搜索引擎查询数据检测流感疫情”(Detecting influenza epidemics using search engine query data)
HTML | PDF

下载 Google 流感趋势的全球估测结果

对于流行病学家而言,这个系统的开发是他们所喜闻乐见的,因为如果能及早监测到疫情爆发的征兆,就可以显著减少患病人数。当一株新的流感病毒在特定条件下形成后,一旦在全球范围内流行,就可能会夺去数百万人的生命(例如,1918 年就发生过这种灾难)。我们最新的流感估测结果可帮助公共卫生官员和专业卫生技术人员更好地应对季节性流感。

流感趋势试验版

我们发现,在我们推出流感趋势试验版的国家/地区中,根据汇总的流感相关查询所得到的季节性曲线与实际的流感疫情水平非常接近。通常,这些估测结果并没有与官方的流感监测数据进行对比。这些试验性的估测结果可从流感趋势试验版的相应国家/地区页面下载。

保护用户的隐私权

Google 深知用户对我们的信任,而且致力于保护用户的隐私。我们以匿名方式统计某些搜索查询在每星期的出现次数,因此 Google 流感趋势绝不会被用来确定个人用户的身份。我们依据的是长期以来发送至 Google 的数以百万计的搜索查询,而我们观察到的数据模式只适合 Google 搜索用户这个庞大的群体。要详细了解这些数据的使用情况以及 Google 如何保护用户的隐私权,请访问我们的隐私权中心





https://blog.sciencenet.cn/blog-291824-644684.html

上一篇:动态演化网络上基于社团的控制策略
下一篇:“友谊悖论”可以帮助我们更早的探测流行病的爆发
收藏 IP: 202.38.94.*| 热度|

2 李伟钢 scsjiana

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 00:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部