陈安分享 http://blog.sciencenet.cn/u/陈安博士 御风而行,把酒邀月,穷极宇宙,留意身边

博文

在突发事件发生后怎样进行舆情分析与及时介入?

已有 3836 次阅读 2008-10-5 12:28 |个人分类:专论—应急管理|系统分类:科研笔记

??2008年9月19日,应武夷山总工的邀请,我很荣幸地前往情报所做了一个关于数据挖掘技术在舆情分析监控中的应用的报告。

??这里就针对于这个主题说一下。

??当出现突发事件后,公众的反应会有一个脉络可循,一个一个个体的反应会汇聚成一个舆论洪流。那么,这样的反应怎么才能够触摸到?如何在大家都惊慌失措的情况下及时告知大家正确的信息或国家强力介入的情况,就是应急管理必须要做的一件事。

??5年前在考虑这个问题的时候,我就一直在试图寻找一个可行的途径,最初的几个造成公众恐慌的例子是:超市艾滋病针事件、海南香蕉事件、哈尔滨水危机事件等。事情一出,市面大哗:去超市的人少了很多,且每个人都特别警惕;海南的香蕉没人吃了,甚至连累到其他地方的香蕉;哈尔滨的自来水当地人不敢喝了,非但如此,而且大家要住到街上去,因为还有人说地震。

??如此等等,不一而足。

??在出现一些类型的突发事件的时候,总会有公众恐慌的出现,这些恐慌会发展、会蔓延,带来更大的社会问题,甚至可能出现灾害本身并不严重,但是带来的公众恐慌却非常严重的局面。

??对于一个负责任的政府机构来说,当然最好的策略是消弭恐慌产生的土壤,但是这又很难,尤其在当今信息非常发达的状况下更难做到。一条带有恐慌消息的短信经过5-8轮转发可能就会有巨大的负面效应,更不要说还有其他传统途径,还有交互式网络这样的渠道了,累加起来是很可怕的一个传播链。

??从技术上说,我们认为如果能够对短信的相关进行监测,会有比较好的效果,因为这是从国家领导到普通老百姓都会采用的通讯手段,它的信息量也是惊人的,而以上的那些消息很多就是通过短信息传递最后引起群体问题的。

??但是,要想拿到短信的数据,得需要公安部的同意,我们没有这样的渠道,于是,准备从网络上来寻找更好的途径。

??我们在已经发表的一篇论文(英文)中提到了一个这样的基本策略:通过对交互式网络的论坛、BBS、新闻、Blog等信息来源,集成对于某一突发事件的尽可能多的信息,然后进行集成和分析,最后得出该事件是否已经影响到公众的结论,并根据信息传播的规律来确定干预时机与模式。

??不过,这也是说起来容易做起来难。

??于是,我们就按了这样的步骤去做:

??1,先做最简单的。我们先看某个主题(如海南香蕉有毒)的帖子在我们给定的一些网站出现的次数和总阅读量。如果阅读量大了,则认为造成群体恐慌的可能性比较大。

??2,再做次简单的。再看这些阅读是否是来自不同的ID地址,这个很重要,因为有些帖子是反复被同一批人顶上来,那就没有什么意思了。有效的阅读应该是来自不同ID的阅读。

??3,逐渐复杂化。再把帖子内容进行分析,如职业相关性、性别相关性、地域相关性,等等等等。把能够获得的信息都在数据库中找到并进行分析,给出一套评价的模型,最后算出一个数来。

??4,最复杂的模型。那就要进行文本分析、网络的结构分析了。前者要考虑帖子内容是什么,有怎样的可信度?谁上的贴?权威性如何?等等,后者则要看转帖情况,链接情况,等等。

??这里,我们不对帖子的正面负面说法进行分析,而是假设,不管是传播恐慌信息还是消除恐慌信息的内容,都会带来恐慌。为什么这样假设呢?道理也很简单,存在吵架内容的帖子其实会让读者更加相信负面的东西。这在人们心理现象中属于一个统计规律。

??当然,这么做也有我们另外的一个考虑,那就是,做文本分析,尤其是做中文的文本分析,现在的成果基本不可信,有人已经用了各种分类方法对文本中的不同情绪进行分类,实验证明,验证率很差。与其把精力投入到一个基本没有价值的问题上去,还不如多做一些其他侧面的分析。

??我回头再把19日在情报所的报告纪要发上来,这里只贴出我认为比较核心的一个思维模式,这个模式应该对于解决舆情分析中存在的一些现实问题有所助益。



https://blog.sciencenet.cn/blog-53483-41509.html

上一篇:说说商人
下一篇:假日留痕——北京的中山公园和劳动人民文化宫
收藏 IP: .*| 热度|

1 刘玉平

发表评论 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 21:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部