|||
蒋老师看了关于柴静的社会媒体舆论挖掘后留言,问可不可以帮助挖掘一下狗肉的话题。这也是一个极其有争议的热点话题,凸显动物保护主义与传统文化的冲突。
蒋老师何等人物,岂敢怠慢。n 年前,是蒋老师最先介绍我到科学网来的。恭敬不如从命,还是老老实实赶紧交家庭作业吧:这是对过去27个月的中文社会媒体样本的初步挖掘结果,还没有来得及做细致的分析解读。
一 总览和回顾
上面是过去27个月的“狗肉”话题在社交媒体的热议度,能看到两个高峰,那应该是在玉林狗肉节期间引起的广泛争议。
下图叫 Brand Passion Index Trend,内含舆情挖掘的情报简约而丰富,反映的是对于狗肉好恶的消长趋势,图中截取了过去一年半中社会舆论喜爱或痛恨(吃)狗肉的争议变化,三个泡泡反映了每半年的好恶(BPI)指标:泡泡的深浅度反映了数据的新旧,具体说就是,左下颜色最深的泡泡是最近半年统计挖掘出的好恶指标,中间那个泡泡是一年前的统计,颜色最浅的右下泡泡反映的是一年半前的指标。泡泡的大小表明了热议度,譬如一年前比半年前热议更多。泡泡所处的坐标位置反映了两项舆情,一是好恶(越往左越喜欢),二是情绪烈度(越往上越情绪化)。可见,一年前那个统计情绪烈度最大,而对(吃)狗肉的厌恶则随着时间推移越来越大(越来越靠左)。这说明什么呢?应该可以看到近年来,动物保护主义的影响在逐渐增大,反对吃狗肉的呼声正在变高。
二 相关热点话题
三 褒贬比例
四 情绪及其好恶的理由
可是系统褒贬的一般性设计还是使得“善待”这样的动保派常宣传的主张 ,因为其褒义的特性,被归类到传统派的绿色阵营去了。这算是一个 domain-independent 系统进入 domain 以后水土不适的一个例证。如果认真去做的话,应该做一些 domain adaptation,最起码也该手工参与去重新归类好(系统带有这个功能,允许用户自己动态重新归类去 override 系统的原归类,不过这只是个博文展示,不是正式研究报告,就懒得做细活了)。
还有一个小 bug:这是上篇关于柴静的舆情挖掘就有读者指出的,就是有些带有否定词的褒贬情报虽然挖掘分类都正确,可在展示中却没有了否定词“不”,比如前面的红字“吃”实际是“不吃”(派)。
五 社会舆论的地理分布
六 数据样本的来源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 21:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社