《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

社媒是个大染缸,大数据挖掘有啥价值?

已有 4389 次阅读 2014-1-7 09:56 |个人分类:立委科普|系统分类:科研笔记| 大数据, 挖掘

社媒是个大染缸,顽主比烂,僵尸横行,水军泛滥,大数据挖掘又有什么意义?


无论是怎样大的染缸,它实际上成为最具规模、最便捷、有时甚至是唯一的普罗网民的舆情宣泄口,尤其在东土。


水军僵尸总会有对付的办法。社媒的混沌和杂乱不是不作为的理由。从情报角度,它可能不是富矿,但肯定是金矿,就看你有没有本事挖掘它。


有啥用处呢?先说它的不宜和禁忌,也许更好。


1 这种挖掘不宜做预测,更适合做回顾。当然,历史是未来的镜子,回顾过去也未尝不能透出一点趋向的预测。


2  这种挖掘一般不提供问题的答案,特别是科学问题,答案在专家或上帝手中,不在网民的口水中。


3  大数据不是决策的唯一依据,只是依据之一。正确的决策必须综合各种信息来源。大事不提,看看笔者购买洗衣机是怎样使用大数据、朋友口碑、实地考察以及种种其他考量的吧。以为有了大数据,就万事大吉,是不切实际的。


有网友怕大数据挖掘误导读者。的确,大数据的操作和挖掘可能有 bug。但大数据提供的舆情全貌鸟瞰是其他手段代替不了的,而我们每个个体在日常接触中只能看到舆情信息海洋的一滴水。事实上,无视大数据更容易被自己的局限所误导。害怕大数据,就好比蒙上眼睛,世界就不见了一样可笑。


好,回到有啥价值?


最直接的价值就是可以补充、加强并最终 取代问卷调查。(譬如可以用来测量一场运动、战役、广告的效果,总统选情的检测,等等。)

第二个价值就是为公关危机提供检测和预警的工具。

企业中的 use cases 有十多类(scenarios),在我看与上述两种都大同小异,但是企业人士不认为这样简单,因为每个scenario 都有其独特的设置、优化和资源配置,因此都有其独特的价值,不少价值可以最终由 ROI 来客观测量。

其他潜在价值可能也有,但不能确认,还在探索中。譬如相关性和不相关性研究。有了数据,有了工具,应该可以玩出一些花样来。这些都是可以探索的。


【置顶:立委科学网博客NLP博文一览(定期更新版)】



https://blog.sciencenet.cn/blog-362400-756685.html

上一篇:【大数据挖掘:方崔大战一年回顾】
下一篇:【大数据挖掘:微信(WeChat)】
收藏 IP: 192.168.0.*| 热度|

3 王秀玉 陈辉 bridgeneer

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 23:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部