《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

大数据挖掘问答2:会哭的孩子有奶吃

已有 5483 次阅读 2013-12-27 15:44 |个人分类:立委科普|系统分类:科研笔记| 大数据

RE:有人在网上叫得最凶,所以这种大数据分析很容易受网上的vocal minority影响,不是么?


叫得最响用处不大,要叫得多。叫得响可以影响情绪烈度指标(passion index),但不影响最关键的褒贬指数(net sentiment)。叫得多也不能靠水军和僵尸,因为容易当作噪音被剔除,所以必须要叫得多种多样。

作者: 立委
日期: 12/26/2013 12:14:43


不排除有人精力旺盛,变着法儿叫,或者游说亲朋好 友一起喊冤。

这时候应该可以给每个 ID 限定一个对话题影响的 limit,这是容易实现的,但好像还没观测到这种矫正机制的需要。

更主要的其实是大 V,影响因子大的 ID,比如小F小H这类。情报用户很看重他们,让系统提供机制给大 V 加权。

也就是说,影响力大的声音本身就大,而情报使用的客户不给他打折扣,反而要加权和重视,因为他们害怕公关危机会由大 V 的喧嚣而爆发。想防患于未然。小鱼小虾翻不起大浪。譬如我吧,几个月前孩子使用 JCreator 软件学习 Java 编程,试用期到了要求付费,结果信用卡40美金划给它买一个教育license以后,还是打不开软件,尝试很多次花了很多时间才发现,这是一家 evil 的公司,它先引诱你付费教育许可,然后逼迫你继续购买它的所谓 professional 许可(70美金)才让你使用。你投诉,它根本不回音。上网查了一下,上当的不是一个,待遇都是一样,白交钱,不服务,不理睬。为了区区40美金,哪有功夫跟它折腾,而且我们是小人物,抱怨了也没人听见,可气不。如果我是大 V,就能叫它吃不了兜着走。(过两天有空可以找信用卡公司 dispute 这个交易,把钱要回来,还是蛮麻烦。) 大家都听说过老罗砸西门子冰箱的公关灾难吧,就是因为老罗是大 V,嗓子亮,西门子公关不当,没把他搞定,结果是直接经济损失据说上百万呢。

在企业大数据运用的10多个主要的 use scenarios,其中 risk management 最容易打动客户,他们也最愿意花大钱帮助实时监控。一个可能的公关灾难从火种到无法收拾,里面可以调控的时间不长,他们希望电脑大数据监控能在第一时间发出预警,然后他们可以及时应对。


“wow 立委可以去北大淑女班上课了:谈怎么叫才能听得畅快”


【置顶:立委科学网博客NLP博文一览(定期更新版)】



转基因问题
https://blog.sciencenet.cn/blog-362400-753416.html

上一篇:大数据帮助决策实例:《走进“大数据”——洗衣机寻购记》
下一篇:多米音乐 app 万岁万岁万万岁
收藏 IP: 192.168.0.*| 热度|

3 翟自洋 薛宇 邱嘉文

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 16:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部