《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

文本挖掘需要让用户既能见林又能见木

已有 2740 次阅读 2014-7-17 07:42 |个人分类:社媒挖掘|系统分类:科研笔记|关键词:挖掘| 挖掘

有效而不漏掉信息的抽象好像一个悖论,但在app实践层面,我们是这样处理的,可算是比较恰当地解决了这个矛盾。

统计抽象出 来的有限的 insights,trends 等,根据其突出程度,可以用各种方式前台展示给用户(词云,图表等),至于这些信息背后的无限量大数据相关信息和证据,则是通过即时搜索随时提供给用户。用户只要点击任何一个前台的情报,即时搜索立即呈现其相关信息,这个过程叫 drill down,是最受欢迎的大数据挖掘工具的feature,没有 drill down,挖掘不会完整,因为那样是不变应万变,排除了用户的动态参与,很难深度满足用户的信息需求和研究要求。

有效的工具应该帮助用户既看到森林,也看到自己感兴趣的树木。以与巴西世界杯主题相关的正面负面的行为情报挖掘为例。


词云之林



由林见木(drill down sound bites)


【置顶:立委科学网博客NLP博文一览(定期更新版)】



http://blog.sciencenet.cn/blog-362400-812347.html

上一篇:大企业的形象问题
下一篇:与农民工吃饭

2 周健 Vetaren11

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-1-21 20:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部