《镜子大全》《朝华午拾》分享 http://blog.sciencenet.cn/u/liwei999 曾任红小兵,插队修地球,1991年去国离乡,不知行止。

博文

新年新打算:【社媒挖掘】专栏开张大吉

已有 3530 次阅读 2012-12-30 04:37 |个人分类:社媒挖掘|系统分类:博客资讯|关键词:NLP,社会媒体,情报挖掘| NLP, 社会媒体, 情报挖掘

                               

                                 社会媒体印象(词云)



【立委按】我有一位很谈得来的同事,美国名校高材生,也曾是我的老板之一。六年多前是他不懈地紧追,每日一电,诚心可鉴,使我下决心加入了这家创业公司。他为人谦逊心细,对客户温情有加,我们没事儿聊天经常谈起产品的新想法。他最常说的话之一就是,eat your own dog food.  意思是,对于一个热衷高技术的人,对于自己开发的产品要有充分的信心,无论在开发过程中还有多少不完善、不尽如人意的地方,首先自己要时时刻刻的想到使用它,积累第一手的实际操作经验。如果自己的产品自己都不愿意用,这样的产品还有什么前途呢?圣诞已过,新年新打算,特开辟专栏【社媒挖掘】,利用自己主持开发中的中文社会媒体舆情挖掘系统追踪社会热点话题。特此通告,敬请垂注。所有话题的数据情报全部为电脑自动抽取整合,用的是我们独家语言技术,无任何人工干预 (of course, 对所挖数据情报的解说自然是主观的:不同的人对同样的世界的认识角度和理解不可能相同,也因此世界才变得多维、多层次,有新意)。除非特别说明,目前的数据源来自中文世界社会媒体过往一年的档案,繁体约五千五百万文档,简体文档高达三亿五千万。大约有一亿论坛帖子来自百度(贴吧等),两千多万来自搜狐,两千五百万来自天涯论坛。数据总量的70%为论坛的帖子,15% 来自博客。比较遗憾的是,社会媒体中影响最大的微博数据由于技术性原因暂时还未进入分析和索引。



http://blog.sciencenet.cn/blog-362400-647747.html

上一篇:【科学技术之云】
下一篇:新年好

7 李伟钢 陈安 曹聪 武夷山 蔣勁松 杨正瓴 章成志

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-3-27 10:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部