在路上.......分享 http://blog.sciencenet.cn/u/longxie1983 一念嗔心起,百万障门开

博文

科学网之美——可视化科学网博文

已有 4342 次阅读 2012-8-15 18:32 |个人分类:科研工具|系统分类:科研笔记| 知识, 网络, 博文, 可视化, 词典

之前发的都是可视化科学网朋友网络的,今天来个博文的。

最近心血来潮抓了科学网一个月的热门博文和精选博文,然后又心血来潮的写了个不基于词典和先验知识的中文分词器。

那么生成博文网络就简单了,先对博文分词,并找出其前k个关键词(频率),然后两篇博文是否有联系就看他们有多少公共关键词。

下图就是通过上述方法得到的结果,感觉还是蛮好看的,分享一下......


来点局部的,文章内容还是蛮接近的




PS:吐槽一下科学网的标签获取系统,感觉还不如我这个简单的关键词提取程序呢,为啥提取的标签中能出现【的】这样的东西呢........,希望改进一下


https://blog.sciencenet.cn/blog-483379-602512.html

上一篇:也说说我是如何获取文献的
下一篇:科学网博文的文字云
收藏 IP: 202.161.43.*| 热度|

6 郑继来 李伟钢 许培扬 林涛 李学宽 张玉秀

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-28 05:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部