科学网之美——可视化科学网博文
已有 4342 次阅读
2012-8-15 18:32
|个人分类:科研工具|系统分类:科研笔记|
知识, 网络, 博文, 可视化, 词典
之前发的都是可视化科学网朋友网络的,今天来个博文的。
最近心血来潮抓了科学网一个月的热门博文和精选博文,然后又心血来潮的写了个不基于词典和先验知识的中文分词器。
那么生成博文网络就简单了,先对博文分词,并找出其前k个关键词(频率),然后两篇博文是否有联系就看他们有多少公共关键词。
下图就是通过上述方法得到的结果,感觉还是蛮好看的,分享一下......
来点局部的,文章内容还是蛮接近的
PS:吐槽一下科学网的标签获取系统,感觉还不如我这个简单的关键词提取程序呢,为啥提取的标签中能出现【的】这样的东西呢........,希望改进一下
https://blog.sciencenet.cn/blog-483379-602512.html
上一篇:
也说说我是如何获取文献的下一篇:
科学网博文的文字云