||
具体操作可看The CiteSpace Manual 的论文。下面是我自己理解将数据可视化部分的简单用法。
1、聚类
聚类能更精准的分析领域里研究方向和热点的分类。
首先点击首行菜单栏的,然后窗口的右上角看到#clusters就代表聚类完成。左上角显示的是整个聚类网络的一些特性。参数modularity和mean silhouette是告诉我们整体框架的特征的重要参数。例如modularity q = 0.7141代表指数高,整个网络是被分为了松耦合的集群。mean silhouette = 0.5904代表所有集群的同质化程度平均都不高也不低。
通过点击,可以看到每个聚类集群的情况。Silhouette列代表聚类集群的同质性。假设所有聚类集群的大小一样,Silhouette值越高,那个聚类集群里的成员越一致。如果某个聚类集群的容量太小,高同质化参数是没有意义的。average year of publication代表是最新的论文形成的还是老的论文形成的。
2、生成聚类的标识
CiteSpace 可以从文章标题,关键词列表,摘要三个方面标识论文。聚类标识按照聚类集群的容量降序排列的。为了能更清晰的看到聚类标识,可以选择改变如下:
3、主要研究领域
为了完整清晰呈现主要研究领域,将有些细节可以隐藏
图中的1、2、3刚好对应下面的(1)、(2)、(3)
(1)节点大小
(2)集群标识大小
根据标识的大小决定是隐藏还是显示,或者改变标识里的字体的大小
(3)连接的透明度
4、主要研究领域的关联
为了弄清楚这个,我们需要在图中恢复连接。CiteSpace用紫色线来标明高连接度的节点。色彩越往紫色走,代表连接度越高。通过点击
第一个符号的菜单,就可以看到连接的线。
5、最活跃的研究方向
在CiteSpace里的爆发点检测算法是Kleinberg 算法。
可以生成爆发点的总结图。通过图可以看出是从哪些文献开始爆发的,并且发生在什么时候。这方法也可以运用到其他节点类型上。
6.主要的研究领域是研究什么的
为了更深入地研究各个集群,可以点击
然后会出现一个装有四个面板的窗口:1、Clusters,2、Citing Articles.3、Cited References,4、Summary Sentences。
只有你点击Clusters,2、3才会出现内容。
Citing Articles:每一条是指引用了这个Cluster里的一篇论文的论文,每条前面的数字代表引用的比例即引用了这个集群的多少程度。黄色标明的那个词语就是在整个可视化图里显示的那个词语,同时它也在top terms里。
Cited References:代表了自己的集群引用的文章。前面的数字代表引用的次数。同时还给出了文章的其他信息。
Summary Sentences:点击开始按钮,然后会抽取这个集群里所有摘要中最有代表性的句子
7、时间线视图
点击右侧的Timeline单选按钮,然后你就能看到水平线上的各个集群视图。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 19:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社