mpcer的个人博客分享 http://blog.sciencenet.cn/u/mpcer

博文

CiteSpace阈值设置杂谈

已有 21887 次阅读 2014-4-20 11:05 |个人分类:CiteSpace|系统分类:科研笔记| 阈值, 研究领域

CiteSpace在单个时间分区按阈值控制网络节点数量,满足阈值条件的引文才被可视化,有Top NTopN%ThresholdInterpolationSelectCiters4种设定方式。Top N选取被引次数最高的N个引文,TopN%先按被引次数排序再按百分比(N%)选取引文,这两种方式各时间分区的阈值完全相同。阈值插值(Threshold Interpolation)从被引频次ccitation)、两篇文献的共被引频次cccocitation)和共被引系数ccvcosinecoefficient)三个层次设置阈值,其中ccv计算公式为,其中cc(i,j)是文献i和文献j的共被引次数,c(i)c(j)是各自的被引次数,例如在某个时间分区里,文献i和文献j共被引2次,文献i被引4次,文献j被引3次,则ccv=2/sqrt(4×3)0.577。它在整个时间跨度的第一个、中间一个、最后一个时间分区分别设定阈值锚点,其余时间分区的阈值利用线性插值算法来计算,实现了不同时间分区阈值的个性化。选择施引文献(Select Citers)先根据引文记录中的TC字段值筛选施引文献,然后需再用Top NTopN%ThresholdInterpolation中其中一种方法作为阈值筛选施引文献中的参考文献。阈值调谐可依据Citespace软件界面左下角(Space StatusProcess Reports)数据处理报告的选中的引文数量、节点数和连接数量进行调整,确定合理的阈值需要进行反复的试算和比较。软件界面左侧Space Status文本框中space栏对应数值为该时间分区内引文的有效参考文献数目,题录字段缺失及重复的参考文献不计入,nodes指满足阈值条件的参考文献数目。Process  ReportsRecords within the chosen range的值指有效的引文数量,缺少参考文献的引文不记数。




https://blog.sciencenet.cn/blog-1313601-786713.html


下一篇:citespace时间分区(TimeSlicing)杂谈
收藏 IP: 119.34.150.*| 热度|

2 刘桂锋 胡小洋

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 19:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部