|||
【这是1973年,Small H首次提出了同被引概念的论文】
在研究科学论文之间关系的时候,文献之间的引用一直以来都是众多研究者广泛使用的手段。在探索文献之间关系的道路上,引文耦合【bibliographic coupling,台湾译成书目对,感觉更加亲民一些】的提出要早于同被引,而同被引则一直不受重视。可能的原因是引文耦合链接起来的是来源文献,就是现在的文献;而同被引链接的是被引文献,也就是旧的文献。因此,Small着重探讨同被引与引文耦合的区别,用一个物理学的实例来说明同被引与引文耦合显著不同,但是和直接引用很一致。
同被引的测量
两篇被引论文或者图书的同被引频次(强度)可以利用SCI的引文索引十分容易地得到。一对儿论文中的每一篇论文都可以在SCI的引文部分定位,然后得到引用该篇文献的来源文献列表,浏览这些来源文献中的相同部分就可以确认出两篇被引文献的同被引频数。相同的来源文献就是指新近发表的引用了该两篇被引论文的文献。因此,同被引强度就是两篇早期发表的论文被后来文献共同引用的次数。
必须是很多作者同时引用某两篇文献才能使其达到较高的同被引次数。所以,同被引是一种由引用者建立起来的关系。在测量同被引强度的时候,我们测量的是两篇论文之间被众多引用作者所共同认可的的关系或者相关性。进而言之,由于存在这种对引用者的依赖性,这种关系会随着时间变化而变化,就如同词汇共现也会随着该领域的演变而发生变化一样。而引文耦合则是固定的永恒的关系,因为引文耦合依赖于一对儿文献中含有的参考文献。因此,同被引会随着该领域的兴趣和知识模式的变化而变化。
当两篇论文同被引频次较高的时候,这些论文本身被引的频次也很高。如果高被引论文代表了某一领域的重要概念、方法和实验,那么同被引就能描绘出这些重要思想的诸多细节。它更加客观表达某一学科专业的知识结构,如果再加上随时间变化,就可以探索学科发展的机制了。
同被引分析的实例
【我比较关注共现分析中具体的操作步骤,因此仔细研究了首个同被引分析中采用的方法】
样本的采集:采取了循环法:先找到一篇高被引论文,找到在1971年SCI第一季度上所有引用该论文的来源文献,然后再找这些论文的参考文献,取出其中被引次数超过10次的文献作为重要论文。所有这些重要论文的同被引关系用前述方法确定。图1显示的是10篇论文的网络关系,应该强调这10篇论文并不代表该学科所有的高被引论文,它们可能是这个领域的核心文献。
该如何解释同被引强度?在某些情况下,我们看到一些被该领域物理学家强烈认可的关系,例如,1971年有50篇论文的作者同时引用了Gell-Mann(68)和Glashow(68)的论文,我们检查了Gell-Mann(68)的论文,发现Gell-Mann不仅仅直接引用了Glashow的论文,而且还在文章中讨论了Glashow与自己研究工作的相似性:“许多作者也在这个方向上采取了同样的步骤,特别是,Glashow和Weinberg的工作与我们最为密切。进一步将,这些论文也有强烈的引文耦合关系,它们有5篇共同的参考文献。根据这个例子,人们也许自然会假设同被引和引文耦合一样用来测量主题相似性。但是,在其他例子里却看不到同被引和引文耦合强度如此的一致。
表2显示了同被引和引文耦合之间缺乏任何清晰的关系,尤其是在Lovelace(68)和Veneziano(68)之间,图中显示了较强的同被引关系,而它们只有1篇相同的参考文献。阅读Lovelace的文章会发现,该文因何与Veneziano如此密切相关,进而言之,又为何与Gell-Mann的工作相联系:“近来Veneziano提出了一个简单的公式......”Lovelace以一种新的方式应用Veneziano公式,因而与Gell-Mann的手征测量工作建立起联系。如此一来,两篇同被引强度很大的论文却具有很弱的引文耦合关系,尽管它们在内容上明显有联系。
在表2中9篇论文应该具有36条耦合关系中,有8篇论文间有高同被引关系(6次以上)但是根本没有引文耦合关系;11篇具有很强的同被引关系(15次以上),其中8篇的引文耦合仅为1或者0。这些结果表明,在评价主题相似性方面,引文耦合不如同被引可靠,尽管同被引可以反映被引论文之间在语义上的相关性,与其他共现方式类似。引文耦合可以用于代表特定论文的论文集合,在论文被引用之后,同被引也可以形成这些集合,但是目前的数据表明这两种分类的方法显著不同。
结论
看起来,对强同被引重要意义的解释既要依赖于主题相似性的理念,也要依赖于思想的相关或者共现。我们已经确信在很多案例中这种测量指标反映了直接引用关系的存在并与该领域中重要的知识联系相对应。马上可以看到在信息检索上的两种应用,基于高被引论文的二次索引可以通过引文索引进行序列检索,在每一个同被引点上检索到一系列新文献。第二,利用同被引可以建立起一个特定专业早期文献的类或者“核心”,这个核心可以当做该专业的“概貌”,由此成为SDI(科学发展指标?)系统的基础。
同被引另外一种应用领域是对科学专业结构研究。关键论文之间联系方式建立起专业的结构或地图。由此观察随时间变化情况。通过对这些结构变化的研究,同被引提供了一种监测科学领域发展的工具,评估专业之间相互关联程度的评估工具。
论文间直接引用可以作为论文之间同被引关系强弱的指标,即:一篇论文被其它论文引用。图1显示最强同被引联系往往存在于直接引用关系中。对于11例强同被引关系(大于15次)中,有8个具有直接引用关系。实际上,所有的直接引用都具有5次以上的同被引关系,其中很多同被引次数很高。直接引用论文之间平均同被引次数为17.8,而没有直接引用关系的论文之间的平均同被引次数只是4.9。另一方面,有9篇同被引次数超过6次的论文间没有直接引用关系。如此说来,直接引用不能预测某一领域中论文间所有的强同被引关系,尽管要比引文耦合更好一些。
详细检验了每一对同被引文献在内容上的联系,认为同被引要比引文耦合更表现主题相似性。同被引与引文耦合的优劣,与直接引用的关系。应用前景:同被引表明了主题相似性,或者思想上的相关或者共现。这种方法可以用于表明某一领域重要的知识上关联,可以用于信息检索,比如生成高被引同被引论文的二次索引,可以进行下一步检索。也可以用同被引建立一个特定学科的早期的簇或者核心,这个核心可以当做该学科专业的概貌图,成为学科发展指标系统的基础。另外,可以用于研究学科专业的结构,重要论文之间的联系方式可以用来表现结构或者绘制图谱,并观察其随时间变化情况,因此同被引提供了一种检测科学领域发展,并评估专业之间相互联系深度的工具。
Small, H. Co-citation in the scientific literature: A new measure of the relationship between two documents. J. Am. Soc. Inf. Sci. 1973, 24 (4), 265-269
1974年,Small和Griffith首先尝试使用同被引分析某一学科,他们使用磁带版的SCI1972年第一季度的数据,通过将高于一定阈值的同被引文献聚集到一起【是同被引次数,不是被引次数?】,作者最终生成了一些类簇,通过分析引用文献的标题发现这些类在字面上具有一致性
Small, H. & Griffith, B.C. (1974). The structure of scientific literatures 1: identifying and graphing specialties. Science Studies, 4, 17-40.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 01:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社