博文

十年后，你的文章还会被引用吗——评谷歌遴选的图情经典论文精选

已有 7986 次阅读 2017-8-1 10:38 |系统分类:科研笔记

说明：本博客与微信公众号《林墨》同步更新，所有内容均为原创，可授权转载。请扫码关注《林墨》公众号。

谷歌遴选的图情经典论文具有哪些特征，清华大学杨超、李思敏与黄萃一一为你解读。

杨超李思敏黄萃 / 清华大学

注：图片中的10篇论文是由谷歌学术按照被引次数筛选的图书情报学领域TOP10论文

不知你是否想得起自己十年前发表的文章？如果自己都遗忘了，别人是否会记得呢？学术界确实有一些文章，随着时间的发展，不但不会沉寂，反而逐渐成为经典。今年6月，Google Scholar从2006年发表的论文中，按照被引用频次，评选出各领域的经典论文。我们从中摘录了社会科学（Social Science）领域下图书馆与信息科学(Library & Information Science)学科的10篇被引次数最高的论文，希望对读者有所启发。

从主题角度来看，有四篇文章（文章3、5、6、8）的研究都与h因子（h-index）有关；两篇文章（文章4、9）涉及开放存取（open access）研究；排名第一的文章1主要研究协作标签（collaborative tagging systems）的使用；其他三篇文章分别讲述文献计量软件citespace的具体应用（文章2）、网络信息的作者识别（authorship identification）问题（文章7）期刊影响因子（Impact Factor）的新计算方法。

从文献所在期刊角度来看，发表在科学计量权威杂志Scientometrics上的文章多达5篇，占据了一半；Journal of the American Society forInformation Science and Technology （现更名为Journal of theAssociation for Information Science and Technology，简称均为JASIST）有2篇；其他期刊各一篇。值得注意的是，文章“Ten-yearcross-disciplinary comparison of the growth of open access and how it increasesresearch citation impact”来自开放存取数据库arXiv，而文章本身也讲open access，可称得上论据充足。

进一步的，我们对文章参考文献进行了分析，被引频次较高的期刊分别为Nature、Scientometrics、PNAS、JASIST、Information Processing & Management，有趣的是，在期刊共被引网络（期刊引用构成的网络）中，Scientometrics作为被引较高的期刊，其中介中心性较高，这表明，它是联系不同期刊的桥梁。

通过分析文章所引用的学者，发现被引频次较高的作者为Hirsch JE、Ball P、Braun T、Batista PD、Garfiel DE、Moed HF等，这些作者的研究多涉及open access和文献计量指标，如Hirsch JE设计了h-index指标。

这些文章为何能够历久弥新，十年之后仍获较大关注呢？这主要在于它们的“工具性”，即其研究内容为其他研究提供了基础工具、规划了解决方案的框架。例如，排名第一的“Usage patterns ofcollaborative tagging systems”，该文主要介绍协作标签（Collaborativetagging）在知识共享过程中的应用和特征。文章不但详细介绍了协作标签系统的结构及其动态特征，而且提出了协作标签动态模型，为后来研究打下了基础。再例如，排名第二的 “CiteSpace II:Detecting and visualizing emerging trends and transient patterns in scientificliterature”，本身就是一个对软件citespace使用的经典案例，其他研究者可依据该案例指导自己的可视化分析流程。

最后，我们将十篇文章的摘要翻译附于文末，以供感兴趣的读者查看。

附录——图情高被引论文摘要选译

1. Usage Pattern of Collaborative Tagging Systems

协作标签使得用户可以用标注关键字的形式将元数据添加到共享内容之中。最近，协作标签在网络上越来越流行，它允许用户标记书签，照片和其他网站内容。本文分析了协作标签系统的结构及其动态特征。本文还提出了一个协作标签动态模型，该模型可以预测标签稳定模式，并将它们与共享知识联系起来。

2. CiteSpace II Detecting and visualizing emerging trendsandtransient patterns in scientific literature

本文介绍了如何在科学文献中识别和可视化新兴主题发展趋势和动态发展模式，并描述了相关研究的最新发展。本研究为知识领域可视化作出了重要的理论和方法贡献。一个特征被概念化和可视化了，以表征“研究前沿”和“知识基础”之间的时变二元性。研究前沿被定义为一组新出现的概念和潜在研究问题。研究前沿的知识基础被定义为科学文献的引用和共引轨迹，即由被引用科学文献构成的演化网络。

3. Theory and practise of the g-index

g-index是对h-index的改进，用以测度一个论文集合的引用表现。如果这个文章集合按照被引次数降序排列，则g-index是其中最大的数字，使得前g篇文章至少被引用g^2次。本文以普赖斯奖获得者为研究对象（职业生涯：1972-目前），计算其g-index，并将其与h-index进行比较。结果表明g-index继承了h-index的良好特性，而且，g-index更好地考虑了顶级文章的引用分数，这可以更好地区分科学家的学术成就。

4. Citation advantage of open access articles

开放获取（OA）是否能加快我们对研究结果的识别和传播，是有争议的。本文是针对2004年6月8日至2004年12月20日在PNAS上发表的OA和非OA文章的纵向文献计量分析。本文一共分析了OA文献212篇（占全部文献的14.2％），非OA文献1,280篇（占85.8％）。在期刊网站上直接发表的OA文章比自我归档或其他可公开访问的OA文章（未在学术期刊上发表）具有更高的影响力。强有力的证据表明，即使在图书馆广泛使用的杂志上，OA文章也比同期刊物上发表的非OA文章更能被同行认可和引用。

5. Comparison of the Hirsch-index with standardbibliometric indicators and with peer judgment for 147 chemistry researchgroups

本文指出了h指数和几个标准文献计量指标之间的统计相关性特征，以及h指数与同行评议结果的相关性特征。我们利用荷兰147所大学化学研究小组进行了大量评估研究，涵盖了1991- 2000年期间约700名高级研究人员的工作。结果表明，h指数和常用文献计量指标都与同行评议结果相符。但是对于拥有较少引用量的小研究团体，常用文献计量指标似乎更适合用于评价研究产出。

6. A Hirsch-type index for journals

本文提出了一个面向期刊的h型指数（与评价作者的h-index相似），即：如果目标期刊已经发表了h篇论文，且每篇论文至少有h个被引，那么该期刊的h指数是数值“h”。这对期刊影响因子是一个有益的补充。

7. A framework for authorship identification of onlinemessages Writing‐style features andclassification techniques

随着互联网技术和应用的迅速普及，不当甚至非法的网络信息滥用已成为社会的关注点。在线消息的“匿名”性质使身份追踪成为一个难题。我们开发了一个用于识别网络信息作者身份的识别框架，以解决身份追踪问题。在这个框架中，我们识别并提取四种写作风格特征（词汇，句法，结构和内容），并使用归纳学习算法构建基于特征的分类模型来识别在线消息的作者。以英文和中文在线新闻组消息为数据源的实验结果表明，本文提出的方法能够识别在线消息的作者，准确度为70％至95％。

8. Is it possible to compare researchers with differentscientific interests

一名科研人员的h指数是指他至多有h篇论文分别被引用了至少h次，该指数常被用来评价个体学者的科研产出。这个指标在很多方面都具有鲁棒性，但也受研究领域影响。本文提出了一个改善的指数h_I=h⁄〈N_a〉=h^2⁄(N_a^((T) ) )，其中N_a^((T) )是所考虑的h篇论文中作者的总数。一个研究者如果具有指数h_I，那么表明他拥有h_I篇论文分别被引用了至少h_I次（间接展示了他/她独自发表论文的能力）。我们获得了四个巴西科学团体的h和h_I排名。与h指数相反，h_I指数图塌陷成一条单一的曲线，允许对不同领域的学者进行比较。

9. Ten-year cross-disciplinary comparison of the growthof open access and how it increases research citation impact

Lawrence2001年发现，在计算机科学领域，网络上可公开访问的文章（OA文章）比那些非OA文章获得了更多的被引量。我们在物理学领域发现了同样的情况。为了进一步检验该特性的跨学科一般性，我们使用10个学科（生物，心理学，社会学，卫生，政治学，经济学，教育，法律，商业，管理）在12年间（1992-2003）发表的1,307,038篇文章进行了验证。在同一期刊中，OA和非OA文章比较，OA文章同样被更多引用，被引优势依据学科和年度的不同，在36％-172％间浮动。我们未能从这些数据中发现明显的因果关系，但是根据我们以前在物理学领域的发现，OA文章的被引优势不太可能是因为作者的选择偏好。

10. Journal status

一个演员的社会地位通常由两个因素决定：该演员（A）从其他演员（Bs）获得的认可的数量，以及演员Bs的知名度。这两个因素反映了演员具有人气（popularity）和被专家欣赏之间的区别。ISI影响因子（ISIIF）被定义为：杂志在两年内收到的平均被引次数。因此IF是一个评价流行性的指标，而未考虑引用者的威望。本文展示了如何使用“加权PageRank”算法对期刊进行全面的度量（考虑流行性和威望）。我们比较了这两种方法（IF和加权PageRank）下的期刊排名，并对两个分析结果的异同点进行了分析。此外，我们还引入了Y因子（它是IF和加权PageRank的简单组合），并发现由此产生的期刊排名与人们心中的期刊排名认知基本一致。

转载本文请联系原作者获取授权，同时请注明本文来自李江科学网博客。
链接地址：https://blog.sciencenet.cn/blog-1792012-1068995.html

上一篇：为什么期刊影响因子不适合评价科学家个人的学术成就？
下一篇：撤稿对作者会产生什么影响？

收藏 IP: 183.157.160.*| 热度|

林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

十年后，你的文章还会被引用吗——评谷歌遴选的图情经典论文精选

当前推荐数：11 推荐人：王启云 武夷山 吕洪波 黄永义 徐耀 郑永军 张骥 徐绍辉 shenlu xlsd biofans

该博文允许注册用户评论请点击登录评论 (2 个评论)

李江

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

林墨分享 http://blog.sciencenet.cn/u/ZJUlijiang 分享以科学家为对象的研究论文

博文

十年后，你的文章还会被引用吗——评谷歌遴选的图情经典论文 精选

当前推荐数：11 推荐人： 王启云 武夷山 吕洪波 黄永义 徐耀 郑永军 张骥 徐绍辉 shenlu xlsd biofans

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

李江

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

相关博文

十年后，你的文章还会被引用吗——评谷歌遴选的图情经典论文精选

当前推荐数：11 推荐人：王启云武夷山吕洪波黄永义徐耀郑永军张骥徐绍辉 shenlu xlsd biofans

该博文允许注册用户评论请点击登录评论 (2 个评论)