钱建立-花开满地分享 http://blog.sciencenet.cn/u/paperopen 《电子设计工程》杂志社 西安知先信息

博文

参考文献和引文分析的作用和发展

已有 10450 次阅读 2008-9-1 22:50 |个人分类:期刊网络化|系统分类:科研笔记

  一项科学研究取得的新成果通常是在前人成果的基础上的新进展,它体现着科学科技的继承和发展。如,基于已有的理论、方法、思想、实验手段等,使本研究获得了新进展,有了新发现;或是将一个学科中的方法移植到另一学科中并取得成功;或是对已有方法做了改进。当在论文中叙述研究目的、设计思想、建立的模型、与已有结果进行比较的时候,就要涉及到已有的成果。如果在涉及到前人成果的地方再把已有成果的具体内容抄到论文当中,不但占去论文的篇幅,冲淡论文的主题,而且抄写这些已发表过的、读者可以查找到的内容是毫无意义的。所以,在论文涉及到已有成果的地方,不去重抄已有的成果,而是指出登载这个成果文献(出处),这种做法叫做引用参考文献。
  引用了参考文献,就要在涉及前人成果的地方做一个标记,见到这个标记,读者就知道在这里引用了参考文献;按照这个标记在参考文献表中就能找到刊登这个成果的详细内容的文章。在正文中引用参考文献的地方加一个标记,称为参考文献的标注。标注的方法称为标注法。标注法系有两种[1],分别是是顺序编码制(numeric references method)和和著者一出版年制(first element and date method)。顺序编码制中,参考文献表按引文的序号排序;著者一出版年制中,引文采用著者一出版年标注,参考文献表按著者字顺和出版年排序。
  对于一篇完整的学术论文,参考文献的著录是不可缺少的。归纳起来,参考文献著录的目的与作用主要体现在以下5个方面。
  1) 著录参考文献可以反映论文作者的科学态度和论文具有真实、广泛的科学依据,也反映出该论文的起点和深度。科学技术以及科学技术研究工作都有继承性,现时的研究都是在过去研究的基础上进行的,今人的研究成果或研究工作一般都是前人研究成果或研究工作的继续和发展;因此,在论文中涉及研究的背景、理由、目的等的阐述,必然要对过去的工作进行评价,著录参考文献即能表明言之有据,并明白交待出该论文的起点和深度。这在一定程度上为论文审阅者、编者和读者评估论文的价值和水平提供了客观依据。
  2) 著录参考文献能方便地把论文作者的成果与前人的成果区别开来。论文报道的研究成果虽然是论文作者自己的,但在阐述和论证过程中免不了要引用前人的成果,包括观点、方法、数据和其他资料,若对引用部分加以标注,则他人的成果将表示得十分清楚。这不仅表明了论文作者对他人劳动的尊重,而且也免除了抄袭、剽窃他人成果的嫌疑。
  3) 著录参考文献能起索引作用。读者通过著录的参考文献,可方便地检索和查找有关图书资料,以对该论文中的引文有更详尽的了解。
  4) 著录参考文献有利于节省论文篇幅。论文中需要表述的某些内容,凡已有文献所载者不必详述,只在相应之处注明见何文献即可。这不仅精练了语言,节省了篇幅,而且避免了一般性表述和资料堆积,使论文容易达到篇幅短、内容精的要求。?
  5) 著录参考文献有助于科技情报人员进行情报研究和文摘计量学研究。
  Eugene Garfield发现[2],通过引文数据分析(其后发表的论文对该论文的引用情况)可以作为某篇论文的学术影响的判断,被引用次数多的论文,其影响力就越大。通过对引文的分析,还可以发现那些研究人员做了哪些后续的研究,还可以分析出这个领域的研究热度等。
  基于这个发现,Eugene Garfield建立了Thomson公司,推出了自己的产品-SCI(Science Citation Index),通过科技论文的引文分析,向科研人员推荐那些价值较大的论文。目前SCI已经成为了研究人员了解最新研究成果的最重要的工具之一。
  需要说明的一点就是:SCI是二次文献数据库,仅仅提供了收录论文的标题、摘要、作者、期刊、出版时间想信息,本身不提供全文。现在其互联网版,大部分论文给出了全文的链接,链到了出版单位的数据库。但是这些全文文件还是存储在出版机构的数据库中,SCI没有把这些论文的全文文件放在自己的服务器上,提供的仅仅是链接。
  国内最早从事引文分析就是中科院的科学引文数据库。目前万方、知网也都建立了引文数据库。这三个引文数据库都是对中文期刊引文数据库。
  SCI在建立之初,引文分析是通过人工完成的,目前也没有完全实现自动引文分析,还有就是其引文分析受限于其收录的期刊。在1997年,Robert D. Cameron提出了基于互联网来建立全球科技文献数据库的设想[3]。但是仅仅是个构想,因为Cameron需要出版机构或者作者要花费额外的精力去上传论文的关键元数据。
  NEC研究院从1998年推出了Citeseer,另辟蹊径,通过网络爬虫(Crawler)来自动获取互联网上存在的论文全文而不是要求出版机构提供排版文件或者印刷论文,并通过数据抽取(Information Extraction)自动抽取出引文内容,并分解成一个一个的引文,实现了引文的自动分析,是第一个实用的ACI(Automatic Citation Indexing)系统[4, 5]。2008年全面改版,新版的网址为:http://citeseerx.ist.psu.edu/。截止2008年6月9日,目前其数据库已计算机信息领域的Postscript和PDF文件格式的学术论文超过107万篇论文,主要涉及计算机科学领域,涉及的主题包括:互联网分析与检索、数字图书馆与引文索引、机器学习、神经网络、语音识别、人脸识别、元搜索引擎、音频/音乐等。
  Citeseer是最早的也最有影响的计算机领域的OA资源,目前国内外的论文平台都受到其影响,例如其首先推出的研究热度、被引论文、同引论文等已经在国内知网等平台得到了应用。Citeseer收录的论文来源大多是一些国际会议文集,还有一些知名期刊的部分论文,包括了IEEE的很多期刊。CiteSeer收录的论文大多来源于作者和机构的自存档。CiteSeer自称是全球最大的科学文献免费全文索引。广西大学图书馆黄日昆老师[5]曾受理过一用户索取学术全文请求。用户在INSPEC和Ei Compendex文摘型数据库查到14篇有关计算机学科方面的文摘,多为会议文献。经检索广西大学购买的几个国外全文数据库与馆藏书刊,只获得其中的一篇期刊全文,使用Citescer检索,检索出其中的l2篇并成功下载全文,由此可见Citeseer并非名不副实。
  Cameron的设想正在由TimBrody博士实现,Tim博士建立的Citebase在尝试进行建立全球引文数据库的努力。Citebase(http://www.citebase.org/)是始于1999年为期3年的开放引文计划(OpenCitationProject)的产物,是英国南开普顿大学引文分析专家以及美国康奈尔大学数字图书馆数据管理专家合作之结晶,主要负责人为TimBrody,2005年开始提供服务。其主旨面向网上公开获取的论文,提供电子印本库的参考与链接服务,与此同时提供引文与影响分析。当一篇新文章以电子印本的形式存储或发表,Citebase将自动检索并在搜索引擎中标引,并链接其参考文献,继而在Citebase中生成一个该文的OAI(OpenArchivesInitiativeProtocolforMetadataHarvesting)标识符。系统支持依据引用文献的作者、提名、文摘关键词、出版物名称(PublicationTitle)、创建日期(CreationData)以及OAI识别号检索,并可按照创建日期、最新更新日期、论文被引量、作者被引量、作者点击率,文章点击率等多种准则排列检索结果。其中,点击率涉及1999年8月至今的数据,并仅限于英国Arxiv镜像站的资料。并采用图示显示文献被引率、点击率随时间的发展情况,因而可直观判断文献的影响及研究热点。应该说明的是,目前Citebase采用英国UTF-8编码框架,结果为精确匹配。对于每一篇文献,Citebase提供了:①文章引用或点击历史;②该文参考文献列表;③引用该文的前5篇文章(依文献被引量排列,亦可选择显示引用该文的所有文章);④与该文同被引的前5篇文章(亦可选择与该文同被引的所有文章),并且通过链接,由一篇文献可无限延伸下去,充分体现了引文索引滚雪球式的扩展功能。

作者注:本文前半部分内容不是自己的,后半部分是自己收集阅读的一些内容思索后的提炼。
目前本人正在开发一个科技论文引文分析系统(是“开网”www.paperopen.com的一部分工作),因此就搜集了一些这方面的资料。


References:
[1] GB/T 7714-2005. 文后参考文献著录规则[S]. 中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会, 2005.
[2] Garfield E. Citation Indexing -- Its Theory and Application in Science, Technology, and Humanities[M]. Wiley. New York, 1979.
[3] Cameron R D. A universal citation database as a catalyst for reform in scholarly communication[J]. First Monday, 1997, 2(4).
[4] C. Lee Giles, Kurt D. Bollacker S L. CiteSeer: An Automatic Citation Indexing System[C]. ACM Press, 1998.
[5] 黄日昆. 网络引文搜索引擎CiteSeer评析[J]. 情报杂志, 2004(2004年 06期): 031.


 



论文写作
https://blog.sciencenet.cn/blog-65283-36965.html

上一篇:一厢情愿的“印刷版期刊会一直存在”
下一篇:开放存取的昨天和今天
收藏 IP: .*| 热度|

1 王志明

发表评论 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-22 17:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部