Hindawi的博客分享 http://blog.sciencenet.cn/u/Hindawi

博文

实现可发现性:出版机构为什么要公开他们的参考文献列表而作为研究人员的你可以为此提供哪些帮助

已有 1383 次阅读 2019-5-30 16:49 |系统分类:观点评述

 

最近,公开引用倡议Initiative for Open Citations发布了一项公告,呼吁包括研究人员在内的所有利益相关方,与他们所熟悉的出版机构和学术团体就开放其有索引的参考文献列表进行对话。对于目前已公开的论文元数据而言,扩大其规模可增加作者(和出版机构)著作的可发现性,并且最终有助于形成一种新的更加开放和严谨的方法来评估研究人员——这也是《开放科学(Open Science)》的根本目的。

“公开引用倡议”(I4OC)发布四个月以来,几乎有50%的有索引的学术参考文献已实现对外公开——总计约1600万份。这一成果的实现有赖于相关出版机构支持力度的不断加大,其中包括出版《科学》杂志和《美国科学院院刊(PNAS)》的美国科学促进会(AAAS)以及其他几家社会团体的出版机构,包括美国物理协会(American Physics Association)、美国物理联合会(American Institute of Physics)、美国细胞生物学学会(American Society for Cell Biology)、美国生物化学和分子生物学学会(American Society for Biochemistry and Molecular Biology)以及电化学学会(Electrochemical Society)。同其他参与该倡议的出版机构一样,上述出版机构也呼吁Crossref——一家旨在为学术出版机构提供支持的服务机构——“按动开关”,将曾经为各出版机构自有的数据公开。

Crossref是一家学术材料出版机构成立的成员组织(学术材料包括:期刊和期刊论文、图书和图书章节、会议论文集和会议论文、报告、工作论文、标准、学位论文、数据集和预印本)。从某种程度来说,该组织类似于一个复杂的数字接线盒(来自CrossrefJennifer Lin)将其描述为“一张学术地图”)。Crossref致力于为学术文献提供稳定一致的数字路标,从而使研究人员及其他人员在在线寻找信息时,能够更快地链接并找到这些信息。出版机构成员可以通过Crossref对其出版内容进行注册,具体方法是,将格式多样的相关输出的信息(即“元数据”)进行存储,而Crossref会将这些信息全部转换成XML格式。这其中包括注册一个永久的数字对象标识符——DOI——而输出(例如一篇发表的论文或者一份预印本)所对应的数字对象标识符都是唯一的,以此确保该输出的绝对可发现性。Crossref负责管理这些元数据。尽管Crossref主要是一家(DOI)注册组织,但它还同时提供一系列实用的服务。其中包括也许是研究人员最为熟悉的“cited by(引文)”服务——该工具可帮助用户有效了解论文的引用情况。出版机构需要缴纳费用方能成为组织成员,并且Crossref为其注册的每一个DOI都会产生一笔很小的费用

如果你希望在线找到你所需要的信息,那么元数据(一种描述数据的数据)的重要性不言而喻。如果你的论文未能关联高质量的元数据,你的论文依旧可以被发现——不过在这种情况下,你所能采用的最好方法只能是,将论文打印出来,然后将其分享给朋友和同事,或者摆到一座公共图书馆的书架上[1]。元数据之所以重要是因为,它是一种数字标签,能够告诉你的电脑(或者你的文本和数据挖掘软件)“这是题目”、“这是摘要”、“这是作者姓名”、“这是他们的单位”以及“这是一张图”等。

作者在论文结尾部分列出的参考文献(或者参考资料)作为元数据的一部分由出版机构提供给Crossref。这些参考文献为上面提到的“cited by(引文)”服务提供了基础。作为作者,你需要认真考虑你所要引用的能够支持你的论据或观点的文献。此外,由于编辑通常会对你所能列出的参考文献进行数量限制,因此这将促使你更加谨慎地引用文献。如此一来,当读者希望进一步了解论文主题时,你的参考文献列表便可以作为一种得到专业管理的论文过滤工具,为其提供参考服务——它是一种极具价值的科学资源(从最广义的角度来讲),但因限制的存在导致至今未能得到充分利用。

为客户生成元数据是一项价值被低估的出版机构服务(指通过订阅或文章处理费(APC)等方式支付的极具价值的服务)。并且生成的绝大部分元数据都可以通过Crossref供任何人使用或挖掘或以此为基础创建服务(也就是说不仅仅包括Crossref)。然而,令人费解的是,带有参考文献的元数据却不是这样的——这种元数据默认是封闭的,不公开。最重要的是,出版机构成员必须对Crossref授权后,这些数据才能公开。

I4OC的创始人(包括本人)无法理解这些元数据为什么不能使用。尽管如此,绝大多数出版机构成员(约3000家)还是免费向Crossref提供了这些元数据,并公开了其他元数据。我们认为,此类元数据未能实现公开的主要原因在于,出版机构未意识到此类元数据是自有的,或者出版机构不了解这些元数据需要授权才能公开——而出版机构仅需向Crossref发送一份电子邮件就可以完成授权。因此,我们目前已着手和最具规模的出版机构洽谈并呼吁其“按动开关”。

我们得到了这些出版机构的积极回应,这也是我们洽谈成功率接近50%的原因所在。还有一部分原因在于,此举的理论根据是显而易见的——这些数据实现免费使用将为出版机构和研究人员带来收益,这主要是因为这可以使出版机构所出版的内容更容易被读者发现。

然而,这方面的更大收益目前尚未体现出来。尽管I4OC只发布了短短数月时间,但我们已经看到了它所蕴含的潜力。这些新生的元数据正以创新的方式得到应用。举例来说,维基数据(Wikidata)便很好地对外提供了某篇特定论文在一定时期内的引用情况。这篇论文即乌尔里希·里麦里Ulrich Laemelli)在《自然(Nature)》发表的一篇具有特殊影响力的论文。该论文阐述了一种新的噬菌体内未知蛋白质的电泳显现法。如图1所示,这是一个引文方面的经典案例。

1.png


1.里麦里(Laemelli),英国(1970年)—《T4噬菌体头部成型期间的结构蛋白质的差异(Cleavage of Structural Proteins during the Assembly of the Head of Bacteriophage T4)》自1970以来的逐年引用情况。《自然》227,第5259,680—85页。数字对象标识符:10.1038/227680a0数据来自维基数据Wikidata英文维基百科English Wikipedia| 编码来自GitHub资源库 | 存储平台:维基媒体工具实验室Wikimedia Tool Labs,该平台为维基媒体基金会Wikimedia Foundation)推出的一项服务| 内容许可: CC0数据许可、CC-BY-SA文字和媒体许可。

更有趣的是,你和其他研究人员不仅可以查找都有谁引用了里麦里的论文,还可以找出都有哪些人引用了曾引用里麦里论文的作者的论文,从而确定里麦里所提出观点的影响力(图2)。

2.png

2以上部分引用图显示了乌尔里希·里麦里(Ulrich Laemmli1970年经典论文的一些引用网络。数据来自维基数据Wikidata英文维基百科English Wikipedia| 编码来自GitHub资源库 | 存储平台:维基媒体工具实验室Wikimedia Tool Labs,该平台为维基媒体基金会Wikimedia Foundation)推出的一项服务| 内容许可: CC0数据许可、CC-BY-SA文字和媒体许可。

这些分析的类型本身并不新颖。目前已有很多经验丰富的研究人员从事该领域的工作(他们往往还要向其他平台提供方为此类数据支付大笔费用),并且正在开展更为复杂的分析。尽管仍有人希望加入这些研究人员的行列,但他们却无法获得所需要的元数据。

然而,当独立研究人员开始掌握此类数据时,以上这些案例就会开始表明此类数据的潜在力量。举例来说,如果你能够获得与你本人著作有关的此类信息,你便有机会同你不认识的研究人员进行合作,即使他们的引用与你论文的联系有两步或更多步的距离(可能处于不同的专业领域)。此外,包括开放引用OpenCitations)在内的其他组织正在开发一种结构化的引文链接数据库,这种数据库可以提供更加具体的信息——不仅包括谁引用了谁,还包括引用者对论文是持积极态度还是消极态度。毕竟有许多“经典引文”只是因为其存在瑕疵才得到引用的。

这已开始将学术影响力的评估方法推向一个全新高度,并再次对当前的评估系统提出了疑问。在当前评估系统下,对于研究人员的评估,只是基于其论文在某家期刊的平均引用数(影响因子),而这种数据往往比较肤浅。这也是资金赞助单位,如Wellcome基金会、盖茨(Gates)基金会和斯隆(Sloan)基金会之所以以利益相关方的身份支持I4OC的原因所在。除这些基金会外,还有许多其他组织也加入了利益相关方行列,包括最新加入的荷兰国家图书馆(LIBER)、大英图书馆(British Library)、微软研究院(Microsoft Research)和艾伦人工智能研究所(Allen Institute for Artificial Intelligence)。

好消息是,在这条路上,我们已经完成了近50%(至少从Crossref索引的元数据的角度来看),但我们还有另外一半的路要走。此外,尽管已有一些大型出版机构(无论其商业模式如何)对该倡议进行了积极支持[2],但Crossref1000家成员出版机构仍不知道他们可以这么做。这些出版机构几乎都很小,但它们却可以组成参考文献“长尾”,只是需要有人帮助其开启这种模式而已。由于我们只是I4OC的一小股力量,因此我们无法独立完成这项工作。


你可以提供帮助

你精心制作的并且需要提供给出版机构的参考文献列表必须得到独立检查和严谨对待,就像你对待自己的研究那样。如果我们需要了解不同输出(包括数据,前提是我们将引文纳入数据集)的作用和影响,并且希望改造当前的评估系统,使之不再产生对科学不利的不正当激励手段(我会在另一篇文章中提供更多这方面的信息),而是成为一种循证式评估系统时,这些参考文献列表将变得格外重要。既然是你亲自创造了该资源,那么当你愿意时,你也应该有能力对其展开分析。参考文献列表是《开放科学(Open Science)》杂志的数据和基本组成部分。

因此,如果你是学术界的一份子或者是一位编辑、审稿人抑或是一名有着最喜爱杂志的作者,那么你便可以和本专业领域的期刊或其出版机构进行对话,从而设法帮助改变评估文化。如果他们尚不是Crossref成员,那么你可以鼓励他们加入Crossref。如果他们是Crossref成员,你可以呼吁他们按动那个开关——他们只需向support@crossref.org发送一封电子邮件即可。

本博文文字和图片由Hindawi提供并依照《创作共用许可协议》(CC-BY)发布。

阅读原文




http://blog.sciencenet.cn/blog-3411312-1182086.html

上一篇:5G:一场电信革命?
下一篇:如何避免被指剽窃?

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2020-1-27 02:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部