数字科学交流团队分享 http://blog.sciencenet.cn/u/dsc70 武大

博文

ArXiv廿年 II

已有 4302 次阅读 2011-10-16 18:46 |系统分类:海外观察

作者Paul Ginsparg,预印本论文服务器的创办者,探索在线即时共享科研成果以及学术交流的未来已经20年。
 

下一步?

随着arXiv社区实现多元化经营,用户的期望也变得多元化。一些用户已要求获得留言线程(thread指计算机进程中某个单一顺序的控制流,译者注)支持——这些线程与发布在网上的论文直接相关;而其他用户宁愿它维持纯粹由作者提供内容的状态。对于增强交互性我表示同情的理解:在当今的社交网站,一个单向通道似乎是不合时宜的。但是,由于在线上讨论中维持效用和礼仪需要大量劳动,我们的政策一直坚持这些服务应该放在主知识仓储外部。相同的考虑同样适用于自组织的或者“众人参与”(crowd sourced)的评论形式。近几年来,一些外部博客已经开始收集有用的留言线程,这些线程通过引用通告(trackback)机制从arXiv的摘要页面链接回来。但我不认为单个科学家写的专门博客会充分地增长。问答网站如mathoverflow.net提供了更加具有发展前途的工具。在这类网站内,在回答其他人张贴的问题的过程中,专业数学家将提供与arXiv中数学论文的链接。

再一次,由于成本和劳动经费的原因,arXiv将无法实现传统的同行评议。即使是为维持基本的质量控制而引入最少的预印本过滤也会导致大量的日常行政活动。外部志愿仲裁者对上传文摘的学科适合性进行粗略的检查;包括文本分类器在内的各种自动过滤器标记出有问题的投稿。尽管此类投稿的百分比远远低于1%,但是它们往往倾向于集中在特殊领域内(如广义相对论、量子力学和物理学的统一理论;黎曼假设的证明,哥德巴赫猜想和费马大定理的新证法;计算机科学中的PNP问题)。

仲裁人的任务是确定什么是自己的网络社群潜在感兴趣的——有时还被迫确定“什么是科学?”在这一点上,通过制定收录文章的标准,arXiv无意中成为了研究者的评审机构,正如《科学引文索引》Science Citation Index成为期刊的评审机构一样。尽管所作的决定偏向宽松,一些作者却仍不可避免地加以反对,称这远远不够“宽松”。

数字化一代

印刷版期刊已经不再有效地发挥作用这一观点在20世纪90年代早期已经开始流行。值得纪念的是,1991David Mermin在《今日物理》(Physics Today)中这样写道:“早就应该废除期刊并重组我们做生意的方式。”120世纪90年代中期,这似乎是难以想象的:自由地、可不受限制地获取的arXiv未经评议的学术论文,与经过质量控制但基于订阅的出版物将持续共存。15年来,研究者同时保持对两者的访问,并成功地划分了它们在学术交流和奖励结构中扮演的不同角色。

论文的版式和特性向着更适应现代技术而不是印刷在纸上的方向转变,但这一过程出人意料的缓慢。页面标记格式如PDF,才勉强开始为基于可扩展标记语言(The Extensive Markup LanguageXML)的格式让路。后者支持诸如可缩放的图表、动态视图等特性,并与注释和语义标记相链接。这种谨慎有一部分来自保存稳定的研究文献档案这一可以理解的需求,就像纸张在过去数个世纪中所做的那样。

为下一代研究者规划学术交流的基础设施需要知道当前本科生和研究生头脑里在想什么。他们的生活经验包括可以直接在线获取和通过全球搜索引擎获取,他们满怀着社交网络的思维习惯而来,包括分享链接、照片、视频和状态更新。然而,我对研究生的个人非正式调查显示,他们的信息搜集技巧与大多数年长科学家十分相似。学生们仍然遵循引用树(citation tree),通过关键字进行检索,并向同伴和导师咨询(向后者咨询以清除不可靠的信息源,这一点同从前一样重要)。学生们也表示,由于获取基于订阅的期刊(即使可以通过机构代理模式获取)可能成为令人沮丧的痛苦事情,当在家工作时他们优先检索开放存取资源。

在不断增长的数据中搜寻不可避免地引起人们对信息过载的担忧。这种现象可以追溯到书写技术发明之初,它随着印刷术的发明而加剧,并且从那时起在每一代人中都得到了再度强调。一种粗浅的反应是呼吁更好的信息过滤,但是一个不完美的信息过滤器可能比没有过滤器产生更大害处。例如,普遍使用的推荐系统以建立在全球声望之上的被动措施为基础,它能够拓展个人的阅读选择,但对每个人选择的有效拓展是在同一个方向上,从而导致整体的群体多样性减弱。(愤青们会建议在已经流行的领域不断加强赶时髦的行为。)

arXiv,我们已经见识到了全球研究社区作为一个整体的一些意想不到的影响,这个社群每日从相同的界面获取相同的信息。如果仅以单天来计,反映在每日提示中的新预印本的提交顺序就将强烈影响当天的读者总数,并且在6年后的引文记录中留下可衡量的痕迹……2 3一些在这方面十分明智的研究者计划他们的提交时间,从而能刚好在每天下午截稿时间后交稿,以便使自己的投稿在第二天的邮件中占据一个优先地位。长期强调“流行”材料的过滤器将加重这种影响。因此,arXiv的任何推荐系统将至少需要进行个性化改造来真正契合个体读者的喜好和兴趣,从而减少羊群行为(herding behaviour)。关于此类系统的实验正在进行中,如果运行正常的话一两年内可能就会上网。

目前,arXiv的长期作用和它与传统出版的关系、它的盈利模式的详细情况、以及它整体的知识成果监管等开放性问题将由它的使用者及权益相关者协调解决。下个月,康奈尔大学图书馆将主办一次国际赞助机构会议,目的是讨论arXiv向协作管理及社区支持的资源库方向过渡的问题。要适应下一代研究者的需求,这将是一次挑战。

我所希望的是,阻碍这个领域的新点子付诸实践的障碍能够持续保持在足够低的水平,这样即使所有其他人都失败了,其他地方的一些年轻的研究者仍然可以让另一艘小船扬帆出海,开始一段命运之旅。。(张晓郁 译)

 

原文发表于Nature,11 Aug 2011,Volume 476,PP.145–147,doi:10.1038/476145a.

 

注释:

1       Mermin, N. D. Phys. Today 44, 9 (1991).

2       Haque, A. & Ginsparg, P. J. Am. Soc. Inf. Sci. Technol. 60, 22032218 (2009).

3    Haque, A. & Ginsparg, P. J. Am. Soc. Inf. Sci. Technol. 61, 23812388 (2010).




https://blog.sciencenet.cn/blog-521339-497518.html

上一篇:走向全球科学
下一篇:业余科学家的作为
收藏 IP: 111.172.10.*| 热度|

1 XY

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 22:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部