数字科学交流团队分享 http://blog.sciencenet.cn/u/dsc70 武大

博文

科学出版将面临大崩溃? (II)

已有 4967 次阅读 2011-8-26 00:02 |系统分类:海外观察

第二部分:科学出版是否将瓦解?

所有这些与科学出版何干?今时今日,科学出版社是专门提供像编辑、文字加工,在某些情况下还提供销售和市场推广服务的公司。我认为,在1020年内,科学出版社将成为技术公司[4]。我提出这个观点的意思并不是说它们会成为技术的重度使用者,或是将雇佣大量信息科技职员。我的意思是这些出版社将以和谷歌或是苹果类似的方式成为推动技术进步的公司。也就是说,技术革新将成为它们的发展基础,大多数核心决策人将是有着深厚的技术专门知识的人才。不在技术上发愤图强的出版社将会相继倒闭。

关于科学出版将要瓦解的预言已不是什么新鲜事了。20世纪90年代末,很多人推测随着免费的在线预印本服务器(preprint server)在一些学科领域(如物理学)日益受欢迎,出版社将陷入困境。这个观点的立足点是,预印本的广泛使用必然意味着期刊的需求将减少。然而到目前为止,这种情况还没有发生。为什么它还没有发生,这是一个迷人的故事,这个“迷人的故事”我在其他地方已经探讨过一部分,并且我不会在这里重复探讨。

我要做的,反而将你的注意力引向一个显著的区别:现在和10年前科学出版面貌的区别。当前的新面貌是,一个新兴公司的生态系统繁荣起来了,这些公司以新方式交流研究成果,做法与传统期刊完全不同。想一想ChemSpider这个拥有2000多万篇论文的优秀在线数据库最近被英国皇家化学学会(the Royal Society of Chemistry)收购了。想一想Mendeley网站,一个管理、筛选和查询学术论文的平台,有着一些来自Last.fmSkype的员工的支持。或者想一想像SciVee(科学家的YouTube)、公共科学图书馆(Public Library of Science,简称PLoS)、JoVE杂志(Journal of Visualized Experiments)一样的新兴公司,或者想一想像OpenWetWareAlzheimer Research Forum那样以及更多充满活力的社区网站。并且届时还有一些像WordPressFriendfeed和维基媒体(Wikimedia)的公司。这些公司并不是由科学思想发端的,但是它们逐渐对科学家交流他们的研究成果起到了越来越大的帮助作用。这个繁荣的生态系统并没有与我们目睹的2000~2005年间在线资讯服务的突然繁荣有太大不同。

让我们近距离观察这个繁荣生态系统的一个部分:科学博客作为一个严肃的研究媒介重要性逐渐增强。由于大多数科学博客都把重点放在拓宽服务范围上,博客对于研究的影响力很容易被人们忽视。但是越来越多的博客包含了优质的研究内容,陶哲轩一系列令人惊叹的博文解释了堪称近代数学史上最大突破之一——庞加莱猜想的证明完成过程。或是蒂姆·高尔斯(Tim Gowers)近期在《大型协同性数学》一文的实验中,成功地使用了开放源代码原理来抨击一个有重大意义的数学问题。或是理查德·利普顿一系列优秀的博文探讨了解决一个计算机科学方面主要问题的观点,也就是找到一条快速运算法则来分解多位数因子。科学出版商应该小心了,正处在或者正在接近他们研究顶峰的一些世界顶尖科学家,他们的时间极其宝贵,却每年花费数百小时来为他们的博客创造原创性内容。这些研究内容往往很难或不可能在传统期刊上出版。我们在这里看到的,是博客媒体领域内一次壮观的扩张。相比之下,期刊还在原地踏步。

这个新兴企业的繁荣生态系统只是其中一个标志,它标志着科学出版正从一个制造业转变成为一个技术产业。此次转变的第二个标志是信息的本质正在改变。信息直到20世纪末都还是一个静态实体。要使信息增值,所有媒体出版商与生俱来的办法是通过生产和发行来实现。于是他们雇佣专业人才,这些专业人才熟悉这些业务的操作,并且对销售和市场推广业务能起到支撑作用。但是,信息发布的成本现在已经降低到几乎为零了,并且生产和内容成本也大幅度下降 [5] 。同时,世界上的信息现在被彻底放进了一个单一的、活跃的网络,在那里,信息能复苏并获得新生。结果是,给信息增值最多的人们不再是生产人员和发行人员。取而代之的是技术人员,是程序设计员。

如果你对此产生怀疑,请考虑一下在其他媒介产业利益转移到了哪里。在音乐产业,它们转移至了像苹果那样的公司。在图书业,它们转移至了拥有电子阅读器Kindle的亚马逊之类的组织。在很多其他媒介领域,它们转移至谷歌:谷歌正成为世界上最大的媒体公司。他们并不那样介绍自己,但是媒体产业的利益显而易见转移至了谷歌。这些组织都由拥有深厚科技专业知识的人员负责运行。有多少科学出版社是由知道内连接(INNER JOIN)和外连接(OUTER JOIN)区别的人员负责运行的?或者说,谁知道什么是A/B测试A/B test)?或者,谁知道如何建立一个大规模分布式集群(Hadoop cluster)?没有这种类型的科技方面的知识,运行一个技术驱动的公司是不可能的。有多少科学出版商能像史蒂夫·乔布斯(Steve Jobs)、谢尔盖·布林(Sergey Brin)或者拉里·佩奇(Larry Page)那样在科技方面如此博学?

我预料得到,只有极少数科学出版商会相信大崩溃的预言并为之行动。对此类预言的一个普遍反应是一个关于比较的有趣的游戏:“但我们比博客/维基/ PLoS等……!”这些话在眼下是真的,至少是在依据科学出版传统价值而评定的时候。但是这些话是离题的,因为同等真实且相似的评论也是关于报纸的。表现出标准的免疫反应也是一件容易的事情:“然而同行评审如何”“质量控制如何”“科学家如何知道要阅读什么”……这些问题显示出重要的价值,但是对这些问题的纠缠显示出他们想象力的缺乏。这很像安德鲁·罗森塔尔为《纽约时报》社论版的辩护。(有时候我在想,有多少杂志编辑仍然在用雅虎(Yahoo!)的人工主题目录,而不是用谷歌?)在与编辑们的交谈中,我常常会重复遇到同一个模式:“但是X办法没有用/不被允/由于原因Y,因而是不好的。”好吧,好吧。所以呢?如果你是对的,你将在精神上被无罪开释,而且可以鞠躬谢幕了。如果你是错误的,你的公司可能在未来10年不复存在。不管你是正确或是错误的,这都不是问题的关键。当新技术已经发展成熟,在竞争中获得胜利的企业将是那些野心勃勃、乐于冒险、将有远见的技术专家放置在核心决策地位、对与企业相关的科技极度精通的企业,同时,在大多数状况下犯了很多错的企业。犯错只是一个特征,而非一个缺陷。如果这能帮助你改善工作模式:你从一个完全错误的点子开始,但它孕育着一个好点子的种子。你改善它,而且你只是某种程度上略微有些错误。你再次改善它,于是结果你成为行业中的唯一之选。不幸的是,几乎没有科学出版社试图用这种方法去成为科技驱动的公司。我所知道的主要例子是自然出版集团(Nature Publishing Group)(连同Nature.com)以及美国科学公共图书馆(Public Library of Science)。很多其他出版社正在进行实验,但是这些实验还处在此类人的控制下:这些人的专业技能核心是在别的领域。

机会

到现在为止,这篇文章都把重心放在目前的科学出版社上,而且语气相当悲观。但是毋庸置疑的是,这种悲观只是这个令人兴奋的故事的一个微不足道的部分。这个故事与我们开拓新途径来组织和交流科学信息的机会有关。即使外在威胁开始摧毁他们做事的老套路,放手一搏转变成科技驱动企业的科学出版商也能抓住这些机会。而且,正如我们所见,这些机会正在或是即将被勇敢的企业家所抓住。这里有一个我预期在接下来数年中能够得到发展的服务的清单。这些点子中的一些已经处在研制开发阶段,它们中的大多数由新兴企业来完成。但是这些点子还没有达到一个质量水平,这个水平是它们变成普遍存在的方法所必须达到的。这张清单很容易令人反感地一直开列下去——这些只是更显而易见可以做的事情当中的一部分。

个性化论文推荐:20世纪90年代末,Amazon.com已经将图书推荐个性化了。你访问那个网站然后为你最喜欢的书评级。系统将识别拥有相似品味的人,并且自动为你建立一个推荐目录。这并不难操作:亚马逊已经公布了算法的早期变量,并且存在一整个工作生态系统(其中大部分是公开的),这是受电影推荐领域奈飞大奖(Netflix Prize)的激励而产生的。如果查询原始的谷歌网页排行(PageRank)网页,你将发现该网页描述了一个个性化的网页排行,这可以被用来建立个性化搜索和推荐系统。谷歌并没有真正使用个性化算法,因为这样做的计算量远远大于普通的谷歌网页排行,而且即使是对谷歌而言,将规模扩展到数百亿网页也是十分艰难的。但是,如果你试图分类的全部是(比方说)物理学文献——几百万篇论文——那么结果是,只需要一点点独创力,你就可以在一个小计算机集群中实现个性化的网页排行。用这来建立一个甚至比亚马逊或者奈飞更好的系统是可能的。

杰出的科学搜索引擎:科学信息研究所(Institute for Scientific Information,简称ISI)的Web of Knowledge数据库,爱思唯尔(Elsevier)的Scopus和谷歌学术搜索是卓越的工具,但是科学搜索引擎还有极大的发展和改善空间 [6] 。除了少数例外,这些搜索引擎不做自动拼写校正、论文的相关度排序(最好是个性化的)、自动翻译或是适度提醒服务之类的基础性工作。它们当然也不做更先进的工作,比如为提供社交功能,或是高度自动化的数据挖掘(data mining)工具。为什么不提供一个公共应用程序接口(Application Program Interface,简称API[7],使人们可以由此建立自己的应用程序来充分利用科学文献的价值?想象一下,利用机器学习等技术自动识别没有被人们充分认识和正确评价的文献,或是识别新兴的研究领域。

科学家用于即时协同工作(real-time collaboration)的高质量工具:看看像协同编辑程序Etherpad一样的服务,这种服务使得各种各样的人能够通过浏览器即时编辑一个文档。他们更开发了一个功能,使得重启这个编辑程序成为可能。或者我们也可以看看谷歌的一款相似服务谷歌文档(Google Docs),这项服务同样能向用户提供共享的电子数据表和演示。看看像GitGithub那样社会交版的控制系统。或是看看能使你追踪不同作者贡献的可视化工具。在数百个遥远如光年般超出了科学家使用范畴的通用协作工具中,这只是很少的一部分。它们并未被科学家广泛接受,部分是因为显而易见的原因:它们并未与LaTeX和标准书目工具那样的东西结合起来。尽管与这些工具实际解决的问题相比,那种结合是微不足道的。展望未来,类似谷歌波浪(Google Wave)这样的服务也许将成为新兴公司建立一整套协作客户端的平台,世界上每一位科学家最终都将使用这套协作客户端。

科学博客和维基平台:除了自然出版集团,科学出版社为什么不发展高质量的科学博客和维基平台?这在开放源代码的WordPress平台很容易建立起来,比如,建立一个能使科学家很容易建立博客的主机服务(hosting service),增添标准的WordPress设置中并不提供的重要功能,如标明博文真实可信的标记,时间戳,人工可读的网络地址,支持多种博文版本,还有能看到(及引用)完整的修订历史。可以建立一个评论者识别系统,从而使评论的过滤和聚合得以实现。也许最重要的是,博文可以被完全地引用。

与此相关的想法,出版社也可以帮助保存一些现在在科学博客和维基平台中正在进行的重要的工作。像蒂姆·高尔斯(Tim Gowers’)的博学者计划(Polymath Project)一样的项目是科学记录的重要组成部分,但是10年或20年后这些科学工作记录储存在哪里呢?美国国会图书馆(The US Library of Congress)已经动议保存法律博客。需要有人加快脚步并对科学博客做同样的事情。

数据网站:哪里有这样的服务,可以使科学家发布数据和发布一篇杂志论文或是开一个博客一样简单和容易?少数科学出版社在这个方向上采取了相应措施。但是,仅仅将数据随便堆砌在网上是不够的。这些数据需要变成有条理和可检索的,由此人们才能查找和使用它们。由于数据集(data sets)的功用与它们之间的连接成正比,因此数据必须是相互链接的。数据也必须是可引用的。并且,从数据中提取有价值东西的基础设施和专业知识必须是简单和容易使用的。在上述每一个问题中,出版社都经受着被类似Metaweb这样的数据公司超越的危险,这些公司为数据网站建立平台。

为何很多服务都会失败:人们为完成我前文中描述的服务作了很多不成功的尝试。期刊编辑曾经向我解释过,表明这些服务不存在需求。在很多情况下,我想都存在一个更简单的解释:执行不力[8]。发展计划常常由资深编辑和高级科学家领导,但他们的实用科技知识极少,并且他们很少参与日常工作。贯彻执行的是代表他们的几乎没有权力的IT下属。结果常常是平庸的,这应该没有人会感到惊奇。发展高质量的网站服务需要高深的知识和强大的积极性。成功的人通常是才华横溢和在技术上相当博学的。高级科学家或资深编辑领导的项目还有一个令人惊讶的普遍性,这些人的“专业知识”主要是当他们是研究生或博士后研究人员时写过一些程序,并且他们现在认为可以凭借极少的额外的科技知识就能得到一个高质量的结果。这并不是所谓的技术驱动。

结论:我已经介绍了对目前科学出版社未来的悲观观点。然而我希望,我们也应清楚地认识到,由于有这些想要掌握新科技的人存在并且大胆地采用新路子来进行实验,我们还有非常多的机会实行变革。结果将出现一个巨大的变革浪潮,这个浪潮不仅将改变科学发现和传播的方式,还会促进科学发现的产生方式。

注释:

[1] 为了使讨论更具体,我们将把阐述重心放在博客上,然而事实上,很多媒体的新形式导致了报纸衰亡,包括像Digg MetaFilter这样的新闻网站,Stratfor这样的分析网站,以及很多其他网站。当我在下文中写下“博客”时,我通常是针对具有破坏性的新媒体这个更大的类别,而非字面上看来的只针对传统博客本身。

[2] 在某种程度上,我拿《纽约时报》当例子其实有说反话的意味。尽管接下来的5年中它确实将面临许多麻烦,我想从长远来看他们反而是最有可能活下来的报纸之一:他们创造了高质量的原创内容,展现了成为技术驱动报纸的强烈迹象,而且他们大胆地对备用内容来源进行试验。但他们需要在大报相继衰亡的过程中存活下来,这些衰亡将在接下来的5年左右发生。

[3] 在这篇文章的较早版本中我引用了一个数据,1000美元。这是草率的行为——这个数字确实太高了。确切数字确实会因报纸不同而有很大差异,但是作为一份大都市主流报纸,算上所有成本,我想大约200300美元是一个合理的估价。

[4] 我将使用“公司”这个术语来涵盖营利性和非营利性的组织,此外还有其他的组织形式。注意:可以论证的是,物理学预印本文库(arXiv)是物理学领域最成功的出版组织,它既不是一个传统的营利组织,也不是一个非营利组织。

[5] 生产和流通成本的降低与出版社目前向科学文献开放存取出版的转移直接相关。这次转移是科学出版大崩溃的首个可视性特征之一。更多特征可以并且已经在开放存取对出版业的影响中被提及,与其回顾那些资料,我更建议你去访问“Open Access News”这个博客,而且特别是彼得·萨伯(Peter Suber)的《Overview of Open Access》这篇文章。

[6] 在这篇文章的第一个版本中,我写道,出现的搜索引擎服务是“平庸的”。这是错误的,而且是不公平的:它们是非常有用的服务。只是存在很大的进步空间。

[7] 在我发表这篇文章后,克里斯蒂娜·皮卡斯(Christina Pikas)指出Web of ScienceScopus都有应用程序编程接口。这是我的错误,也是我之前不知道的东西。

[8] 仍然存在着这样的服务:在那里首要的问题是文化隔阂。但是根据我已经阐述过的观点,文化隔阂只是问题的一小部分。

致谢:

感谢詹·多德(Jen Dodd)和伊利亚·格瑞格里克(Ilya Grigorik)很多启发我的论述。

关于这篇文章:

这篇文章是以2009611的一个学术报告会的报告为基础的,学术报告会由美国物理学会(American Physical Society)编辑部举办。非常感谢美国物理学会的人们,你们是很棒的主人,也促使产生了很多有启发性的谈话。

(张晓郁译自Is scientific publishing about to be disrupted? by Michael Nielsen on June 29, 2009. http://michaelnielsen.org/blog/is-scientific-publishing-about-to-be-disrupted/)



https://blog.sciencenet.cn/blog-521339-479646.html

上一篇:“超越PDF”(编译)
下一篇:走向全球科学
收藏 IP: 119.96.44.*| 热度|

3 唐常杰 何学锋 scimage

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 21:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部