数字科学交流团队分享 http://blog.sciencenet.cn/u/dsc70 武大

博文

开放正在占领世界:源代码和科学的共同点

已有 1461 次阅读 2020-1-30 13:39 |个人分类:STM出版|系统分类:海外观察|关键词:学者

引用本文请注明出处

作者:PHILL JONES; 译者:姚依蕾; 校译:宁莎莎;

来源:https://scholarlykitchen.sspnet.org/2019/11/05/open-is-eating-the-world-what-source-code-and-science-have-in-common/


在最近的RAVE科技年度出版会议上,我和DigiratiPaul Mollahan同席并讨论了关于开放资源的优势、挑战以及其改变学术和学术出版商技术使用的潜力。我们从共同关注开放标准和流程的重要性开始,到关于学术出版圈的可持续性和性质的辩论结束。

2011年, Marc Andreessen宣布——软件正在吞噬世界,他预测科技公司将持续地严重扰乱各行各业。当时出版商们就已经开始拥抱技术。更具体来说,互联网是一个由开源软件主导的基础设施和平台。

除技术社区之外,很少有人意识到开源方案的普遍性。它降低了从台式电脑、移动电话到空中交通管制系统的风险和总成本,与此同时,商业模式的成熟从而提高了投资者的信心。为适应Andreessen提出的世界,我们行业当然需要关注开源的重要性。

在过去的几个月里,我一直与同事Fiona Murphy合作,开展一个知识交流项目——在欧洲六个国家组织的协作下,共同努力支持数字基础设施的发展以实现学术开放。这个项目被称为开放档案,旨在记录个人或团体对学术开放的贡献。为了提供信息以形成较强的主动性,我们对实践开放性的研究贡献者进行了一系列采访。

我们已经对它们目前如何实现从实验协议和计算机代码到研究数据和文章的共享有了一定的认识。我们还探讨了他们所面临的障碍以及他们后续可能需要支持。虽然这不是我们研究的重点,但是能够注意到开源这个概念被反复提及。

开放资源和开放研究之间的联系日渐明显。开放资源和开放研究机制都是通过建立更快更强的反馈机制以提高其质量,两者都是为了避免浪费和不必要的重复工作(验证不是重复工作,属于不同类型),都吸引/依赖于既有价值又可持续的社区。

正如John Maxwell在他最近的关于开源出版解决方案的电子著作中所指出的,Roger Schonfeld在这里又进行重申的,开源不仅仅是通过在Github上公开可用代码,更重要的是在WordPress上发布并公开它。开放研究和开源都建立在健康、互动的社区之上,开源软件社区致力于代码、测试和讨论,开放研究员开发和利用共享数据资源,如GenBankNERC数据中心,并使用arXiv等服务共享正在进行的工作以直接向社区成员征求反馈。

当我们采访学者、数据管理员、图书管理员、行政人员和决策者时,我们发现许多人将开源视为一种可围绕使用工具保证透明度和社区治理的机制。在某些情况下,受访者认为开放源码工具和软件的使用是最终完全开放的研究基础设施所固有的。

许多小型出版商对社区治理的渴望与对自治的担忧并存。正如Kent Anderson2011年的文章中所指出,平台提供商承诺可以轻松、经济且高效地访问最新技术,但是一旦有人控制了出版商进入市场的方式,出版商就会严重依赖于另一个拥有自己业务需求和利益的组织。自2011年以来,我们看到这一领域发生了重大变化,包括跨地域的纵向联营、研究周期的上游现象以及小型出版商失去经济控制的可能性,因为大型出版商提供了工作流服务、平台、营销、销售和大交易整合的捆绑交易。

像开放研究倡导者发现自己在对抗学界嵌入激励结构的强大网络效应一样,技术基础设施也有自己的网络效应,正如很多年前当我从物理学转向生物学,试图与同事分享我用数字公式写的一份手稿时,却不断被问到是否有文字版本,我发现

对社区的依赖是开放性和挑战性的力量和目标;社区不仅仅是建立自己。他们需要有存在的理由,需要被驱使。SAGEIan Mulvaney在关于开源优势的会议讨论中指出的一个紧急的可持续性问题。他援引了本质上是由单个开发人员支持的cURL项目,从最好的情况来看,依赖一个总线因子为1的软件,对任何组织来说都是一个风险。开源项目需要大量的贡献者才能持续。这可能极困难,因为对于任何一个给定的项目,用户数都超过贡献者数大约两个数量级。这就产生问题:在所有受益的人和组织中,谁愿意将资源用于维护项目。

最近在出版界最受关注的开源项目是Coko。去年年底,我写了一篇关于AllThingsCoko会议的文章,想知道Coko是否会成为一个社区项目,为出版商提供除了购买出版平台和建立自己的平台之外的第三种选择。

在发表了那篇文章之后,我很高兴看到了三个使用Coko组件框架构建的项目的演示—— Hindawi’s Phenom, UCP/CDL’s Editoria eLife’s Libero。一方面,这些项目都需要花费大量的工作才能达到目前的成熟度,这可能会使得部分技术领先者在类似的战略面前却步。另一方面,这三个制作精良的平台,它们至少证明了这个原理,可以说,这些早期的尝试者在经历草创的阶段。

现在,它只需要一个社区。但是,仅此而已吗?

如果这个项目要在专业小群体外扩散,下一个挑战将是建立亟需的社区。eLifeHindawi、加州大学出版社和加州数字图书馆,就潜在社区群体的影响力主题有很多报道。另外,在Coko网站的社区页面上也能发现一些有趣的成员。

如果有足够的资源来推动开发和支持维护,资助者、开放存取出版商、大学出版社和图书馆出版服务提供商似乎是潜在资源来源对象。学会对社会是一笔宝贵的财富。迄今还没有人将平台连接到订阅服务器数据库,还没有任何工具可以帮助出版商应对遗留数据难题。其中部分挑战可能会由服务提供商解决,但这个市场可能仍需要成熟。在所有提到的警告下,我认为出版商将得到充分考虑合作竞争的可能性。

我期待看到开源作为我们行业技术战略而持续发展。我的部分意见无可否认是源自于哲学。开发商Melvin Conway曾经说过:设计系统的组织…只是生产复制其通信结构的设计。

随着我们的行业努力适应学界不断变化的需求,我们将需要支持更多的协作和开放工作流。此外,随着学界开始将开源视为学术透明的必要组成部分,甚至当做开放研究的必要条件,我们可能会越来越要求自己更加开放。改变我们的工作方式并不容易,这将意味着与不同类型的服务提供商建立新型的业务关系,而这些服务提供商又必须积极培育发展社区,以确保符合标准和良好实践。正如Paul Mollahan所说:……这是这些新兴社区面临的一个关键挑战;如果没有足够的时间和精力投入其中,分歧可能很快发生,从而降低大规模社区的潜在利益。确保这种努力和成本得到认可和管理往往是长期成功的障碍。

然而,经济效益最终还是会产生。通过进一步标准化用例,使用开放标准和开放工作流,就有机会实现共享风险并带来高效。

我们需要更好地理解开放意味着什么,才能知道如何支持研究人员更加开放和协作。这样才能有望效仿其他技术驱动型行业,以分担风险、降低成本和提高可持续性的方式进行合作。




http://blog.sciencenet.cn/blog-521339-1216157.html

上一篇:开放获取的未来,APCs不是唯一出路
下一篇:Richard Poynder谈开放存取和开放存取运动

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-5-30 04:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部