||
引用本文请注明出处
作者:Ginny Herbert
译者:王沁雪
校译:王一雪
尽管开放学术实践的理念传播得相当广泛,但现实中的实际采用程度仍明显滞后。尤其是当我们把研究成果共享趋势的观察视角从传统论文扩展到数据与代码、研究方法、注册报告或“零结果”等研究产出形式时,可以看到大量倡议、产品发布以及有限的增长,却始终没有形成真正意义上的“新常态”。
开放研究全生命周期来提升协作性与透明度,本身并不存在明显的成本门槛,而且这一理念同时吸引着编辑、图书馆员、资助机构和出版商。从理论上看,开放学术与“发表或淘汰”的学术文化以及近年学术出版业对发表规模的重视是高度契合的。那么,问题究竟出在哪里?
为了解答这一问题,我们可以借助商业战略中的“价值创造-价值获取框架”。该框架认为,一个主体要想持续运作,必须同时做到两点:
1.创造价值,即提供对他人有用、有意义或有吸引力的内容;
2.获取价值,获得足以支撑持续创造价值的回报。
只有两者兼顾,模式才具备可持续性。如果我们将早期研究产出视为“产品”,将研究人员视为“企业”,那么开放学术采用缓慢的问题,就转化为一个典型的战略问题:为什么没有更多“企业”愿意提供这些“产品”?
价值并未被充分创造
从“价值创造”的角度看,如果某种供给始终难以激发兴趣,那么很可能是因为它对相当多的“消费者”而言并不具备吸引力。换言之,人们并不真正需要你所提供的产品。在开放学术语境下,这意味着研究人员或许理性地判断:读者对数据、代码、方法、零结果或预注册研究的实际需求仍然有限。
一些实证研究在一定程度上支持了这种“需求不足”的解释。以数据共享为例,早期研究显示,约85%—88%的数据集从未获得引用;较新的分析也发现,绝大多数共享数据并未被记录为再利用,即便被引用,通常也只有一次。当然,也有人反驳说:引用并不是衡量非论文型产出使用情况的合适指标,因此严重低估了其真实影响。这一反驳值得记住,因为它将在“价值获取”层面再次被提到。
使用者VS读者
另一种反驳观点认为,开放学术产出被“包装”得不恰当,导致价值无法充分显现。在前文中,我将非论文型产出的受众称为“读者”,这是出版业长期形成的思维惯性;但在这些产出的情境下,“使用者”这一概念或许更为准确。
尽管看起来只是语义上的差别,但“读者”与“使用者”的区分,会直接影响我们对信息传播方式的理解。读者需要的是已经成型、可供消费的内容:完整语境、清晰叙事、明确论点;使用者则需要能够与之交互的系统,通过系统来调用信息,而不是逐条阅读信息本身。简言之,“读者”强调信息消费,“使用者”强调系统交互。
当我们面对数据、代码,或围绕某一研究问题产生的大量注册报告和零结果时,“使用者”更能准确描述这些材料如何创造价值。零结果本身缺乏叙事吸引力,但从整体上看,却对判断研究新颖性、了解先期探索工作至关重要。如果仍然依赖逐篇阅读论文或注册文本来评估这些信息,显然是低效的。研究人员真正能从中受益的是能够在大规模文献层面进行查询的能力。
那么,为什么大多数研究人员仍停留在“读者”角色,而非“使用者”?答案很简单:技术差距。在大语言模型出现之前,几乎不存在能够支持深度文献交互的系统。无论是Web of Science、Google,还是临床试验注册平台,信息发现基本止步于“检索”——一旦返回结果,研究人员就必须自行逐条阅读、整合和判断。换句话说,系统交互很大程度上在搜索结束的那一刻也随之终止。
一种新的信息交互方式正在出现
ChatGPT的出现,首次在Google之后真正撼动了“搜索”这一范式。多亏了大语言模型,人们开始以“使用者”的身份与复杂信息交互:不再只是找到并解读单篇文献,而是让系统直接对相关知识进行综合。这标志着知识获取方式从“以读者为中心”向“以系统中介为中心”的根本转变。
在学术交流的背景下,我们已经看到大语言模型正在重塑信息消费行为的迹象。《英国医学杂志》(The British Medical Journal,BMJ)首席技术官Ian Mulvaney分享的数据显示,BMJ正观察到明显增长的LLM驱动流量;牛津大学出版社产品战略总监John Campbell也指出,Google的AI搜索摘要导致其学术参考服务的点击率下降了约19%。
这对开放学术而言,可能是一次巨大的机遇。如果非论文型产出难以体现价值的关键障碍在于“难以被有效使用”,那么LLM恰恰可以弥合传播机制与使用场景之间的鸿沟。更重要的是,ChatGPT已经实现了广泛普及,研究人员对LLM的基本认知门槛并不高。真正的挑战不在于“是否使用”,而在于拓展使用场景,将开放学术纳入其中——这远比推动初次技术采纳要容易。
在ChatGPT及类似工具的支持下,提出诸如“这个研究问题是否已经被讨论过?还有哪些相似问题?”这样的问题,变得自然且低成本。事实上,利用LLM辅助文献综述,已经成为当前最常见的科研应用之一。
那么,如果我们认为研究人员过去不愿大规模共享非论文型产出,是因为“没有足够的受众”,而LLM现在能够解决这一问题,开放学术的采用是否就会迅速起飞?
价值无法被充分获取
回到框架的第二部分——价值获取。仅创造价值是不够的;参与者必须能保留足够的价值以证明其持续参与的合理性。在开放学术情境下,这意味着:共享非论文型产出,必须在学术评价体系中得到承认和奖励。
在学术体系中,价值获取主要通过职业发展来实现。尽管不同国家和机构的评价机制各不相同,但研究产出始终处于核心位置,且往往以引用为评价指标。在某些情况下,评价明确基于引用——成功与否取决于研究者的成果被引用了多少次;有些情况下,产出通过计算发表数量来评价,但被视为“有效”的发表渠道往往取决于论文的可索引性与期刊影响力,而这两者历来都与引文表现挂钩——引文表现正是衡量学术影响力的重要指标。也就是说,即便不是明文规定,引用依然是隐性的核心逻辑。
因此,若研究人员希望通过共享研究产出获得回报,这些产出要么需要本身能够产生引用,要么必须发表在高度重视引用表现的场所。
在聚合使用情境中,引用指标的失效
然而,引用从来就不是评估非论文型产出的合适工具,在LLM介入后,这一缺陷被进一步放大。引用机制假设知识单位是离散的、线性阅读的、来源清晰可追溯的——这些前提与LLM对成千上万条信息进行综合、却不逐条标注出处的方式并不兼容。
LLM在引文方面缺乏可靠的实绩记录,即便其做到引用,其生成的引用列表也冗长难用且难以解读。换言之,LLM所支持的使用方式,已经超出了传统引文计量工具的测量能力。
有人或许会认为,将非论文型产出发表在期刊中,就能通过同行评议与引用体系解决这一问题。但这种做法同样面临结构性限制。期刊的核心功能是为“读者”策展,假定每一篇发表作品都应当是独立可读、可理解、甚至具有一定吸引力的。而许多非论文型产出的价值并不来自可读性,而来自于其在整体系统中的“可用性”。单个数据集或一组零结果,可能在系统层面极具价值,却难以单独构成一篇有叙事张力的文章。
简而言之,技术已经极大增强了我们创造开放学术价值的能力,但价值获取的激励结构却几乎没有改变。
注重科学性的期刊在一定程度上解决了这种脱节问题,但自身也面临着结构性限制。其高发表量、低引用率的特征,使得期刊难以被索引和分类归档;由于期刊生存能力与引用量直接挂钩,编辑决策——即便在注重方法论的期刊中——往往强化以引用为导向的内容策略。对研究人员而言,这意味着可用于发表非论文型产出的渠道依然有限;在宏观层面,这一模式不可持续,因为它压制了期刊赖以生存的引文表现。
综合来看,我们正面临一个方枘圆凿的困境。期刊体系擅长策展离散、可消费的知识单元;而在LLM驱动的生态系统中,许多非传统产出的价值却源于其作为更大合成系统中数据点的功能。如果我们继续依赖为期刊设计的文献计量指标,便会重蹈覆辙,延续长期制约非论文产出的局限性。但如果强行将这些产出塞进期刊体系,又将面临另一种可扩展性问题:大规模发表此类成果,恰恰会动摇支撑期刊生存的引文评估体系根基。
归根结底:技术进步已经极大拓展了开放学术的价值创造空间,但价值获取的制度逻辑仍停留在原地。
下一步该怎么走?
如果LLM已经将研究产出的价值重心从个人读者可消费的内容转向系统可整合的内容,那么我们的评价体系也必须随之调整。当前的改革努力——如DORA、CoARA、叙事型简历等——确实拓宽了研究产出的边界,但仍然默认价值是在离散、可供人类阅读的单元层面实现的。而在LLM生态中,真正的价值往往来自大量微小贡献的累积:数据集、代码、预注册方案、零结果等。这些产出更像是共享知识系统的输入要素,而非独立成篇的作品。
如果价值是这样创造的,那么我们必须重新思考价值如何被获取。如果只有那些能吸引引用或完美契合期刊格式的成果才被视为“有效贡献”,研究人员将继续犹豫是否大规模分享这些非论文类成果。要让开放学术真正实现规模化,我们需要承认知识生产的集体性:不仅奖励少数耀眼的成果,也认可那些支撑整个系统运转的基础性贡献。这意味着,应当将机器可操作的研究产出视为一等研究成果,而非学术公民意识的附属行为;建立能够反映使用与再利用情况的指标体系;并设计评价机制,能够识别并承认研究人员在赋能他人方面的贡献,即便这些贡献并未获得传统意义上的关注。
结论已经十分明确:我们已经拥有从开放学术中创造前所未有价值的技术条件。真正决定这些价值能否被充分实现的,是评价与激励体系是否具备看见它们的能力。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-2-17 17:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社