博文

用户已经改变，学术出版是否也在改变？

已有 337 次阅读 2026-6-16 15:36 |个人分类:科学交流|系统分类:海外观察

作者：Stephanie Lovegrove Hansen

译者：张蒂

校译：王一雪

来源：https://scholarlykitchen.sspnet.org/2026/05/27/the-user-has-changed-has-scholarly-publishing/

在学术出版的大部分历史中，“终端用户”的定义一直足够稳定，以至于没有人想过要去质疑它。用户就是研究人员、学生、临床医生或图书馆员：一个能够在平台上进行导航、阅读内容并形成自己判断的活生生的人。基于这一假设而衍生出的一切，如平台设计、元数据策略、资源发现架构以及使用情况报告，都是围绕这个前提构建的。

这一假设如今已不再充分。这种转变不仅仅体现在用户从哪里开始他们的研究，更在于“用户”这一概念究竟指的是谁、他们到达平台时在寻找什么，以及成功服务他们意味着什么。基于与正在部署AI发现工具的出版商、实时观察学生行为变化的图书馆专业人员、构建连接器基础设施的技术人员，以及致力于使使用量统计重新变得连贯一致的标准制定机构的近期对话，我看到一幅正在浮现的图景，其核心指向十分明确：用户变化的速度已经超过了为其服务而设计的系统，而两者之间的差距，正是大部分艰难工作正在发生的地方。

一个不会点击的“用户”

让我们从这一变化最具体的表现说起。在2026年的前十周里，Silverchair平台上大约一半的入站流量并非来自任何传统意义上的人类用户，它们是机器人、爬虫和自动化系统。其中一些在为AI辅助搜索抓取和索引内容，一些作为用户代理代表使用聊天机器人的人在运行，还有一些则试图利用其所能触及的一切内容来训练大型语言模型。

出版商们注意到机器人流量已有多年。但如今不同的是流量的构成和意图。当前自动化流量中有相当大的比例，其行为看起来与出版商实际期望的非常相似：发现内容、在研究人员做出决策的场景中将其呈现出来，并将有参与意愿的用户引导回原始来源。在Silverchair平台上的出版商中，JAMA Network是最早（于2024年初）对AI爬虫实施全面封锁的机构之一，后来在2025年秋季修改了这一立场。

这一转变源于对一个重要区别的深入思考：用于训练的爬虫（即那些消费内容以改进模型的特定用户代理，对出版商没有明确的益处，也没有纳入更正或撤稿的机制）与搜索和用户代理有着本质的不同——后者以能够带来引荐流量的方式索引和检索内容。在允许一组经过筛选的用户代理重新访问后，JAMA看到机构流量、健康的页面停留时间以及来自GPT的引荐流量立即攀升，逐渐接近目前Google Scholar所占据的水平。

这并不意味着所有自动化流量都是好的，而是说“我们是否应该允许机器人？”已经成了一个过于粗糙的问题。真正有意义的问题是：哪些类型的自动化用户、在什么样的访问条件下、服务于哪些使用场景，这些都需要深入具体情况，而不是将所有非人类流量一概视为威胁。The International Bunch的首席执行官Lou Peck直截了当地阐述了这一战略转向：“不要再把AI流量当作噪音和需要封堵的东西。开始专注于生成式引擎优化（GEO）：确保你的品牌和内容成为信任锚点，因为这正是AI模型所依赖的。”看看SEO的类比：那些早期就与Google建立合作关系、并在自己能够施加影响的条件下参与的出版商，比那些一直抵制到规则已经固化才行动的出版商处于更有利的位置。有充分理由认为，AI发现正处于一个类似的拐点上。

被分流后的人类用户

自动化流量的故事是真实的，但它可能会掩盖一个同样重要的事实：那些仍然访问出版商平台的用户，参与度更高了，而非更低。来自已部署AI发现工具的出版商的数据，讲述了一个关于AI如何影响网站流量的反直觉故事。

牛津大学出版社（OUP）即使在总体引荐流量下降的情况下，平均会话时长仍增长了约30%，这种情况许多出版商可能都能感同身受。OUP的AI辅助搜索的点击率呈现出类似的轨迹：初始查询时为14%，随着用户通过对话式的后续追问不断细化，点击率上升至40%，而传统关键词搜索的点击率仅为9%。OUP的产品平台总监Tanya Laplante将此描述为一种筛选效应：“继续来到我们平台的用户，是那些真正深度参与的研究人员，他们可能已经从ChatGPT那里得到了一个答案，但随后会对自己说，我需要去查看正式出版版本和经过同行评审的内容，确保我所看到的信息是准确的。”

至少对于拥有强大品牌影响力的出版商而言，目前正在发生的似乎不是流量的流失，而是流量的集中：随意性的搜索越来越多地由通用AI工具处理，而到达出版商平台的用户则带着更强的目的性而来。这是否构成净收益取决于出版商的收入模式，但这与简单地将用户拱手让给AI是一个本质上不同的局面。

但另一方面，这种筛选效应将价值集中在了那些已经赢得信任的出版商身上，同时也使得展示这种信任变得更加迫切。COUNTER Metrics的执行总监Tasha Mellins-Cohen将当前这一时刻直接放在了早期内容分发决策的背景下来审视：“如果你签订的协议只着眼于眼前的利益，那么五年后你就会处于一个被动的位置，不得不低声下气地去找这些机构询问，你的内容在他们的平台上到底获得了多少使用量。”出版商与EBSCO、ProQuest和Google Scholar之间的历史关系就是一个前车之鉴，往往建立在让出版商对内容分发的实际价值缺乏充分了解的条件之上。AI时代是一个在规则尚未确立之前进行谈判的机会，不仅关乎使用报告，更关乎你的品牌的长远生存。正如JAMA Network的副出版人兼产品副总裁Paul Gee所说：“如果你的品牌未来无法通过这些工具被人们所认知，那它还能在哪里被认知呢？”

信任究竟意味着什么

无论是在临床医学出版、学术图书馆、大型商业出版商、小型学术协会，还是更广泛的领域，关于AI与用户的讨论最终总会落到同一个词上：信任。然而，信任所要求的东西，因提问者的不同而大相径庭。

对于美国儿科学会（AAP）来说，围绕其《红皮书》（儿科传染病的标准参考文献）构建AI助手，信任要求本质上是不可妥协的。当AAP对其会员进行调查时，90%的人表示，只要AI工具完全基于《红皮书》的内容，他们就愿意使用平台上的AI工具。一个基于检索增强生成（RAG）技术、以80多年的循证依据为基础、且仅限于经过审核的内容的模型，不仅仅是一个产品功能，更是该工具在专业层面具备可用性的前提条件。

在大学图书馆领域，情况则更具争议性。美国新泽西州公立社区大学图书馆馆长Jane Jiang描述了一种现象：大量年轻研究者，其中很多是第一代大学生，他们一开始就大量使用AI工具。“现在很多学生确实是先从AI工具入手的，”她说，“他们在还不知道该寻找什么的时候，就用AI来进行头脑风暴和初步定向”。AI恰恰在入门门槛让人感到最望而却步的时刻，降低了这一门槛。但学生们带着经过精心打磨的AI生成综述来到参考咨询台，却并不清楚那些来源是否真的如AI所声称的那样。教授AI素养，比如如何评估、验证AI的输出，并将其追溯到原始文献，已经成为图书馆专业人员角色的核心组成部分。

出版商面临的信任挑战介于这两极之间。通用AI工具无法区分经过同行评审的文章和预印本、当前版本和已撤稿的版本、经过重复验证的发现和初步结果。Sage出版社产品创新副总裁Andrew Smeall将此描述为出版商自建连接器的核心论据：“目前的AI对话体验仍然有点像一个‘损友’，它给出的答案听起来非常合理，但这些答案并没有在学术记录中得到充分的根据。”将AI的回答锚定在具有完整出处和元数据的出版商内容上，现在既是一个商业案例，也是对AI当前处理知识方式中真实存在的质量问题的回应。

无人为其设计的用户

关于“用户”问题，最具前瞻性的设想涉及一种出版平台根本未曾打算去服务的“用户”类型：代表研究人员自主行动的AI智能体（AI agent）。

模型上下文协议（MCP）是一种开放标准，允许AI代理直接连接外部数据源并以编程方式检索内容，其发展速度极快。MCP从首月10万次下载量，在一年内飙升至每月9700万次下载量。开发者们正在构建一个未来：AI工具不仅辅助研究，还将承担研究中相当大的一部分工作。然而在行业层面，出版商的认知仍在追赶之中。在我五月份主持的一场网络研讨会上，47%的观众表示听说过MCP但无法清楚地解释它的工作原理，27%则从未接触过这个术语。只有9%正在积极评估或实施相关集成。

开发者采纳速度与出版商准备程度之间的这一差距，既是一个机会窗口，也是一种风险。机会在于：在默认规则被那些对做好这件事投入较少的参与者所设定之前，出版商有机会塑造AI代理访问学术内容的方式。风险在于：如果出版商不构建能够体现学术出版核心价值的MCP端点，如引用归属、版本控制、撤稿处理、授权管理，那么这些默认规则将在没有他们参与的情况下被确立。

Silverchair的AI副总裁Jeremy Little指出了当前这一时刻的独特之处：与许多技术进步不同，在MCP大规模普及的三大障碍（技术就绪度、服务提供方就绪度和用户就绪度）中，用户就绪度可能是最不显著的障碍。研究人员已经在使用AI工具来完成MCP旨在改进的那些任务。差距存在于基础设施和服务提供方这一端。标准化尚未完成，出版商在构建MCP端点方面处于不同阶段，同时还在探索如何让结构化的学术元数据能够被那些在设计之初并未考虑学术记录的AI系统所理解。

要让这种价值被充分认知，还需要更新的衡量框架。COUNTER Metrics在过去一年的大部分时间里一直在制定指导方针，研究如何以符合COUNTER标准的方式统计AI生成的交互。这些框架将首次为图书馆提供一种连贯的方式，将AI辅助的使用量与传统的人类使用量并列呈现。如果通过AI中介的内容访问不能反映在使用统计中，那么出版商内容对图书馆的价值就会被系统性地低估，这最终也是出版商自身的问题。

但我们有理由保持乐观，甚至充满信心。学术出版业数十年来构建的基础设施，在AI环境中是一种资产，而非遗留包袱，例如DOI、JATS标记、结构化元数据、对版本管理和撤稿处理的承诺，这些恰恰是使学术内容对AI系统更加可信、更加有用的信号。问题在于，当内容在AI中介的工作流程中流转时，这些信号并不会自动随之传递。要实现这一点，需要那种行业历史上虽感困难但并非不可能完成的集体标准化工作。Andrew Smeall直接以JATS作类比：正如行业当初开发了一套共享的标记标准，使期刊内容能够在不同平台和数据库之间复用一样，现在行业需要一套类似的AI通信标准，一种让AI工具能够理解来源出处、版本状态和机构背景的方式。这一标准目前尚未以公认的形式存在，但所需的要素基本上已经具备。