博文

科学文献服务器开始使用ChatGPT！

已有 9558 次阅读 2023-8-4 07:26 |系统分类:海外观察

ChatGPT们表面是聊天机器，本质是智能搜索，这就和传统的搜索引擎，科学搜索数据库的功能存在重叠。又因为这种工具的智能化特征，则必然导致传统这些互联网功能被颠覆。这也体现在具体现象上，最早开始行动的正是传统的网络搜索引擎们，如谷歌、微软、百度等，然后是办公软件，再就是科学搜索服务商们。根据最新报道，爱思唯尔等国际科学数据库公司开始发布ChatGPT驱动的AI界面，Web of Science数据库也积极引入。

ChatGPT-like AIs are coming to major science search engines (nature.com)

互联网搜索引擎的对话式人工智能聊天机器人，如谷歌的巴德（Bard）和Microsoft的必应（Bing），看起来也越来越改变科学搜索。8月1日，荷兰出版巨头爱思唯尔（Elsevier）为其Scopus数据库的一些用户发布了一个由ChatGPT驱动的AI界面，而英国公司Digital Science则宣布对其Dimensions数据库的AI大型语言模型（LLM）助手进行封闭试验。与此同时，美国公司Clarivate表示，它也在努力将LLM引入其Web of Science数据库。

用于科学搜索的LLM并不新鲜：Elicit，Scite和Consensus等初创公司已经拥有这样的AI系统，这些系统有助于总结一个领域的发现或确定顶级研究，依靠免费的科学数据库或（在Scite的情况下）通过与出版商合作访问付费研究文章。但是，拥有大型科学摘要和参考文献专有数据库的公司现在正在加入人工智能热潮。

爱思唯尔的聊天机器人名为Scopus AI，作为试点推出，旨在作为一种轻松有趣的工具，帮助研究人员快速获得他们不熟悉的研究主题的摘要，爱思唯尔伦敦高管Maxim Khan说，他负责该工具的开发。为了回答自然语言问题，机器人使用 LLM GPT-3.5 版本返回有关研究主题的流畅摘要段落，以及引用的参考文献和要探索的进一步问题。

对LLM搜索（尤其是科学搜索）的担忧是它们不可靠。LLM不理解他们产生的文本;他们只是通过吐出风格上合理的词来工作。他们的输出可能包含事实错误和偏见，正如学者们很快发现的那样，可以编造不存在的参考资料。

因此，Scopus AI受到限制：它只能通过参考五到十个研究摘要来生成答案。人工智能本身找不到这些摘要：相反，在用户输入查询后，传统的搜索引擎会将它们作为与问题相关的内容返回，Khan解释说。

许多其他人工智能搜索引擎系统也采用了类似的策略，新加坡管理大学的图书馆员Aaron Tay指出，他关注人工智能搜索工具。这有时被称为检索增强生成，因为LLM仅限于总结另一个搜索引擎检索的相关信息。“LLM仍然偶尔会产生幻觉或编造事情，”Tay说，并指出对互联网搜索AI聊天机器人的研究，如Bing和Perplexity，它们使用类似的技术。

爱思唯尔将其人工智能产品限制为仅搜索自2018年以来发表的文章，以便获取最近的论文，并指示其聊天机器人在其回复中适当引用返回的摘要，以避免不安全或恶意查询，并说明其收到的摘要中是否没有相关信息。这不能避免错误，但可以最大限度地减少错误。爱思唯尔还通过为机器人的“温度”选择一个较低的设置来降低其人工智能的不可预测性——衡量它选择偏离响应中最合理单词的频率。

用户可能只是将机器人的段落复制并粘贴到他们自己的论文中，从而有效地抄袭该工具吗？这是一种可能性，汗说。他说，到目前为止，爱思唯尔已经通过指导来解决这个问题，要求研究人员负责任地使用这些摘要。Khan指出，资助者和出版商也发布了类似的指导意见，要求透明披露LLM是否用于撰写论文或进行同行评审，或者在某些情况下声明根本不应该使用LLM。

目前，该工具仅向大约15，000名用户推出，这是Scopus订阅者的一部分，如果其他研究人员想尝试，请与爱思唯尔联系。该公司表示，预计将在2024年初全面推出。

同样在8 月 1 日，数字科学宣布将为其大型 Dimensions 科学数据库引入人工智能助手，目前仅适用于选定的 beta 测试人员。与 Scopus AI 一样，在用户输入问题后，搜索引擎首先检索相关文章，然后开放 AI GPT 模型围绕已检索到的排名靠前的摘要生成摘要段落。

“这非常相似，很有趣，”该公司首席产品官克里斯蒂安·赫尔佐格（Christian Herzog）说。（Digital Science是Holtzbrinck Publishing Group的一部分，Holtzbrinck Publishing Group是Nature出版商Springer Nature的大股东。

Dimensions还使用LLM提供有关相关论文的更多详细信息，包括其发现的简短改写摘要。

赫尔佐格表示，该公司希望在今年年底前更广泛地发布其工具，但目前正与科学家，资助者和其他使用Dimensions测试LLM可能有用的人合作 - 这还有待观察。“这是关于逐渐融入新技术并建立信任，”他说。

Tay说，他期待在论文全文上使用LLM的工具，而不仅仅是摘要。他指出，像Elicit这样的网站已经允许用户使用LLM来回答有关论文全文的详细问题 - 当机器人可以访问它时，就像一些开放获取的文章一样。

与此同时，在称之为“学术界和政府部门”的科睿唯安该公司总裁Bar Veinstein表示，该公司正在“努力在Web of Science中添加LLM驱动的搜索”，指的是与位于以色列特拉维夫的AI21 Labs签署的战略合作伙伴关系，两家公司在六月份宣布。然而，Veinstein没有给出发布基于LLM的Web of Science工具的时间表。

转载本文请联系原作者获取授权，同时请注明本文来自孙学军科学网博客。
链接地址：https://blog.sciencenet.cn/blog-41174-1397794.html

上一篇：供不应求的减肥药们
下一篇：吃知了这事上了今天《科学》新闻

欢迎参加科学网十佳博文评选活动！

主办单位：

支持单位：

收藏 IP: 117.135.12.*| 热度|

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

科学文献服务器开始使用ChatGPT！

当前推荐数：11 推荐人：郑永军 王从彦 张学文 许培扬 焦飞 曾杰 农绍庄 杨正瓴 王启云 崔锦华 彭真明

该博文允许注册用户评论请点击登录评论 (2 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

博文

科学文献服务器开始使用ChatGPT！

当前推荐数：11 推荐人： 郑永军 王从彦 张学文 许培扬 焦飞 曾杰 农绍庄 杨正瓴 王启云 崔锦华 彭真明

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

孙学军

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

氢分子医学分享 http://blog.sciencenet.cn/u/孙学军对氢气生物学效应感兴趣者。可合作研究：sunxjk@hotmail.com 微信 hydrogen_thinker

当前推荐数：11 推荐人：郑永军王从彦张学文许培扬焦飞曾杰农绍庄杨正瓴王启云崔锦华彭真明

该博文允许注册用户评论请点击登录评论 (2 个评论)