||
人工智能应用于文献综述:机遇与挑战
系统文献综述(Systematic Literature Review,SLR)是一种严谨而有组织的方法,用于评估和整合先前对特定主题的研究。其主要目标是精心识别和评估与特定研究问题相关的所有相关文献,坚持严格协议以尽量减少偏见。这种方法最初出现在循证医学领域,随后被应用于其他不同研究学科,包括社会科学、工程和技术、教育、环境科学以及商业和管理。
SLR被认为是具有耗时和资源密集特点。这是由几个因素造成的,包括漫长过程(可能会持续一年以上)、组建领域专家团队的必要性、数据库订阅、专业软件和人员薪酬带来的重大财务影响、出版物数量不断增加,以及定期更新以保持相关性的需求。
在过去几十年里,已经开发了许多工具来支持甚至部分自动化SLR,旨在解决这些挑战。其中许多工具采用了人工智能(AI)解决方案,特别是筛选和数据提取阶段。自然语言处理(NLP)中出现了更复杂的人工智能技术,如大型语言模型(LLM),这进一步推动了人工智能与SLR工具的结合,这些技术有可能彻底改变这些系统。虽然有大量研究已经调查了SLR工具,相对较少的研究探讨了人工智能在这一领域的作用。此外,这些研究集中在有限的人工智能特征选择上。
最近,Bolaños等人进行了人工智能应用于的文献综述的调查,旨在通过严格检查人工智能技术在SLR半自动化中的应用。主要在两个主要应用阶段,即筛选和提取,来解决现有的差距。为此,作者们首先对之前的8项调查进行了分析,并确定了文献中最突出的特征。接下来,定义了一个分析框架,该框架集成了23个通用特性和11个与基于人工智能的功能相关特性。然后,选择了21个突出的SLR工具,并使用得到的框架对它们进行了严格分析。作者们广泛地讨论了当前的研究趋势、主要研究挑战和未来研究方向。特别关注了三个主要的研究挑战:(1)集成先进的人工智能解决方案,如大型语言模型和知识图谱;(2)增强可用性;(3)开发标准化评估框架。作者们还提出了一组最佳实践,以确保对性能、可用性和透明度进行更可靠评估。最后,对11个最近的工具进行了额外的分析,这些工具利用LLM功能(主要是通过OpenAI API的ChatGPT)来搜索文献和帮助学术写作。虽然这些工具并不直接迎合SLR,但它们的功能有可能集成到未来的SLR工具中。总之,本调查旨在为学者们提供一个深入了解人工智能在这一领域的应用,同时也突出了未来研究的潜在途径。
全文首先对SLR阶段及其与AI的关系的描述。然后概述了用来确定调查中讨论SLR工具的方法。其次,提供了先前关于SLR工具分析AI功能调查的元视图。此外,对21种工具进行了深入研究。讨论了关键的研究挑战,并提出了一些评估人工智能增强SLR工具的最佳实践,分析了旨在协助研究人员的最新一代LLM为基础的系统。
作者们采用PRISMA(系统评价和荟萃分析首选报告项目)标准方法进行和报告系统评价和荟萃分析。如图1所示,PRISMA图说明了该过程的主要阶段,并且使用了三种主要策略来识别工具。
图1关于人工智能强SLR工具的PRISMA
参考文献
[1] Bolaños, F., Salatino, A., Osborne, F. et al. Artificial intelligence for literature reviews: opportunities and challenges. Artif Intell Rev 57, 259 (2024). https://doi.org/10.1007/s10462-024-10902-3
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-6 04:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社