zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

人工智能应用于文献综述:机遇与挑战

已有 1254 次阅读 2024-12-4 10:15 |个人分类:科普|系统分类:科普集锦

人工智能应用于文献综述:机遇与挑战

系统文献综述(Systematic Literature ReviewSLR)是一种严谨而有组织的方法,用于评估和整合先前对特定主题的研究。其主要目标是精心识别和评估与特定研究问题相关的所有相关文献,坚持严格协议以尽量减少偏见。这种方法最初出现在循证医学领域,随后被应用于其他不同研究学科,包括社会科学、工程和技术、教育、环境科学以及商业和管理。

SLR被认为是具有耗时和资源密集特点。这是由几个因素造成的,包括漫长过程(可能会持续一年以上)、组建领域专家团队的必要性、数据库订阅、专业软件和人员薪酬带来的重大财务影响、出版物数量不断增加,以及定期更新以保持相关性的需求。

在过去几十年里,已经开发了许多工具来支持甚至部分自动化SLR,旨在解决这些挑战。其中许多工具采用了人工智能(AI)解决方案,特别是筛选和数据提取阶段。自然语言处理(NLP)中出现了更复杂的人工智能技术,如大型语言模型(LLM),这进一步推动了人工智能与SLR工具的结合,这些技术有可能彻底改变这些系统。虽然有大量研究已经调查了SLR工具,相对较少的研究探讨了人工智能在这一领域的作用。此外,这些研究集中在有限的人工智能特征选择上。

最近,Bolaños等人进行了人工智能应用于的文献综述的调查,旨在通过严格检查人工智能技术在SLR半自动化中的应用。主要在两个主要应用阶段,即筛选和提取,来解决现有的差距。为此,作者们首先对之前的8项调查进行了分析,并确定了文献中最突出的特征。接下来,定义了一个分析框架,该框架集成了23个通用特性和11个与基于人工智能的功能相关特性。然后,选择了21个突出的SLR工具,并使用得到的框架对它们进行了严格分析。作者们广泛地讨论了当前的研究趋势、主要研究挑战和未来研究方向。特别关注了三个主要的研究挑战:(1)集成先进的人工智能解决方案,如大型语言模型和知识图谱;(2)增强可用性;(3)开发标准化评估框架。作者们还提出了一组最佳实践,以确保对性能、可用性和透明度进行更可靠评估。最后,对11个最近的工具进行了额外的分析,这些工具利用LLM功能(主要是通过OpenAI APIChatGPT)来搜索文献和帮助学术写作。虽然这些工具并不直接迎合SLR,但它们的功能有可能集成到未来的SLR工具中。总之,本调查旨在为学者们提供一个深入了解人工智能在这一领域的应用,同时也突出了未来研究的潜在途径。

全文首先对SLR阶段及其与AI的关系的描述。然后概述了用来确定调查中讨论SLR工具的方法。其次,提供了先前关于SLR工具分析AI功能调查的元视图。此外,对21种工具进行了深入研究。讨论了关键的研究挑战,并提出了一些评估人工智能增强SLR工具的最佳实践,分析了旨在协助研究人员的最新一代LLM为基础的系统。

作者们采用PRISMA(系统评价和荟萃分析首选报告项目)标准方法进行和报告系统评价和荟萃分析。如图1所示,PRISMA图说明了该过程的主要阶段,并且使用了三种主要策略来识别工具。

image.png

1关于人工智能强SLR工具的PRISMA

参考文献

[1] Bolaños, F., Salatino, A., Osborne, F. et al. Artificial intelligence for literature reviews: opportunities and challenges. Artif Intell Rev 57, 259 (2024). https://doi.org/10.1007/s10462-024-10902-3

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1462884.html

上一篇:SURD:将因果关系分解为协同、独特和冗余成分
下一篇:TransmiR 3.0:转录因子-miRNA调控更新数据库
收藏 IP: 112.116.155.*| 热度|

1 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-25 12:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部