||
背景:
开展循证医学实践中遇到的主要障碍是有效地找到关于特定临床主题的科学合理的研究。
目的:
探索采用深度学习方法从生物医学文献中检索科学合理的治疗研究。
方法:
我们使用403,216条PubMed记录作为噪声数据集,以标题和摘要作为特征训练卷积神经网络。将深度学习模型与目前使用的搜索过滤器进行了比较,过滤器有PubMed的临床查询中治疗扩展过滤器,McMaster的文本搜索策略(无医学主题标题,MeSH,术语)和临床查询平衡治疗过滤器。以先前注释的数据集(Clinical Hedges)用作金标准。
结果:
深度学习模型获得的召回率显著低于临床查询治疗扩展过滤器(96.9%vs 98.4%; P <.001);但召回率与McMaster的文字搜索(96.9%vs 97.1%; P = .57)和临床查询平衡过滤器(96.9%vs 97.0%; P = .63)相当。深度学习获得的精确度明显高于临床查询广泛过滤器(34.6%vs 22.4%; P <.001)和McMaster的文本搜索(34.6%vs 11.8%; P <.001),但明显低于临床查询平衡过滤(34.6%对40.9%; P <.001)。
结论:
与目前流行的检索过滤器相比,深度学习表现良好,尤其是当文献记录尚未被标引的时候。与以前的机器学习方法不同,本文提出的深度学习模型不需要特征工程,用时少或不需要诸如MeSH词和文献计量学等特定特征。深度学习是识别科学严谨的临床研究报告的有前途的方法。需要进一步的工作来优化深度学习模型并评估其他领域的普遍性,例如诊断,病因和预后。
A Deep Learning Method to Automatically Identify Reports of Scientifically Rigorous Clinical Research from the Biomedical Literature: Comparative Analytic Study.
JMIR 2018
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 10:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社