崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

从生物医学文献中自动识别出科学严谨临床研究报告的深度学习方法:比较分析研究

已有 1882 次阅读 2019-2-27 15:45 |个人分类:生物医学文本挖掘|系统分类:科研笔记

背景:

开展循证医学实践中遇到的主要障碍是有效地找到关于特定临床主题的科学合理的研究。

 

目的:

探索采用深度学习方法从生物医学文献中检索科学合理的治疗研究。

 

方法:

我们使用403,216PubMed记录作为噪声数据集,以标题和摘要作为特征训练卷积神经网络。将深度学习模型与目前使用的搜索过滤器进行了比较,过滤器有PubMed的临床查询中治疗扩展过滤器,McMaster的文本搜索策略(无医学主题标题,MeSH,术语)和临床查询平衡治疗过滤器。以先前注释的数据集(Clinical Hedges)用作金标准。

 

结果:

深度学习模型获得的召回率显著低于临床查询治疗扩展过滤器(96.9vs 98.4; P <.001;但召回率与McMaster的文字搜索(96.9vs 97.1; P = .57)和临床查询平衡过滤器(96.9vs 97.0; P = .63)相当。深度学习获得的精确度明显高于临床查询广泛过滤器(34.6vs 22.4; P <.001)和McMaster的文本搜索(34.6vs 11.8; P <.001),但明显低于临床查询平衡过滤(34.6%对40.9; P <.001)。

 

结论:

与目前流行的检索过滤器相比,深度学习表现良好,尤其是当文献记录尚未被标引的时候。与以前的机器学习方法不同,本文提出的深度学习模型不需要特征工程,用时少或不需要诸如MeSH词和文献计量学等特定特征。深度学习是识别科学严谨的临床研究报告的有前途的方法。需要进一步的工作来优化深度学习模型并评估其他领域的普遍性,例如诊断,病因和预后。


A Deep Learning Method to Automatically Identify Reports of Scientifically Rigorous Clinical Research from the Biomedical Literature: Comparative Analytic Study.

JMIR 2018




http://blog.sciencenet.cn/blog-82196-1164549.html

上一篇:喜欢做的和必须做的,为什么不能任性呢?
下一篇:OntoPlot:大型本体中非层次关联的一种新型可视化(译文)

1 周春雷

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-6-13 10:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部