数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

基于深度学习的患者再入院风险预测——“大数据与智能决策”讨论班

已有 842 次阅读 2020-1-17 08:25 |个人分类:科研笔记|系统分类:科研笔记

患者再入院风险预测

现代医学字典把再入院定义为"患者在出院后短期内被再次收入住院"。然而这个定义缺乏测量意义。在实际研究中,对再入院的期间定义是不统一的,包括3天、7天、1个月(30天或28天)、2个月、4个月或12个月。7天内再入院主要反映住院服务质量(如因过早出院而再入院),8~30天再入院主要反映患者疾病的严重程度或慢性病情况(因患者原因再入院)。

通常针对某些重点疾病进行再入院风险和原因分析。如欧洲和美国比较研究主要针对6类疾病:心肌梗死、慢性阻塞性肺部疾患、哮喘、中风、糖尿病、全髋关节置换手术等。患者因素和医疗服务提供者因素共同影响再入院率,两类因素往往交织在一起,难以截然分清。因此需要慎重地诠释再入院率的高低,并在医院绩效评价中慎重地使用再入院率。

人口老龄化带来中国医院住院患者年龄结构的变化,老年患者、慢性病患者、共病患者增加。同时,通过缩短平均住院日来提高床位利用率和周转次数,提高医院效率,成为中国公立医院在筹资困境下"规模无形扩张"的一种策略。

参考文献:杨辉,Shane Thomas. 再入院:概念、测量和政策意义[J]. 中国卫生质量管理, 2009,16(5): 113-115

基于深度学习和电子健康记录的患者再入院预测

讨论文献:Ashfaq A., Sant'Anna A., Lingman M., et al. Readmission prediction using deep learning on electronic health records[J]. Journal of biomedical informatics. 2019,97: 103256.

准确预测再入院在提高医院运营效率和医疗质量方面具有临床意义。计划外30天再入院是充血性心力衰竭(CHF)患者的一个特征,大约四分之一的充血性心力衰竭患者会在出院30日以内再入院。计划外的再入院患者会带来严重的健康风险并增加护理成本,同时也不利于医疗机构医疗水平的评估。为了减少再入院率和降低护理成本,对有再入院风险的患者实施有针对性的干预计划是非常重要的,这需要在出院时确定高危患者,预测其再入院的风险。

文章基于2012年至2016年间在瑞典住院的7500多名CHF患者的真实数据,构建并测试了一个深度学习框架,以预测30天的计划外再入院。文章提出一个成本敏感的长期短期记忆(LSTM)神经网络模型,融合了专家特征和上下文嵌入临床特征。本研究以单一架构中电子健康纪录(EHR)驱动预测模型的关键元素为目标,同时使用专家与机器衍生的特征,整合序列模式,并解决类别不平衡问题。

文章评估每个元素对预测性能(ROC-AUC,F1度量)和成本节约的贡献。结果表明,具有所有关键元素的模型实现了更高的辨别能力(AUC:0.77;F1:0.51;成本:最大可能节省的22%)优于在至少两个评价度量中的简化模型。此外,文章提出了一个简单的财务分析,以估计如果向高风险患者提供有针对性的干预措施每年的成本节省。

文章首先讲述了研究背景,提出研究的科学问题:出院时患者再入院的概率是多少?文章也梳理了60项研究中的73个预测再入院的模型,总结出存在的问题:首先是已有研究仅使用人类衍生特征或机器衍生特征,其次是已有研究忽略嵌入在电子健康记录(EHR)中的事件的顺序或时间轨迹,还有就是未能考虑类别不平衡和错误分类的差异成本方面的偏差。文章基于这些研究不足来开展本研究:一方面构建了融合人类衍生特征和机器衍生特征的序列模型来预测患者的再入院风险,另一方面也进行了可能的成本节约估计,为决策者提供决策支持。

文章基于此研究背景,进行了EHR表示,分别对人类衍生特征和机器衍生特征进行学习表示,并将人类衍生特征和机器衍生特征融合,来表示每一次问诊,如图1所示。


image.png

图1. 人类衍生特征和机器衍生特征融合的患者表示


image.png

图2. 成本敏感的长期短期记忆(LSTM)神经网络模型


将统一患者的就诊记录抽取,依据定义的标签,运用监督学习的方式进行学习,训练模型,如图2所示。将训练好的模型运用到患者的检测上,如图3所示。基于预测结果,构建成本节约模型,来分析对高风险患者干预对于成本的节约。


image.png

图3. 将训练好的模型运用到患者再入院风险预测


文章最后也指出了研究局限性。首先,本研究的数据来自瑞典,可能具有很强的地域特点,对于结论的普适性值得进一步探讨;其次是本研究忽略了EHR的真实实验室值将实验室视为二元指标;最后,自然语言处理(NLP)启发的嵌入技术的一个关键限制是,它们不能解释词汇表中的罕见单词。罕见的临床代码,如癌症或艾滋病病毒,如果出现在患者资料中,可能具有重要意义。

备注:2019年11月12日晚上,“糖果之家”相约星期二,“大数据与智能决策”讨论班(Seminar)继续开讲,本次讨论班以“患者再入院风险预测”为题,共讨论了一篇文献,由博士生进行讲解,共有青年教师、博士后、博士生和硕士生20人参加。




http://blog.sciencenet.cn/blog-34250-1214578.html

上一篇:城市计算与轨迹数据挖掘——“大数据与智能决策”讨论班
下一篇:基于深度神经网络的情感分类——“大数据与智能决策”讨论班

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-4-4 04:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部