||
今天给大家介绍一篇关于临床大数据中的数据挖掘的综述文章,2021年发表在SCI 1区 Military Medical Research(IF21.1)杂志上,该综述主要总结了临床大数据中的数据挖掘,包括常用的数据库、步骤和方法模型。
许多高质量的研究来自公共数据库,如监测、流行病学和最终结果(SEER)、国家健康和营养检查调查(NHANES)、癌症基因组图谱(TCGA)和重症监护医学信息集(MIMIC); 然而,这些数据往往具有高度的异质性、时效性、稀缺性、不规则性等特点,导致这些数据的价值没有得到充分利用。 数据挖掘技术已经成为医学研究的一个前沿领域,因为它在评估患者风险和辅助建立疾病预测模型的临床决策方面表现出了优异的性能。 因此,数据挖掘在临床大数据研究中,尤其是在大型医学公共数据库中具有独特的优势。本文介绍了主要的医学公共数据库,并用简单的语言描述了数据挖掘的步骤、任务和模型。 此外,我们还介绍了数据挖掘方法及其实际应用。 本研究的目的是帮助临床研究人员对数据挖掘技术在临床大数据中的应用有一个清晰直观的认识,以促进产生对医生和患者都有利的研究成果。
临床大数据、数据挖掘、机器学习、医学公共数据库、SEER、NHANES、TCGA、MIMIC
“大数据”的使用改变了现代生活的多个方面,它的使用与能够改善现状的数据挖掘方法相结合。 本研究的目的是帮助临床研究人员了解数据挖掘技术在临床大数据和公共医学数据库中的应用,以促进其研究目标的实现,从而造福于临床医生和患者。 所提供的例子提供了对临床研究应用的数据挖掘过程的洞察力。 值得注意的是,研究人员担心大数据和数据挖掘方法并不完全适合充分复制实际的临床情况,其结果可能会误导医生和病人。 因此,鉴于新技术和新趋势的发展速度,有必要对其潜在影响保持积极态度,同时在审查其应用所带来的结果时保持谨慎。
“大数据”的使用改变了现代生活的多个方面,它的使用与数据挖掘方法相结合,能够改善现状。 本研究的目的是帮助临床研究人员了解数据挖掘技术在临床大数据和公共医学数据库中的应用,以促进其研究目标的实现,从而造福于临床医生和患者。 所提供的例子提供了对临床研究应用的数据挖掘过程的洞察力。 值得注意的是,研究人员担心大数据和数据挖掘方法并不完全适合充分复制实际的临床情况,其结果可能会误导医生和病人。 因此,鉴于新技术和新趋势的发展速度,有必要对其潜在影响保持积极态度,同时在审查其应用所带来的结果时保持谨慎。 目前,这项技术正在应用于预测病人的疾病,随着进一步的改进,这些预测的准确性和速度都有所提高。 此外,值得注意的是,技术的发展将同时要求更高质量的数据,这将是准确应用技术的先决条件。
最后,本研究的最终目的是解释与数据挖掘相关的和常用的处理临床大数据的方法。 这一综述将潜在地促进进一步的研究,并帮助医生和病人。
Wu W T, Li Y J, Feng A Z, et al. Data mining in clinical big data: the frequently used databases, steps, and methodological models[J]. Military Medical Research, 2021, 8: 1-12.
(原文链接:https://link.springer.com/article/10.1186/s40779-021-00338-z)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 19:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社