||
编者按:在美国,分散式的医疗服务是优化癌症资料数据库的一个巨大障碍。患者需要先在社区接受肿瘤科医生的常规检查,然后在学术医疗中心进行尖端治疗。但这些就诊记录并不会通过电子方式衔接起来。患者的合并症、处方药、家族病史和既往诊断等信息都是零散的,由人工汇总这些数据既耗时又昂贵。
今年,一项针对一千万人的研究挖掘了美国军事人员的庞大医疗数据库,其中包括20多年间收集的组织样本和健康记录。研究人员发现,那些曾经感染过Epstein-Barr病毒的人患多发性硬化症的风险要比没有染过该病毒的人高出32倍,这是迄今为止证明两种病毒之间存在着因果关系的最有力证据。
这种大规模的医疗数据库或将有能力确定癌症的成因,但现今大部分的癌症数据库都存在缺陷——样本量太少;且缺少患者的既往病史。这也导致了癌症数据库不足以揭示某些癌症的潜在风险因素,也无法解释为什么同一种疾病在不同人身上会有不同的发展变化。
例如,目前很难确定少数族裔群体的癌症患者对治疗的反应,以及有哪些风险因素是他们所特有的。在美国,黑人男子患前列腺癌的可能性比白人男子高出一半,而且死于因前列腺癌的可能性是白人男子的两倍。如果没有大型且多样化的数据库,我们就无法确定导致这一群体和其他群体患癌风险增加的独特且有针对性的遗传基因、分子特征及生活方式等因素。
理想化的癌症数据库应汇集来自数百万知情同意的参与者的数据。其中涉及对不同族裔和社会经济地位的人群收集自癌症诊断时开始的信息,包括成像、组织样本和基因数据等,并通过自动链接到参与者的完整医疗记录来获取他们的病史。这些详细的数据将有助于我们追溯癌症诊断及其相关健康问题的潜在风险因素。
但如今没有任何一种数据库符合这一要求。即使是一些像挪威和丹麦那样历史悠久的数据库,其规模也相对较小,且往往只收集患者诊断时的信息。英国生物银行(UK Biobank)和马萨诸塞州剑桥市布罗德研究所(Broad Institute)的Count Me In计划虽然有将癌症诊断与患者病史联系起来,但参与者必须自愿注册登记,并提供扫描文件、血液检查和其他相关数据,且需要接受反复的医疗评估。
要将如此大规模的信息汇集在一起,癌症研究界必须利用能够将相关的数据联系起来的技术。在过去的十年里,连接健康数据和保护患者隐私的方法有了重大改进。通过使用加密标记替换可识别的个人信息,并在各数据库之间匹配特定参与者的标记,由此跨越多个数据库将个人记录进行连接。这项技术广泛应用于制药行业,并将医院的医疗记录与私人健康保险索赔系统联系起来。所有企业、政府和学术界的利益相关者都应确保该技术得到持续改进,且任何新的保密性风险都应由隐私专家来解决。
建立如此大规模的数据库离不开学术机构、政府和公众的支持。
2019 新型冠状病毒(COVID-19)大流行推动了美国在癌症数据记录方面的举措。超过75家机构共同参与了美国国家卫生研究院(National Institutes of Health)组织的National COVID Cohort Collaborative项目,收集了超过650万COVID-19患者的临床数据。美国政府应将癌症数据库作为其 "癌症登月 "(Cancer Moonshot)计划的一部分,该计划旨在在2047年前将癌症死亡率减半。政府还应要求对现有的癌症数据库和临床试验采取诸如标记化等保护隐私的记录方法。这些举措将使广大群众受益,并促进碎片式医疗保障体系的统一化管理。
撰文:T. S. Karin Eisinger-Mathason
翻译:Leah
校对:Yulia
文献:
https://www.nature.com/articles/d41586-022-03390-4
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-29 08:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社