zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

全血基因表达特征预测肌萎缩侧索硬化症病例状态和生存

已有 155 次阅读 2025-12-31 16:33 |个人分类:科普|系统分类:科普集锦

全血基因表达特征预测肌萎缩侧索硬化症病例状态和生存 

ALS 是一种进行性、致命性、神经退行性疾病,从确诊到中位生存期仅为 2 4 年。ALS 在日常临床实践中仍难以识别。患者表现出与其他更常见疾病相似的症状和体征,误诊和错误相对频繁。确诊为 ALS 的中位时间因亚型不同而异,为 5 15 个月,甚至对某些患者长达 19 个月。这种诊断延迟会推迟治疗,从而对生存产生不利影响,因为早期使用标准护理药物利鲁唑和多学科护理可改善临床结果。此外,延迟诊断会使许多人被排除在外。来自 ALS 试验的患者,这些试验通常招募病情较轻的参与者,同时也让患者更少的时间来安排他们的财务、法律、心理和精神事务。 

尽管迫切需要改进诊断方法以缩短 ALS 患者的诊断延迟,但目前尚未开发出理想的 ALS 生物标志物。神经丝轻链(NfL)是目前最领先的生物标志物,ALS 患者的血清和脑脊液(CSFNfL 水平均显著高于对照组,且在无症状高危个体发展为 ALS 时也会升高。然而,NfL 作为生物标志物存在一个关键缺陷。作为神经元损伤的指标,NfL 水平在其他多种疾病中也会升高,例如轻度认知障碍、阿尔茨海默病、帕金森病、多发性硬化症、糖尿病周围神经病变、各种其他神经退行性疾病,甚至全因死亡率。因此,NfL 作为 ALS 诊断工具缺乏特异性。 

替代单一生物标志物测量方法,基因转录组谱可作为具有商业可行性的临床工具。PAM50 是一种经美国食品药品监督管理局(FDA)批准的基因表达生物标志物面板,通过 50 个基因的表达来分类乳腺癌亚型。最近开发的一种 18 基因 qPCR 阵列可以从生物液体样本中诊断高级别前列腺癌。基于全血预测 ALS 病例对照状态的基因特征也在文献中报道但只有一个是独立外部数据集进行了测试,表现不佳(准确率 63.3%,灵敏度 60.0%,特异性 66.7%AUC64.7%)。其他报道的基因特征在独立外部数据集上的性能和准确性未经测试,因此将其作为诊断 ALS 生物标志物面板的使用尚不确定。 

当前研究的目标是开发一个基因分类器,作为未来肌萎缩侧索硬化症(ALS)生物标志物面板,以加速 ALS 的诊断。最近,从大量 ALS 病例与对照组的可获取全血样本中分析了基因表达谱。我们采用了 RNA 测序(RNA-seq)技术,检测到超过 22,000 个蛋白质编码基因、长链非编码 RNA 和微 RNA。我们利用这个丰富而详细的基因表达数据集,评估了血液基因表达区分 ALS 病例与对照组的能力,发现使用各种机器学习分类器均能获得高准确率。最佳分类器还能在完全独立的外部测试队列中预测病例与对照组的状态。 

我们通过两种方式扩展了这一成功。首先,Zhao等人将基因特征与临床变量相结合,以增强 ALS 生存预测,解决了该领域尚未满足的需求(图1)。其次,作者们对血液转录组数据集进行了通路富集分析,揭示了与 ALS 相关的通路。通过选择了与原发性疾病组织中差异表达基因(DEG)重叠的核心基因,然后使用这些核心基因作为药物扰动分析的输入,从而确定了未来 ALS 治疗可评估的药物候选者。 

image.png

1 研究设计概述。a 从病例组和对照组收集的血液样本进行了 RNA 测序处理。b 通过主要(未调整)和调整免疫细胞比例的分析,识别了在肌萎缩侧索硬化症(ALS)病例(n=422)与对照组(n=272)中差异表达的基因(DEG)。c (i) ALS 病例-对照分类器:七种机器学习(ML)算法的比较;改进表现最佳的 ML 算法 XGBoost 的性能;在内部和外部等数据集上测试三个基因面板和一个组合的 46 基因面板。(ii) ALS 病例生存分类器:用于基因过滤的标准;训练两种 ML 算法,XGBoost 和逐步使用基因特征与临床变量;比较 XGBoost 与逐步(基因特征+临床变量)与仅含临床变量的模型在我们的内部和外部等数据集中的表现。(iii)通路分析以识别血液中的 ALS 疾病特征:Kyoto Encyclopedia of Genes and GenomesHallmark Gene Ontology 通路富集分析针对主要差异表达基因;对差异表达基因进行细胞比例校正的分析;校正后与主要差异表达基因的通路分析。(iv)药物扰动分析以识别 ALS 治疗候选药物:识别校正后和主要差异表达基因的核心基因,这些基因与 TDP-43 敲降的人诱导多能干细胞(iPSC)来源神经元和 ALS 尸检脊髓中的差异表达基因重叠;核心基因的药物扰动分析 

参考文献

[1] Zhao, Y., Savelieff, M.G., Li, X. et al. Gene expression signatures from whole blood predict amyotrophic lateral sclerosis case status and survival. Nat Commun 16, 9631 (2025). https://doi.org/10.1038/s41467-025-64622-5 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1516607.html

上一篇:无模型假设的单细胞和空间转录组数据差异表达分析
收藏 IP: 39.128.49.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-12-31 20:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部