zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

scMultiomeGRN:基于深度学习的细胞类型特异性基因调控网络推断方法

已有 675 次阅读 2025-3-28 16:50 |个人分类:科普|系统分类:科普集锦

scMultiomeGRN:基于深度学习的细胞类型特异性基因调控网络推断方法 

定义细胞身份和状态之间的转换对于理解生物发育和人类疾病的机制至关重要。因此,探索这些转换可以揭示生物发育和人类疾病的潜在过程。基因调控网络(GRN)描述了转录调控因子与多个顺式调控DNA序列之间的复杂相互作用,在确定细胞身份中起关键作用。识别人类健康和疾病中GRN细胞异质性的结构和功能为细胞重编程的新方法铺平了道路,并且有助于发现了疾病机制和推进治疗开发。 

转录因子(TF)是特异性结合DNA序列的蛋白质,单独或与其他蛋白质/基因一起调节基因表达。TF之间复杂的互作关系通常以TF介导的GRN为代表。GRN提供了遗传和基因组信息如何在生命系统中转移的全面视图,并且是理解基因表达过程的关键组成部分。识别GRN中的网络模块和基序(GRN拓扑结构和组织模式的基础),可以揭示生物发育和进化中的转录调控机制。构建GRN的传统方法主要依赖于破译TF与其靶基因之间的相互作用。由于GRN的复杂性,使用实验方法在多种人类细胞类型中系统地鉴定GRN是极其困难的。单细胞测序和单细胞ATAC测序方法能够收集大规模的转录组和表观基因组图谱,为系统鉴定GRN铺平了道路。 

随着高通量测序技术的快速发展,单细胞水平的GRN分析已成为可能,但常用的计算方法主要基于相关系数或互信息来衡量基因共表达模式,无法处理高维数据,并且对噪声敏感。近年来,随着深度学习在自然语言处理领域的巨大成功,研究人员越来越多地开始探索将深度学习应用于复杂疾病的GRN推断,从而探索疾病的发病机制并预测潜在药物。例如,Xie等人开发了一种筛选工作流程,该流程结合了先进的人工智能和经典的湿实验室方法,以识别新型线粒体自噬调节剂,作为阿尔兹海默病治疗的潜在候选药物。为了更深入了解阿尔兹海默病的潜在基因调控,Zhu等人提出了一种基于图学习的单细胞调控网络方法,用于从单细胞数据中识别潜在的调控机制。DeepSEM提出了一种基于β-VAE框架的结构方程模型来预测GRN邻接矩阵中基因间的调控关系。此外,共表达卷积神经网络(CNNC)也被提出,CNNC将基因对的共表达精细地转换为图像直方图,从而将卷积神经网络应用于基因-基因关系预测。然而,大多数这些方法仅关注基因对的调控关系,未能利用GRN的固有全局调控结构,对细胞数量较少的罕见细胞类型/亚型的总体性能较差。此外,在避免引入额外噪声的同时整合多组学数据集仍然是一个重大挑战。 

最近,Xu等人提出了一种新方法scMultiomeGRN(图1https://doi.org/10.5281/zenodo.14848389),这是一个深度学习框架,通过scRNA-seqscATAC-seq数据的独特整合来推断生物学相关的GRN。具体来说,将GRN假设为属性图,其中节点表示TF,并包含来自scRNA-seqscATAC-seq分析数据的特征。边表示TF之间的基因组调控关系,其特征在于基因表达(scRNA-seq)和染色质可及性(scATAC-seq)。 随后,scMultiomeGRN通过构建特定模态邻域聚合器和跨模态注意力来学习TF表示。通过学习特定模态邻域聚合器,计算出每个TF的一组表示,解决了有效整合异构多组学数据的挑战。引入了跨模态注意力模块,通过准确捕获每个TF的模态异构表示来计算最终的TF表示,在多个单细胞多组学基准数据集(scRNA-seqscATAC-seq)中证明了scMultiomeGRN与最先进的模型相比的高性能。通过scMultiomeGRN,使用阿尔兹海默病作为原型案例鉴定了小胶质细胞的病理生物学特异性GRN 

  image.png

1 scMultiomeGRN工作流程概述。scMultiomeGRNscATAC-seqscRNA-seq数据为输入,由三个步骤组成。第一步,(A)构建GRN骨架,由一组最大似然TF-TF交互(链接)组成。GRN骨架由初始邻接矩阵表示。(B)第二步是计算每个细胞中每个TF节点的特征以及TFTF之间的边缘特征。最后是(C)模型的构建与验证 

结论

作者们提出了一个新的深度学习模型scMultiomeGRN,用于从scRNA-seqscATAC-seq数据中推断GRN。与以往的模型不同,scMultiomeGRNGRN概念化为属性图,其中节点表示TF并结合来自不同组学数据的特征。此外,构建了两个模块来聚合scRNA-seqscATAC-seq数据的特征信息:模态特定邻居聚合模块和跨模态注意层模块,其中模态特定邻居聚合分别用于聚合scRNA-seqscATAC-seq数据的邻居信息,在聚合邻居信息时,跨模态注意层用于在组合组学特征时添加注意机制,以学习线性模式之间的非相关性。scMultiomeGRN能生成真实的调控网络,以及针对稀有细胞类型/亚型的GRN推断。此外,通过分析预测的GRN特异性,可以提高各种方法推断具有生物学意义的GRN精确度。这种详细的评估对于阐明基因调控的复杂机制以及理解疾病的病因和进展至关重要。例如,scMultiomeGRN通过比较正常和阿尔兹海默病样本之间的GRN改变,确定了SPI1RUNX在阿尔兹海默病风险基因座中的核心TF调控作用。总之,scMultiomeGRN旨在整合scRNA-seqscATAC-seq数据,以推断由于知识不完整而导致的TF相互作用缺乏,更有利于推断GRN结构的内在信息。 

目前研究中存在一些潜在的局限性。首先,scMultiomeGRN独特地整合了scRNAseqscATAC-seq数据,以便于推断多种组织特异性疾病中的GRN。然而,了解不同组织和器官之间的空间特异性调控机制仍然是一个挑战。未来的工作应集中在整合空间转录组学数据,以提供更全面和详细的理解,从而更准确地推断GRN的拓扑结构和机理。其次,scMultiomeGRN在很大程度上依赖于ChIP-seq数据集的数据质量。这在过滤掉<10%的峰后显著减少了TF数量。未来的工作可以扩展scMultiomeGRN,使其不太容易受到数据集稀疏性的影响。此外,扩展框架以包括非TF基因并考虑TF与其靶基因之间的因果调控关系是至关重要的。最后,scRNA-seqscATAC-seq的单细胞基础模型将提供丰富的多组学数据,以在未来鉴定生物学相关的GRN 

参考文献

[1] Xu J, Lu C, Jin S, Meng Y, Fu X, Zeng X, Nussinov R, Cheng F. Deep learning-based cell-specific gene regulatory networks inferred from single-cell multiome data. Nucleic Acids Res. 2025 Feb 27;53(5):gkaf138. doi: 10.1093/nar/gkaf138.    

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1479743.html

上一篇:单细胞 RNA 测序在癌症中的新兴临床应用
下一篇:肿瘤微环境中关键免疫生物标志物的泛癌空间表征
收藏 IP: 39.128.49.*| 热度|

2 许培扬 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

IP: 223.72.67.*   閸ョ偛顦� | 鐠э拷 鐠э拷 +1 [1]鐠佺ǹ鐓块幍锟�   2025-4-2 19:12
娴犮儰绗呴弰顖炴嫛鐎电鍏樺┃鎰┾偓浣哄箚婢у啨鈧礁婀¢張銊b偓浣锋唉闁哎鈧線浠撮幇鐔锋勾閻炲棎鈧胶鎮婄€涳附鏌熼崥鎴犳畱鐎涳附婀虫导姘愁唴閸欏﹨鈧啰鐖洪惄绋垮彠娣団剝浼呴惃鍕偅閸氬牊鏆i悶鍡窗

娑撯偓閵嗕礁顒熼張顖欑窗鐠侇喗甯归懡鎰剁礄EI/Scopus濡偓缁便垻菙鐎规熬绱� 18
閼宠姤绨稉搴e箚婢у啩瀵屾0锟�

楠炲灝绐炴导姘愁唴閿涳拷2025楠烇拷1閺堬拷10-12閺冦儻绱�
娑撹濮欓敍姘畭娑撴粎娓峰銉ょ瑹鏉烆垯娆㈢€涳缚绱伴妴浣哥畭瀹哥偞鏌婇崡搴☆劅闂勵澁绱濋懕姘卞妽閼宠姤绨幎鈧張顖樷偓浣规閼崇晫鏁哥純鎴欌偓浣稿讲閸愬秶鏁撻懗鑺ョ爱缁涘鏌熼崥鎴礉閻㈢洔EEE閸戣櫣澧楅獮鑸靛絹娴滎棲I濡偓缁扁偓鈧拷

閺勫棙妲戞导姘愁唴閿涳拷2025楠烇拷2閺堬拷21-23閺冦儻绱�
娑撹濮欓敍姘亯濞层儱銇囩€涳讣绱濆渚€娉﹂懗鑺ョ爱瀹搞儳鈻奸妴浣稿亶閼宠姤濡ч張顖樷偓浣稿讲閸愬秶鏁撻懗鑺ョ爱缁涘顔戦弬鍥风礉閺€顖涘瘮閸楁洑缍呴崠鍛濞屽啿宕℃径褍顒熼崷鎵倞娑撳海骞嗘晶鍐劅闂勨偓鈧拷

閹存劙鍏樻导姘愁唴閿涳拷2024楠烇拷4閺堬拷19-21閺冦儻绱�
閻㈢洕PCS閸戣櫣澧楅敍灞惧厹閻╂牞鍏樺┃鎰瑢閻滎垰顣ㄦ禍銈呭级閻梻鈹掗敍灞筋樋鐏炲﹥顥呯槐銏犲坊閸欒绱濋崶浠嬫娑撴挸顔嶉幎銉ユ啞閵嗭拷

閸︾喐婀稉搴$紦缁涙垵浼愮粙瀣╁瘜妫帮拷

閸楁ぞ鍚导姘愁唴閿涳拷2025楠烇拷3閺堬拷28-30閺冦儻绱�
娑撹濮欓敍姘畭瀹哥偟鎮婂銉ヮ劅闂勵澁绱濆☉澶婂挤閺呯儤鍙庡娲偓鐘偓浣虹波閺嬪嫬浼愮粙瀣劅缁涘绱濇稉鏄忣唹娑撴挸顔嶉崠鍛閺冦儲婀板銉р柤闂勩垽娅屾竟顐犫偓锟�

閼诲繐绐炴导姘愁唴閿涳拷2024楠烇拷4閺堬拷26-28閺冦儻绱�
閺€顖涘瘮閸楁洑缍呴敍姘畭娑撴粎鐓跺▽鐟板瀹搞儱顒熼梽顫礉娑撳顣界憰鍡欐磰瀹搞儳鈻肩粻锛勬倞閵嗕焦娅ら懗钘夌紦缁涙垹鐡戦敍灞筋吀缁嬪灝鎻╅妴渚€鐝ぐ鏇犳暏閵嗭拷

娴溿倝鈧矮绗岄柆銉﹀妳閸︽壆鎮婃稉濠氼暯

閸栨ぞ鍚导姘愁唴閿涳拷2025楠烇拷2閺堬拷28閺冿拷-3閺堬拷2閺冦儻绱�
娑撹濮欓敍姘娴滎兛姘﹂柅姘亣鐎涳讣绱濆渚€娉﹂弲楦垮厴娴溿倝鈧哎鈧線浠撮幇鐔稿Η閺堫垰绨查悽銊b偓浣锋眽瀹搞儲娅ら懗鎴掔瑢鐠侊紕鐣婚張楦款潒鐟欏鐡戠拋鐑樻瀮閿涘苯绶氱仦濂匢濡偓缁便垻菙鐎癸拷1閵嗭拷

濮濓附鐪芥导姘愁唴閿涳拷2024楠烇拷4閺堬拷12-14閺冦儻绱�
娑撹濮欓敍姘厬閸ヨ棄婀寸拹銊ャ亣鐎涳讣绱滻EEE/SPIE閸欏苯鍤悧鍫礉閼辨氨鍔嶅ù瀣帛闁儲鍔呮稉搴℃勾鐠愩劌瀚庨幒顫礉瑜版洜鏁ら崣鎴c€冭箛顐︹偓锟�8閵嗭拷

閻炲棗顒熸稉搴濇唉閸欏顒熺粔鎴滃瘜妫帮拷

闂€鎸庢К娴兼俺顔呴敍锟�2025楠烇拷3閺堬拷7-9閺冦儻绱�
閺€顖涘瘮閸楁洑缍呴敍姘剁拨姒瑦鐫欏銉р柤鐎涳箓娅岄敍灞筋嚠缂佽壈鍫猾姹団偓浣锋眽閺傚洨銇炵粔鎴犵病缁狅紕琚崣瀣偨閿涘copus閸欏﹦鐓$純鎴犌旂€规碍顥呯槐锟�1閵嗭拷

娴滃被鈧礁婀撮悶鍡欏箚婢у啴浠撮幇鐔剁瑩娑撴俺鈧啰鐖洪幐鍥у础 3711
娑撴挷绗熺€规矮缍�

鐎涳妇顫栭梻銊ц閿涙氨鎮婄€涳讣绱�0705閸︽壆鎮婄€涳讣绱�1112閵嗭拷

閻梻鈹掗弬鐟版倻閿涙岸浠撮幇鐔告簚閻炲棎鈧胶骞嗘晶鍐╄杽閺屾挾娲冨ù瀣ㄢ偓浣圭ウ閸╃喎濮╅幀浣鼓侀幏鐔虹搼閿涘苯顩ч崡妞惧惈鐢牐瀵栨径褍顒熺拋鍓х枂閳ユ粌婀撮悶鍡欏箚婢у啴浠撮幇鐔测偓婵呯瑩娑撴碍鏌熼崥鎴礉閼板啳鐦粔鎴犳窗閸栧懏瀚妯肩搼閺佹澘顒熼妴渚€浠撮幇鐔峰斧閻炲棔绗岄弬瑙勭《7閵嗭拷

闂勩垺鐗庨幒鎺戞倳閿涘牆婀撮悶鍡楊劅缁紮绱�

妞よ泛鐨烽梽銏$墡閿涙艾瀵虫禍顒€銇囩€涳负鈧礁瀵虫禍顒€绗€閼煎啫銇囩€涳讣绱橝+閿涘绱遍崡搴濈鐢牐瀵栨径褍顒熼妴浣稿础娴滎剙銇囩€涳讣绱橝/A-閿涳拷7閵嗭拷

閻楃澹婇梽銏$墡閿涳拷

閸楁ぞ鍚敮鍫e瘱婢堆冾劅閿涙矮鏅堕柌宥変淮閹扮喐濡ч張顖欑瑢閻滎垰顣ㄩ惄鎴炵ゴ閵嗭拷

濮濓附鐪芥径褍顒熼敍姘勾閸ユ儳顒熸稉搴℃勾閻炲棔淇婇幁顖滈兇缂佺喐鏌熼崥鎴犵崐閸戞亽鈧拷

娑擃厼鍖楁径褍顒熼敍姘眽閺傚洤婀撮悶鍡曠瑢閸╁簼鍩傜憴鍕灊缂佹挸鎮庨妴锟�

閼板啳鐦楦款唴

閸欏倽鈧啩鍔熼惄顕嗙窗婵″倶鈧﹪浠撮幇鐔峰斧閻炲棔绗岄弬瑙勭《閵嗗鈧﹦骞囨禒锝堝殰閻掕泛婀撮悶鍡楊劅閵嗗鐡�7閵嗭拷

鐠恒劌顒熺粔鎴炲Г閼板喛绱伴柈銊ュ瀻闂勩垺鐗庨幒銉ュ綀閻滎垰顣ㄧ粔鎴濐劅閵嗕浇顓哥粻妤佹簚缁涘鍎楅弲顖濃偓鍐晸閿涘矂娓堕崗铏暈妤傛ɑ鐗庨崗铚傜秼鐟曚焦鐪�3閵嗭拷

娑撳鈧礁鍙炬禒鏍潠閻棁绁┃鎰瑢閸斻劍鈧拷
閺堢喎鍨旈幒銊ㄥ礃

閵嗗﹦鍙呴悙顓烆劅閹躲儯鈧绱�2025楠炲顑�2閺堢噦绱氶敍姘厹閻╂牠鍣伴惌鍨紣缁嬪鈧胶鐔嗙仦杈╁箚婢у啩绻氶幎銈囩搼閿涘本绉归崣濠呭厴濠ф劒绗岄悳顖氼暔娴溿倕寮堕惍鏃傗敀5閵嗭拷

閼辨梻娲樻稉搴¢挬閸欙拷

娑擃厼娴楁妯荤墡缁夋垵鍨遍懕鏃傛礃閿涙氨鏁盋9妤傛ɑ鐗庨悧闈涖仈閿涘本甯归崝銊ь潠閹垛偓閹存劖鐏夋潪顒€瀵查敍灞芥尐閸忚泛鍙у▔銊ㄥ厴濠ф劑鈧線浠撮幇鐔虹搼妫板棗鐓�9閵嗭拷

婵″倿娓堕弴纾嬵嚊缂佸棛娈戞导姘愁唴閹舵洜枪 ...

1/1 | 閹槒顓�:1 | 妫f牠銆� | 娑撳﹣绔存い锟� | 娑撳绔存い锟� | 閺堫偊銆� | 鐠哄疇娴�

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-4-7 17:11

Powered by ScienceNet.cn

Copyright © 2007-2025 中国科学报社

返回顶部