zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

TRUST4:从批量和单细胞转录组数据中重建免疫系统

已有 2504 次阅读 2023-8-7 08:40 |个人分类:科普|系统分类:科普集锦

TRUST4:从批量和单细胞转录组数据中重建免疫系统 

T细胞和B细胞都可以通过体细胞V(D)J重组产生不同的受体(分别为TCRBCR)库,以识别各种外部抗原或肿瘤新抗原。在抗原识别之后,BCR还经历体细胞超突变(SHM),以进一步提高抗原结合亲和力。在传染病、过敏、自身免疫、肿瘤免疫和癌症免疫治疗的研究中,序列分析越来越多地被采用,但它是一种昂贵的分析方法,并且消耗宝贵的组织样本。或者,RNA-seq数据包含组织或外周血单核细胞(PBMC)中表达的TCRBCR序列。然而,由于来自V(D)J重组和SHM的库序列与种系不同,它们通常在读取映射步骤中被消除。 

已有TRUST算法用于直接从组织或血液RNA-seq数据重新组装免疫受体库。当应用于《癌症基因组图谱》(TCGA)肿瘤RNA-seq数据时,TRUST揭示了对肿瘤浸润T细胞和B细胞及其相关肿瘤免疫系统的深刻生物学见解。尽管TRUST的敏感性不如TCR-seqBCR-seq,但它能够识别RNA-seq数据中大量表达且可能更克隆扩增的TCR/BCR,这些TCR/BCR更有可能参与抗原结合。近年来,还引入了其他计算方法,用于从RNA-seq数据构建免疫库,包括V'DJerMiXCRCATTImRep。这些方法侧重于互补决定区3CDR3)的重建,其组装全长V(D)J受体序列的能力有限,尽管V序列上的CDR1CDR2仍然对抗原识别和结合有相当大的贡献。例如,在最近的一项研究中预测的影响酸性肿瘤环境中抗体亲和力的六个突变中有五个位于CDR1CDR2中,九个位置中有四个对4A8抗体与SARS-CoV-2刺突蛋白结合贡献最大。因此,可以推断全长免疫受体库的算法可以促进更好的受体-抗原相互作用建模。 

随着scRNA-seq技术的进步,研究人员可以同时研究免疫细胞基因表达和受体库序列。已经开发了几种算法,包括MiXCRBALDRBASICVDJPuzzle,以从SMART-seqscRNA-seq平台构建全长配对TCRBCR。与SMART-seq相比,基于液滴的scRNA-seq平台,如10x Genomics,虽然每个细胞产生更稀疏的转录物覆盖,但可以以更低的成本处理更多数量级的细胞。为了使用10x Genomics平台分析免疫库,研究人员目前需要准备额外的文库来扩增TCR/BCR序列。 

在最新研究中,Song等人将TRUST算法重新设计为TRUST4,具有显著增强的特征和改进的免疫库重建性能(图1a)。首先,TRUST4支持从FASTQBAM文件中快速提取TCR/BCR候选读取。其次,TRUST4按丰度对候选读取组合进行优先排序,并将所有具有部分重叠的候选读取与重叠群进行组合,从而提高了算法速度。第三,TRUST4明确表示重叠群一致性中高度相似的读数,从而适应体细胞超突变并提高记忆效率(方法)。第四,TRUST4可以在TCRBCR上组装全长V(D)J序列。最后,TRUST4支持从scRNA-seq平台重建库,而不需要额外的10xV(D)J扩增步骤。 

应用于批量和转录组数据结果如图12所示。总之,TRUST4是从批量RNA-seqscRNA-seq数据推断TCRBCR序列的有效方法。TRUST4不仅在CDR3的重建中具有高效、灵敏和精确性,而且可以从批量RNA-seq数据中组装全长免疫受体序列。此外,TRUST4可以直接从5′10x基因组学scRNA-seq数据中重建单细胞水平的免疫受体序列,包括没有特定10xV(D)J富集文库的γδT细胞。TRUST4结果支持了5′10x Genomics scRNA-seq平台的优势,该平台不仅提供了基因表达信息,而且能够对免疫库进行计算调用。TRUST4可在https://github.com/liulab-dfci/TRUST4,可能是肿瘤免疫和免疫治疗研究的重要方法。

 

image.png

1 TRUST4对批量RNA-seq数据的性能。a–dTRUST4应用于批量RNA-seq数据。a TRUST4概述。b MiXCRCATTTRUST3TRUST4从计算机RNA-seq数据中报告的TRB CDR3的数量。cBCR-seq结果作为金标准,召回六个批量RNA-seq样本。d 通过对SMART序列数据进行分组,评估TRUST4MiXCR在伪体RNA-seq上组装的全长VCDR3J序列。每一行表示在伪体数据中是否恢复了细胞的序列。 

image.png

2 TRUST4在单细胞RNA-seq数据上的性能。a–cTRUST45′10x基因组学scRNA-seq数据中的应用。a5′10x基因组学PBMC数据的均匀流形近似和投影(UMAP)。b、与Seurat注释的细胞的10x基因组学V(D)J富集文库匹配的CDR3的数量。cTRUST4组装的V基因相似性与来自5′10x基因组学NSCLC数据的配对全长IGHIGK/IGL组装的参考种系V基因序列的比较。每个点代表一个单元格。Treg,调节性T细胞;RestNKs,静止的自然杀伤细胞;RestDCs,静息树突状细胞;corPearson相关。 

参考文献

[1] Song L, Cohen D, Ouyang Z, Cao Y, Hu X, Liu XS. TRUST4: immune repertoire reconstruction from bulk and single-cell RNA-seq data. Nat Methods. 2021 Jun;18(6):627-630. doi: 10.1038/s41592-021-01142-2. 

 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

 

image.png




https://blog.sciencenet.cn/blog-571917-1398118.html

上一篇:弥合多组学差距
下一篇:RIMA:肿瘤免疫表征的Bulk转录组数据综合计算分析
收藏 IP: 39.128.54.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-10 15:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部