||
TRUST4:从批量和单细胞转录组数据中重建免疫系统
T细胞和B细胞都可以通过体细胞V(D)J重组产生不同的受体(分别为TCR和BCR)库,以识别各种外部抗原或肿瘤新抗原。在抗原识别之后,BCR还经历体细胞超突变(SHM),以进一步提高抗原结合亲和力。在传染病、过敏、自身免疫、肿瘤免疫和癌症免疫治疗的研究中,序列分析越来越多地被采用,但它是一种昂贵的分析方法,并且消耗宝贵的组织样本。或者,RNA-seq数据包含组织或外周血单核细胞(PBMC)中表达的TCR和BCR序列。然而,由于来自V(D)J重组和SHM的库序列与种系不同,它们通常在读取映射步骤中被消除。
已有TRUST算法用于直接从组织或血液RNA-seq数据重新组装免疫受体库。当应用于《癌症基因组图谱》(TCGA)肿瘤RNA-seq数据时,TRUST揭示了对肿瘤浸润T细胞和B细胞及其相关肿瘤免疫系统的深刻生物学见解。尽管TRUST的敏感性不如TCR-seq和BCR-seq,但它能够识别RNA-seq数据中大量表达且可能更克隆扩增的TCR/BCR,这些TCR/BCR更有可能参与抗原结合。近年来,还引入了其他计算方法,用于从RNA-seq数据构建免疫库,包括V'DJer、MiXCR、CATT和ImRep。这些方法侧重于互补决定区3(CDR3)的重建,其组装全长V(D)J受体序列的能力有限,尽管V序列上的CDR1和CDR2仍然对抗原识别和结合有相当大的贡献。例如,在最近的一项研究中预测的影响酸性肿瘤环境中抗体亲和力的六个突变中有五个位于CDR1和CDR2中,九个位置中有四个对4A8抗体与SARS-CoV-2刺突蛋白结合贡献最大。因此,可以推断全长免疫受体库的算法可以促进更好的受体-抗原相互作用建模。
随着scRNA-seq技术的进步,研究人员可以同时研究免疫细胞基因表达和受体库序列。已经开发了几种算法,包括MiXCR、BALDR、BASIC和VDJPuzzle,以从SMART-seq和scRNA-seq平台构建全长配对TCR或BCR。与SMART-seq相比,基于液滴的scRNA-seq平台,如10x Genomics,虽然每个细胞产生更稀疏的转录物覆盖,但可以以更低的成本处理更多数量级的细胞。为了使用10x Genomics平台分析免疫库,研究人员目前需要准备额外的文库来扩增TCR/BCR序列。
在最新研究中,Song等人将TRUST算法重新设计为TRUST4,具有显著增强的特征和改进的免疫库重建性能(图1a)。首先,TRUST4支持从FASTQ或BAM文件中快速提取TCR/BCR候选读取。其次,TRUST4按丰度对候选读取组合进行优先排序,并将所有具有部分重叠的候选读取与重叠群进行组合,从而提高了算法速度。第三,TRUST4明确表示重叠群一致性中高度相似的读数,从而适应体细胞超突变并提高记忆效率(方法)。第四,TRUST4可以在TCR和BCR上组装全长V(D)J序列。最后,TRUST4支持从scRNA-seq平台重建库,而不需要额外的10xV(D)J扩增步骤。
应用于批量和转录组数据结果如图1和2所示。总之,TRUST4是从批量RNA-seq或scRNA-seq数据推断TCR和BCR序列的有效方法。TRUST4不仅在CDR3的重建中具有高效、灵敏和精确性,而且可以从批量RNA-seq数据中组装全长免疫受体序列。此外,TRUST4可以直接从5′10x基因组学scRNA-seq数据中重建单细胞水平的免疫受体序列,包括没有特定10xV(D)J富集文库的γδT细胞。TRUST4结果支持了5′10x Genomics scRNA-seq平台的优势,该平台不仅提供了基因表达信息,而且能够对免疫库进行计算调用。TRUST4可在https://github.com/liulab-dfci/TRUST4,可能是肿瘤免疫和免疫治疗研究的重要方法。
图1 TRUST4对批量RNA-seq数据的性能。a–d,TRUST4应用于批量RNA-seq数据。a、 TRUST4概述。b、 MiXCR、CATT、TRUST3和TRUST4从计算机RNA-seq数据中报告的TRB CDR3的数量。c、BCR-seq结果作为金标准,召回六个批量RNA-seq样本。d、 通过对SMART序列数据进行分组,评估TRUST4和MiXCR在伪体RNA-seq上组装的全长V、CDR3和J序列。每一行表示在伪体数据中是否恢复了细胞的序列。
图2 TRUST4在单细胞RNA-seq数据上的性能。a–c,TRUST4在5′10x基因组学scRNA-seq数据中的应用。a、5′10x基因组学PBMC数据的均匀流形近似和投影(UMAP)。b、与Seurat注释的细胞的10x基因组学V(D)J富集文库匹配的CDR3的数量。c、TRUST4组装的V基因相似性与来自5′10x基因组学NSCLC数据的配对全长IGH和IGK/IGL组装的参考种系V基因序列的比较。每个点代表一个单元格。Treg,调节性T细胞;RestNKs,静止的自然杀伤细胞;RestDCs,静息树突状细胞;cor,Pearson相关。
参考文献
[1] Song L, Cohen D, Ouyang Z, Cao Y, Hu X, Liu XS. TRUST4: immune repertoire reconstruction from bulk and single-cell RNA-seq data. Nat Methods. 2021 Jun;18(6):627-630. doi: 10.1038/s41592-021-01142-2.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-10 15:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社