衣带渐宽终不悔分享 http://blog.sciencenet.cn/u/tuqiang2014 在康河的柔波里,做一条水草, 向青草更青处漫溯。

博文

如何快速地从单细胞数据中观察HLA基因表达模式

已有 524 次阅读 2020-8-1 07:35 |系统分类:科研笔记

在我们分析单细胞数据的时候,想要反映细胞每一个特征往往是选择这个特征对应的基因,所以一般想要讲故事先找基因集。今天,我们就来用正则表达式来匹配一类比较特殊的基因:HLA基因。

人类白细胞抗原(Human leukocyte antigen ,HLA),参与人体主要组织相容性复合体(,major histocompatibility complex,MHC)的众多抗原中的任何一种(能够刺激免疫反应的物质)。HLA基因编码的细胞表面蛋白质是MHC的一部分。HLA 是编码人类主要组织相容性复合体(MHC)蛋白的基因复合体,而MHC是脊椎动物获得性免疫系统识别外来分子所必需的一组细胞表面蛋白,这些蛋白决定了组织相容性。因此,这是HLA和MHC之间的根本区别。另外,HLA和MHC之间的主要区别是,HLA是出现在人类身上的MHC复合体形式,而MHC复合体出现在所有脊椎动物身上。


那他们的相似之处在哪呢?

  • HLA和MHC是发生在脊椎动物所有有核细胞中的两种表面抗原。
  • 它们的主要功能是将外来抗原呈现给T细胞。
  • HLA和MHC的三个基因家族分别为I、II和III。
  • 此外,这些抗原出现在脊椎动物的所有有核细胞中。

HLA(人类白细胞抗原)是一种存在于人类体内的MHC基因复合体。它由大约200个紧密排列在6号染色体上的基因组成。这些基因在所有有核细胞上都有表达。HLA分子的主要功能是将细胞内产生的抗原呈现在细胞表面,以便被T细胞识别。因此,T细胞可以在自身抗原上识别外来抗原,启动获得性免疫应答。另一方面,T细胞将抗原识别为自身可以决定组织相容性。但是,免疫系统将自身抗原识别为非自身抗原,导致自身免疫性疾病的发生。

HLA全长约3.6M, 含有220多种功能不同的基因,是目前已知的人类染色体中基因密度最高,多态性最为丰富的区域,同时也是人体固有免疫系统的重要组成部分,位置示意图如下:

Mining Clinical, Immunological, and Genetic Data of Solid Organ Transplantation

HLA是主要组织相容性复合体(MHC)的人类版本,一个发生在许多物种的基因组。在人类中,MHC复合体由位于6号染色体上紧密相连的200多个基因组成。这个复合体中的基因可分为三大类:第一类(class I)、第二类(class II)和第III类(class III)。

HLA复合体是人类基因组中最具多态性的基因座。HLA复合物主要有两类:一类包含HLA- a、HLA- b和HLA- c基因,另一类包含HLA- d基因。HLA- b是最具多态性的HLA- b基因,目前已识别出425个等位基因。HLA-DRB1基因识别出的等位基因为289个,HLA-A基因识别出的等位基因为214个。IPD-IMGT/HLA数据库包含了迄今为止所有已报道和命名的HLA等位基因序列。根据基本的遗传学原理,儿童从父母那里遗传HLA等位基因。

随着人们对HLA认识的深入,我们观察到人类主要的MHC I类基因,即HLA-A、HLA-B和HLA-C。由这些基因产生的蛋白质存在于几乎所有细胞的表面。在细胞表面,这些蛋白质与从细胞内输出的蛋白质片段(肽段)结合。MHC I类蛋白向免疫系统显示这些肽。如果免疫系统识别出这些多肽是外来的(如病毒或细菌的多肽),它就会通过触发受感染的细胞自毁来作出反应。

人类主要有6个MHC II类基因:HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA和HLA-DRB1。MHC II类基因提供指令来制造几乎只存在于某些免疫系统细胞表面的蛋白质。像MHC I类蛋白质一样,这些蛋白质向免疫系统呈递多肽。


具体解释可以看:人类白细胞抗原-HLA简介

由MHC III类基因产生的蛋白质有不同的功能;它们参与炎症和其他免疫系统活动。一些MHC基因的功能尚不清楚。

组织相容性复杂基因有许多可能的变异,使每个人的免疫系统对各种各样的外来入侵者作出反应。一些组织相容性复杂基因有数百个已识别的版本(等位基因),每一个都有一个特定的数量(如HLA-B27)。密切相关的等位基因被分类在一起;例如,至少有40个非常相似的等位基因是HLA-B27的亚型。这些子类型被指定为HLA-B*2701到HLA-B*2743。

超过100种疾病与组织相容性复杂基因的不同等位基因有关。例如,HLA-B27等位基因会增加患一种叫做强直性脊柱炎的炎症性关节病的风险。许多其他疾病包括免疫功能异常和一些癌症也与特定的HLA等位基因有关。然而,组织相容性复杂基因在发生这些疾病的风险中所扮演的角色往往并不清楚。

那在我们单细胞转录组数据中如何观察HLA基因的表达呢?三行代码够不够?

还是请出被我们玩坏了的PBMC数据集。

library(Seurat)
library(SeuratData)
DotPlot(pbmc3k.final, features =grep("^HLA",rownames(pbmc3k.final),value = T) )+ myth

我们看到不同PBMC细胞类型中HLA表达模式是不同的,当然这个Identity可以在groupby中指定临床分类指标,如用药不用药。

其实了解了基因名的关系,这样的图我们可以做一个G,这就要求我们深谙基因集的关系。正则表达式你学会了吗?


人类白细胞抗原 (HLA) 系统
人类白细胞抗原-HLA简介
hla
what-is-the-difference-between-hla-and-mhc



http://blog.sciencenet.cn/blog-1835014-1244507.html

上一篇:单细胞RNA-seq数据分析最佳实践
下一篇:回顾2020三场直播课||或谈我的单细胞工程与科学之旅

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-12-1 11:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部