||| |
前言
阿尔兹海默病(Alzheimer Disease,AD)是最常见的一种神经退行性疾病。然而,由于从遗传学上鉴定功能区域的困难,我们对AD的发病机制和干预手段仍然知之甚少。转录组学的应用则有助于我们理解基因组学上的发现。因此,整合包括二代测序、三代测序、单细胞测序和生物信息学等多种方法,有助于我们揭示与AD相关的突变事件、风险基因和表达的关系,以及背后的通路机制。不同脑区和细胞类型基因表达的特异性,以及可变剪接事件,表明整合基因组和转录组方法在研究AD上的重要性。
阿尔兹海默病:常见而复杂
AD是一种遗传特性复杂、多因素相关,以神经退行性痴呆为主要症状的疾病,临床表现为认知衰退、早期记忆丧失、最终导致彻底的痴呆和死亡,且目前无法治愈。AD病人大脑的神经病理学特征包括渐行性的海马体和皮层衰退,神经影像的改变和宏观的检测异常;典型的微观特征则包括过磷酸化的tau蛋白导致的细胞间神经原纤维纠缠、伴随神经元和突触丢失及反应性胶质化的细胞间成分Aβ1-42多肽的聚集。
AD致病基因最早在一些早发型AD(early onset form of AD,EOAD, <65 years)大家系中鉴定出来,三个典型的基因为APP,PSEN1和PSEN2,它们上面的突变往往会导致Aβ1-42的累积增加或者Aβ1-42/ Aβ1-40 比例增加。然而这些基因上的突变仅能解释10%的EOAD。对于更普遍的晚发型AD(late-onset AD ,LOAD),这三个基因上鉴定的突变并不多见。LOAD被认为是多因素、多基因相关,遗传度估计高达80%。其中,LOAD最常见的风险基因是APOE ɛ4 allele,约占遗传度中的25%。过去十年,包括GWAS在内大基因组学研究发现了其他的一些风险位点,多为解释率低的常见变异或者解释率高的罕见变异。这些基因的发现,也揭示了其他的一些信号通路,提供了其他的一些治疗靶标和策略。
多基因PD的风险基因位点和通路
目前,通过 GWAS从常见的突变中发现AD的风险位点是普遍的研究手段。通过GWAS至少已经发现了42个gene/loci与LOAD相关。其中ABCA7, BIN1, CASS4, CD2AP, CD33, CELF1, CLU, CR1,EPHA1, FERMT2, HLA-cluster, INPP5D, MEF2C, MS4A6A, NME8, PICALM, PTK2B, SLC24A4/RIN3, SORL1, CELF1, NME8, FERMT2, CASS4, DGS2和ZCWPW1基因已经被重复证实,但是CD33 和DSG2在目前最大规模的AD GWAS分析的重复阶段未达到显著水平。基于家系的GWAS研究也重现了这些发现,如APOE, BIN1, CLU和 CD33等。此外,PLXNA4, CUGBP2, TRPC4AP,ATXN1和APOC1以及14q31.2也被报道。基于移动窗口单体型(sliding window haplotypebased approach)的方法发现了FRMD4A、基因水平的研究发现了TP53INP1和IGHV1-67等新的风险位点。对这些风险基因的通路分析发现免疫应答、脂代谢、吞噬作用和细胞粘连分子通路等。其中,免疫应答在基于基因水平的遗传度分割研究中被证实,也是近年来比较认可的观点。
除了常见变异,WES/WGS也被用来发现了一些与AD相关的罕见变异位点。其中,最常见的为TREM2基因上的R47H突变,已经为多项研究重复。此外,大量的独立研究表明SORL1和ABCA7上也存在罕见变异与AD的发病相关。其中,SORL1上的罕见突变为杂合错义突变和截断突变,ABCA7上的突变为杂合的截断突变。包含了约11000个参入者的Alzheimer Disease Sequencing Project (ADSP)研究计划也证实了通过GWAS发现的风险基因上存在着罕见突变。在通过外显子芯片技术针对罕见和低频位点的关联分析发现了ABI3和PLGC2基因上也存在着罕见变异。
转录组分析理解AD
为了更深刻的理解基因、变异和AD的关系,将基因组数据和基因表达数据结合起来是必要的。这样,我们可以在组织、空间、时间和细胞类型等水平研究风险基因的效应,包括疾病网络间的相似性、发现与核心基因相关通路的分子互作等。
AD风险基因和位点可能主要影响转录水平。鉴于发现的AD显著性位点很多位于非编码区,猜测其可能的效应主要为调控基因的表达,因此,需要研究针对这些基因的差异表达。采用尸检大脑皮层组织的靶向基因分析表明许多风险基因的表达发生了变化,如:HLA-cluster, MS4A-cluster基因, FRMD4A, CLU, SORL1, ABCA7,PTK2B, BIN1, TREM2和CD33。当然,一些研究由于样本、技术等的差异,在一些结果上也有不一致的地方。其中,发现了一些突变直接影响了基因的表达,表明这些基因的表达或者不完全是疾病的产物。例如,SORL1基因上的罕见突变。BIN1基因上的3碱基插入增加了BIN1的表达,还有免疫相关的HLA locus(HLA-DRA, HLA-DRB5 and HLA-DRB1)上调,免疫应答区域的MS4A包含的基因:MS4A4A和MS4A6A在AD脑部上调。而PICALM既有研究表明其在AD脑区上调也有研究表明下调,但是起着增加AD风险的rs3851179 SNP位点则会导致PICALM表达下调。同理,ABCA7的研究也有不一致性,但是增加患病风险的罕见变异则会降低ABCA7的表达,FERMT2基因的rs7143400-T也会导致其表达下调。
表:各个研究中鉴定的差异基因,其中,+/-/? 分别代表upregulated/downregulated/missing expression direction in disease versus control
除了突变影响基因的表达水平,突变还会影响基因的表达模式,尤以可变剪接最为常见。研究表明人体95%以上的基因都会有可变剪接。研究还表明:1)基于尸检大脑发现的多于91%的不同的表达转录本未被注释;2)两个独立的基于尸检大脑组织的研究发现约25%的基因在外显子的使用上存在差异;3)AD和正常组织的对比发现约有200个可变剪接事件;还有20个基因的可变剪接与AD有关;4)基于case-control对照,发现case的内含子比例更高,表明case更多的出现内含子包含事件;5)剪接的有效率降低:如APOE、BACE1,CLU, BIN1, PICALM, PSEN1和SORL1基因。6)其他的靶基因的可变剪接。
转录调控与AD的关系
GWAS发现的显著位点和转录调控的关系常采用数量性状位点表达(expression quantitative trait loci,eQTL)和剪接(splice QTL, sQTL)的方法来分析。其中,CR1, HLA-DRB1, ZCWPW1, SLC24A4, CLU和MS4A4A等基因上的突变均有QTL的效应。然而,相关的研究仍然少见,一个主要的障碍是大规模的研究样本的稀缺。当然,目前开展的一些大规模的转录组学研究,如Synapse platform, the Brain eQTL Almanac web server, 和the Genotype-Tissue expression (GTEx) project等则为大规模的转录组学整合分析提供了可能,一些新的研究方法也被引入,例如transcriptome-wide association studies (TWAS)。采用TWAS发现了CLU, PTK2B和CR1,以及其他一些风险基因,包括PICALM的interactor AP2A1基因。
基因共表达和核心基因
基因共表达网络可以发现新的基因互作和网络关系,这种关系的发现并不依赖于基因的差异表达。基于共表达发现的核心基因(hub genes),即在基因网络中拥有较多的互作关系的基因,往往在维持网络功能中起着关键作用。在AD研究中,发现的相关基因有:起着调控免疫/小胶质细胞网络基因TREM2, MS4A4A, MS4A6A和CD33的TYROBP基因,此外还有PTK2B基因、SPI1基因等。
基因表达的表观调控
Epigenome-wide association studies (EWAS)发现在基因水平上一些与AD相关的基因的CpG岛甲基化状态发生了改变,例如ANK1, RHBDF2, RPL13和 CDH23,此外ABCA7的甲基化状态与AD的关系也常被报道。
解释的障碍和未来的方向
由于AD的发病和进展的复杂性,目前对其机制的理解仍然有较多的困难。主要包括:1)组织的获取困难,如研究中常常采用的组织为尸检大脑,这种组织仅能代表AD的结束状态,2)尸检大脑的位置和保存条件也影响结果;3)基于组织的分析可能掩盖细胞水平的基因表达差异;4)由于神经元的丢失和炎症反应,鉴定到的基因差异表达结果更可能是正常和疾病组织的细胞成分差异,或者疾病不同阶段的基因表达差异,而非疾病导致的基因调控的结果;目前一些新的方向,则为这些问题的解决提供了新的可能:1)单细胞水平研究,有助于控制细胞成分,但需要合适的统计方法,细胞类型的marker基因数据库也需要增加;2)免疫在AD中的作用;3)基于患者组织的诱导多功能干细胞培养的研究方法。
参考文献:
Verheijen J, Sleegers K. Understanding Alzheimer disease at the Interface between genetics and transcriptomics[J]. Trends in Genetics, 2018.
生信草堂
浙大生信博士团队倾力打造的一个科研人员学习交流的公众微信平台。我们致力于科研社区服务,分享前沿的科技进展,提供生信分析方法,解读经典分析案例,公众数据库的挖掘和临床数据统计分析。在此我们欢迎各位的加入!
加微信bioinformatics88拉您进生信交流群
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-30 07:54
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社