||
人类基因组中存在十大类三核苷酸重复序列。其中CAG•CTG、CGG•CCG、GAA•TTC、TGG•CCA、CGA•TCG等等的稳定性与几十种人类疾病的发生体现明确的关联。有关病理机制的研究长期困扰学术界。2021年,我们首次对三核苷酸重复不稳定性机制进行了分类,提出了存在于三核苷酸重复序列中的三大类突变形式,包括碱基突变、重复单元的扩增和缺失(Insertion and Duplication, I/D),以及基于非-B型DNA二级结构引发的DNA双链断裂等损伤及相关的异常修复(non-B DNA secondary structure formation caused DNA double-strand breaks and the related abnormal Repair)。见吕柯孬、潘学峰( 人类神经退行性疾病相关的三核苷酸重复DNA序列不稳定性机制研究进展 (chinagene.cn) 此文同时强调了我们首次提出的R环(RNA:DNA杂交体)在介导三核苷酸重复扩增等不稳定性的优先权,见被引用文献:
Mol Biol Rep. 2022 May 20. doi: 10.1007/s11033-022-07324-1. Online ahead of print.PMID: 35596054
R-Loop Tracker: Web Access-Based Tool for R-Loop Detection and Analysis in Genomic DNA Sequences.
Int J Mol Sci. 2021 Nov 27;22(23):12857. doi: 10.3390/ijms222312857.PMID: 34884661 Free PMC article.
Break-induced replication links microsatellite expansion to complex genome rearrangements.
Bioessays. 2017 Aug;39(8):10.1002/bies.201700025. doi: 10.1002/bies.201700025. Epub 2017 Jun 16.PMID: 28621832 Free PMC article.
等)。
基因组
三核苷酸重复纯合与非纯合的分布规律
潘氏分布
(Pan Distribution)
长话短说,我们发现人类基因组中十类三核苷酸重复序列的纯合分布(当重复单位大于等于8时)和非纯合分布(重复单位大于等于100)分布依附如下关系:
见微信截图:
在基因组中,有些三核苷酸重复序列即使能以诸多重复单元形式存在,但却不大可能容许被轻易“打开”,如TAA.TTA(位于图1纯合存在统计数量最多的位置)就会在转录过程中出现断裂,成为一些转座子插入位点(Pan, Xuefeng et al. “Transcription of AAT•ATT triplet repeats in Escherichia coli is silenced by H-NS and IS1E transposition.” PloS one vol. 5,12 e14271. 9 Dec. 2010, doi:10.1371/journal.pone.0014271 Transcription of AAT•ATT triplet repeats in Escherichia coli is silenced by H-NS and IS1E transposition - PubMed (nih.gov)),而有的三核苷酸重复序列自身几乎不能“重复”存在,我很早就发现,CGA三核苷酸重复只需要2个重复单元就会出现问题。这也和图1中CGA几乎罕见于人类基因组这个情况吻合。见文献:
Xuefeng Pan. Determination of the reopening temperature of a DNA hairpin structure in vitro. European Journal of Biochemistry 2004, 271 (18) , 3665-3670. https://doi.org/10.1111/j.1432-1033.2004.04301.x
Xuefeng Pan. Two-triplet CGA repeats impede DNA replication in bacteriophage M13 in Escherichia coli. Microbiological Research 2004, 159 (2) , 97-102. https://doi.org/10.1016/j.micres.2003.12.001
因此,三核苷酸重复DNA(Trinucleotide Repeats)能否以纯合、非纯合、重复单元的多和少(扩增和缺失)存在于特定生物基因组,其中部分原因取决于三个碱基的“碱基排列组合”,比如CGA重复序列,这个重复序列在人类基因组(应该在所有的基因组中)都应该是含量最低的,我发现,只要CGA重复1次(CGACGA)就有可能“破坏”大多数酶催化所依附的B型构象。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 12:35
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社