||
北京时间2021年8月26日晚23时,国际学术期刊《自然—方法学》(Nature Methods)在线发表了美国克里夫兰诊所胡明博士团队和加州大学圣地亚哥分校任兵博士团队的合作文章,详细介绍了首个从单细胞三维基因组数据中寻找染色质环结构的计算方法——SnapHiC。
现任复旦大学生命科学学院青年研究员的于淼博士,和现任NovaSignal公司软件工程师的Armen Abnousi博士为本文的共同第一作者。
细胞核中的染色体由DNA和蛋白质构成。在人类细胞中,总长度为2米的23对染色体通过复杂而有序的三维折叠,团聚于直径10微米的细胞核中。众多研究表明,染色体的三维构型 与基因表达调控以及DNA复制等重要细胞功能密切相关。异常的染色体三维构型会导致各种疾病的发生,例如肢体发育失控、精神疾病、免疫缺陷和癌症等。
单细胞基因组学技术的飞速发展开启了在单细胞中研究染色体三维构型的大门。其中一个研究焦点是如何利用单细胞三维组学数据识别染色质环结构。染色质环结构经常发生在基因转录启动子和远端顺式调控元件之间,因此鉴定不同细胞类型中的染色质环结构对于深入了解基因转录调控机制具有重大意义。然而,由于单细胞三维基因组数据具有低信噪比和极度稀疏的特性,如何有效地利用单细胞三维基因组数据高分辨率地识别染色质环结构是一个巨大的挑战。为填补这方面的空白,胡明博士团队和任兵博士团队联合开发了首个面对单细胞数据的染色质环识别算法——SnapHiC。SnapHiC利用少量单细胞数据便可准确地识别染色质环结构。
与传统的识别染色质环结构的算法相比,SnapHiC可以从少量单细胞数据中准确地找到更多染色质环结构。例如在小鼠胚胎干细胞 (mESC)中,SnapHiC只需75个或者100 个单细胞便可识别出已知的三个染色质环结构,而使用传统的针对大量细胞三维组学数据所开发的算法则需要4倍以上的细胞数才能检测到同样位置的染色质环。SnapHiC在少量细胞中所表现出的高灵敏度和准确度有重大的应用价值,可以避免耗资巨大的海量细胞数的数据收集,为研究复杂组织中的稀有细胞类型提供了可能。
图:SnapHiC高分辨率地精准识别染色质环。
为了进一步探索SnapHiC在复杂人体组织中的应用,作者将SnapHiC用于人脑前额叶皮层的单细胞三维基因组数据,并发现了大量具有细胞类型特异性的染色质环结构。这些染色质环可能促使基因转录启动子和具有细胞特异性的远端顺式调控元件在三维空间中发生相互作用,从而调控基因在不同细胞类型中的特异性表达。
综上所述,由于染色质的三维构型和基因表达调控以及细胞功能密切相关,使用SnapHiC方法发现的染色质环结构可以帮助理解全基因组关联分析(GWAS)中发现的致病位点,寻找具有细胞类型特异性的致病基因,并且加速新型药物靶点的开发。SnapHiC为研究不同细胞类型中的基因调控机制,以及复杂人类疾病的致病机理提供了强有力的工具。
SnapHiC方法的原代码及用户手册已发表在Github网站:
https://github.com/HuMingLab/snapHiC
相关论文信息:
https://doi.org/10.1038/s41592-021-01231-2
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 05:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社