xiaokeshengming的个人博客分享 http://blog.sciencenet.cn/u/xiaokeshengming

博文

《自然—遗传》:郭国骥/韩晓平团队发表基于人工智能神经网络的基因组解读系统Nvwa

已有 2808 次阅读 2022-10-14 12:09 |个人分类:小柯生命|系统分类:论文交流

北京时间2022年10月13日晚23时,Nature Genetics在线刊登了浙江大学基础医学院/浙江省良渚实验室郭国骥/韩晓平团队的学术论文“Deep learning of cross-species single cell landscapes identifies conserved regulatory programs underlying cell types”。


该研究利用自主构建的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,并探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型保守的调控程序。


此外,该研究提出了深度学习模型Nvwa(女娲),首次实现了完全基于基因组序列预测单细胞分辨率下的基因表达。该研究基于Nvwa模型学习衍生的谱系特异性基序,表征了跨物种细胞类型特异性的调节程序。

3.png

预测基因表达和解析基因调控机制一直是基因组学的重要目标。尽管研究人员已经努力使用细胞系或组织中的各种实验特征来预测调节信号和基因表达[1-3],但在单细胞分辨率下进行生物体规模的表达预测仍然具有挑战性。如今单细胞图谱能够以统一的标准呈现物种细胞的表型[4-9],因而人类有机会使用跨物种的单细胞数据来探索进化过程中不同细胞类型的表达和调控程序。研究团队假设可以直接从基因组序列预测生物体规模的单细胞基因表达,并试图在具有巨大细胞类型多样性的后生动物中检验这一假设。

该研究中,研究人员首先使用其团队自主研发的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图。其中,斑马鱼图谱收集了635,228个单细胞数据,果蝇图谱涵盖了276,706个单细胞数据,蚯蚓图谱包含了95,020个单细胞数据。该研究利用这三种模式动物的单细胞图谱,并结合其他五种代表性动物的单细胞图谱(人类[4]、小鼠[5]、海鞘[10]、线虫[11]和涡虫[12]),挖掘了跨物种细胞谱系特异性的转录因子,探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型,特别是免疫细胞、基质细胞、神经元、上皮细胞、内皮细胞和生殖细胞的保守调节程序。

2.png

基于DNA序列编码基因表达模式的假设,该研究提出了深度学习模型Nvwa(女娲),首次实现了完全基于基因组序列预测单细胞水平的基因表达,且预测准确度与实验测量精度相当。值得注意的是,Nvwa模型可以高度准确地预测几乎所有测试物种的基因表达。此外,通过检查模型第一层的卷积的基序特征Filter,团队揭示了细胞类型特异的基序。这些基序与在特异细胞类型中作用机制明确的转录因子基序相一致。基于模Nvwa模型Filter的跨物种比较,该研究还发现同源Filter倾向于保持跨物种的细胞类型特异性。该工作首次建立了物种层面基因组编码细胞图谱的整合模型,并为解码多物种基因调控程序提供了宝贵资源。

1.png

浙江大学基础医学院2019级直博生李佳琦、良渚实验室特聘研究员王晶晶、浙江大学基础医学院博士后张霈婧汪仁英为本文共同第一作者,浙江大学基础医学院郭国骥教授韩晓平教授和良渚实验室王晶晶研究员为共同通讯作者。研究获得了国家重点研发计划和国家自然科学基金的支持。

相关论文信息:

https://doi.org/10.1038/s41588-022-01197-7

参考文献

1.Agarwal V, Shendure J. Predicting mRNA Abundance Directly from Genomic Sequence Using Deep Convolutional Neural Networks. Cell Rep. 2020, 31(7):107663.

2.Zhou J, Troyanskaya OG. Predicting effects of noncoding variants with deep learning-based sequence model. Nat Methods. 2015, 12(10):931-4.

3.Kelley DR, Snoek J, Rinn JL. Basset: learning the regulatory code of the accessible genome with deep convolutional neural networks. Genome Res. 2016, 26(7):990-9.

4.Han X, Zhou Z, Fei L, Sun H, Wang R, Chen Y, Chen H, Wang J, Tang H, Ge W, Zhou Y, Ye F, Jiang M, Wu J, Xiao Y, Jia X, Zhang T, Ma X, Zhang Q, Bai X, Lai S, Yu C, Zhu L, Lin R, Gao Y, Wang M, Wu Y, Zhang J, Zhan R, Zhu S, Hu H, Wang C, Chen M, Huang H, Liang T, Chen J, Wang W, Zhang D, Guo G. Construction of a human cell landscape at single-cell level. Nature. 2020, 581(7808):303-309.

5.Han X, Wang R, Zhou Y, Fei L, Sun H, Lai S, Saadatpour A, Zhou Z, Chen H, Ye F, Huang D, Xu Y, Huang W, Jiang M, Jiang X, Mao J, Chen Y, Lu C, Xie J, Fang Q, Wang Y, Yue R, Li T, Huang H, Orkin SH, Yuan GC, Chen M, Guo G. Mapping the Mouse Cell Atlas by Microwell-Seq. Cell. 2018, 172(5):1091-1107.e17.

6.Fei L, Chen H, Ma L, E W, Wang R, Fang X, Zhou Z, Sun H, Wang J, Jiang M, Wang X, Yu C, Mei Y, Jia D, Zhang T, Han X, Guo G. Systematic identification of cell-fate regulatory programs using a single-cell atlas of mouse development. Nat Genet. 2022, 54(7):1051-1061.

7.Ye F, Zhang G, E W, Chen H, Yu C, Yang L, Fu Y, Li J, Fu S, Sun Z, Fei L, Guo Q, Wang J, Xiao Y, Wang X, Zhang P, Ma L, Ge D, Xu S, Caballero-Pérez J, Cruz-Ramírez A, Zhou Y, Chen M, Fei JF, Han X, Guo G. Construction of the axolotl cell landscape using combinatorial hybridization sequencing at single-cell resolution. Nat Commun. 2022, 13(1):4228.

8.Liao Y, Ma L, Guo Q, E W, Fang X, Yang L, Ruan F, Wang J, Zhang P, Sun Z, Chen H, Lin Z, Wang X, Wang X, Sun H, Fang X, Zhou Y, Chen M, Shen W, Guo G, Han X. Cell landscape of larval and adult Xenopus laevis at single-cell resolution. Nat Commun. 2022, 13(1):4306.

9.Wang R, Zhang P, Wang J, Ma L, E W, Suo S, Jiang M, Li J, Chen H, Sun H, Fei L, Zhou Z, Zhou Y, Chen Y, Zhang W, Wang X, Mei Y, Sun Z, Yu C, Shao J, Fu Y, Xiao Y, Ye F, Fang X, Wu H, Guo Q, Fang X, Li X, Gao X, Wang D, Xu PF, Zeng R, Xu G, Zhu L, Wang L, Qu J, Zhang D, Ouyang H, Huang H, Chen M, Ng SC, Liu GH, Yuan GC, Guo G, Han X. Construction of a cross-species cell landscape at single-cell level. Nucleic Acids Res. 2022, gkac633.

10.Cao C, Lemaire LA, Wang W, Yoon PH, Choi YA, Parsons LR, Matese JC, Wang W, Levine M, Chen K. Comprehensive single-cell transcriptome lineages of a proto-vertebrate. Nature. 2019, 571(7765):349-354.

11.Cao J, Packer JS, Ramani V, Cusanovich DA, Huynh C, Daza R, Qiu X, Lee C, Furlan SN, Steemers FJ, Adey A, Waterston RH, Trapnell C, Shendure J. Comprehensive single-cell transcriptional profiling of a multicellular organism. Science. 2017, 357(6352):661-667.

12.Fincher CT, Wurtzel O, de Hoog T, Kravarik KM, Reddien PW. Cell type transcriptome atlas for the planarian Schmidtea mediterranea. Science. 2018, 360(6391):eaaq1736.




https://blog.sciencenet.cn/blog-3423233-1359415.html

上一篇:《自然—医学》:傅静远/陈连民等系统评估肠道菌群、饮食及遗传对人体代谢的相对重要性
下一篇:《自然—代谢》:汤其群/郭亮团队发现半胱氨酸双加氧酶促进脂肪分解的新功能
收藏 IP: 36.143.34.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-29 06:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部