||
北京时间2024年2月23日,华中科技大学黄胜友教授和肖奕教授团队在Nature Biotechnology发表题为“All-atom RNA structure determination from cryo-EM maps”的研究论文,报道了一种基于深度学习的冷冻电镜RNA全原子结构建模方法。
该方法首先通过深度学习从冷冻电镜密度图中自动识别核苷酸信息来追踪RNA主链,然后整合RNA的一维序列、二维二级结构以及三维主链信息,获得全长的RNA主链骨架,最后进行侧链全原子构建和优化,得到RNA全原子三维结构。
华中科技大学物理学院生物物理研究所博士研究生李涛为论文第一作者,黄胜友教授和肖奕教授为论文共同通讯作者。
RNA作为遗传信息的载体,在蛋白质合成、基因调控、免疫调节等许多生命活动中发挥重要作用,“结构决定功能”,因此,确定RNA的三维结构对于理解其功能及相关药物开发至关重要。作为被广泛用于解析生物大分子结构的冷冻电镜技术,除大量用于解析蛋白质结构外,也被用于解析RNA和蛋白质-RNA复合物结构。对于实验获得的冷冻电镜密度图,需要进行原子结构建模才能得到具体的原子三维坐标。然而,由于冷冻电镜技术很难达到原子分辨率,在中等或近原子分辨率的冷冻电镜密度图中难以观测清晰的原子信号,因此,冷冻电镜的结构建模一直是一个耗时和困难的任务。为了解决建模精度不足和自动化问题,研究人员提出了各种方法来进行冷冻电镜自动结构建模。但跟蛋白质相比,RNA结构具有更低的保守性,结构更加复杂,自由度更多,柔性更大,导致冷冻电镜密度图中RNA区域的分辨率通常比蛋白质要低得多,因此,冷冻电镜的RNA结构建模要比蛋白质困难得多。目前国际上唯一的冷冻电镜全长RNA结构建模方法auto-DRRAFTER由美国斯坦福大学的Rhiju Das教授和Wah Chiu院士团队开发,然而其不仅面临运行效率极低的局限性,而且严重依赖实验来预先测定RNA的二级结构。因此迫切需要发展一种准确、高效、自动的冷冻电镜RNA结构建模方法。
图1. EMRNA自动结构建模方法的工作流程图
针对目前RNA结构建模的挑战,黄胜友教授和肖奕教授合作发展了一种基于深度学习的冷冻电镜RNA全长结构建模方法,取名为EMRNA。EMRNA使用三维Swin-Conv-UNet的深度学习网络架构,其结合了用于局部学习的传统残差卷积模块和用于非局域学习的移动窗口自注意力模块,并将这两种模块整合到了多尺度的UNet中预测RNA骨架原子P-C4’-N1/N9位置和核苷酸类型信息,进行RNA全长主链追踪。然后,EMRNA结合基于片段的路径搜索算法和从序列出发预测的RNA二级结构,对多个候选主链骨架进行评估。最后,基于得分最佳的RNA全长主链骨架,通过叠合核苷酸模版和螺旋构象优化,构建RNA全原子模型。EMRNA在多个测试集上进行了广泛的评估,并与其它RNA结构建模算法进行了比较。结果表明,EMRNA显著优于其它RNA结构建模算法,能够自动构建出比拟PDB结构的RNA原子模型。同时,EMRNA也具有很高的运行效率,能够在数分钟内建模出长度为100个核苷酸的RNA三维结构模型。
图2. EMRNA在71条RNA链的测试集上的表现结果
此外,EMRNA还能够对构建的RNA原子结构模型进行全局和局部的质量评估。提出的全局M-score用于评估全长结构和目标结构的整体结构相似性,结果表明,提出的M-score参数与结构质量TM-score之间具有很强的相关性,相关系数为0.7035。而提出的局部Local match score则用于评估局部原子与真实原子的距离偏差,Local match score越高,则EMRNA构建的RNA结构的C4’原子位置与真实结构的C4’原子位置越接近。当Local match score大于0.3时,表明构建的RNA结构模型C4’原子偏离真实C4’原子小于2埃,相对于中等精度,当Local match score大于0.6时,表明RNA结构模型的C4’原子偏离真实C4’原子小于1埃,代表高精度。因此,EMRNA用户能够很好地对构建的RNA三维结构获得一个客观的质量评估。
图3. 构建的RNA三维结构模型的质量评估
黄胜友教授多年来一直致力于生物大分子(蛋白质和核酸)相互作用计算及其复合物结构建模研究,开发了HDOCK、EMRNA、EMReady等方法和计算平台,近年来以通讯作者在Nature Biotechnology (2024)、Nature Machine Intelligence (2023)、Nature Communications (2023, 2023, 2022)、Nature Protocols (2020)等杂志上发表多篇论文。肖奕教授多年来一直致力于RNA/DNA的三级结构预测,开发了3dRNA/DNA等方法和计算平台,在Nature Biotechnology、Nucleic Acids Research、Bioinformatics等杂志发表多篇论文。
该项研究工作得到了国家自然科学基金和华中科技大学人才引进基金的资助。
相关论文信息:
https://www.nature.com/articles/s41587-024-02149-8
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 14:00
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社