GreenCarbon的个人博客分享 http://blog.sciencenet.cn/u/GreenCarbon

博文

Green Carbon文章 | 深度学习赋能合成生物学:分子、细胞和代谢尺度的应用

已有 200 次阅读 2026-6-18 14:40 |个人分类:Green Carbon|系统分类:科研笔记

00.png

英文原题:Deep learning meets synthetic biology: applications across molecular, cellular, and metabolic scales

作者:Yingqi Zhao, Chen Yang, Boyuan Xue, Hao Liu, Shaojie Wang*, Haijia Su*

01 论文信息

论文信息

Yingqi Zhao, Chen Yang, Boyuan Xue, Hao Liu, Shaojie Wang and Haijia Su. Deep Learning Meets Synthetic Biology: Applications Across Molecular, Cellular, and Metabolic Scales[J].Green Carbon, 2025.

论文网址

https://doi.org/10.1016/j.greenca.2025.11.003

论文下载

Deep Learning Meets Synthetic Biology: Applications Across Molecular, Cellular, and Metabolic Scales

中文解读原链接

Green Carbon文章 | 深度学习赋能合成生物学:分子、细胞和代谢尺度的应用

02 背景简介

微信图片_2026-05-29_100052_886.jpg

合成生物学作为重构生命体系的前沿领域,是实现绿色能源替代、可持续生物制造的核心技术路径,其发展亟需突破海量生物数据解析与复杂生物系统建模的瓶颈。多组学数据的指数级增长与深度学习算法的创新无缝融合,催生了一系列人工智能(AI)驱动的生物模型,在短时间内推动合成生物学发生了革命性变革。

近日,北京化工大学苏海佳教授、王少杰副教授团队于Green Carbon发表题为 “Deep learning meets synthetic biology: applications across molecular, cellular, and metabolic scales” 综述论文,系统回顾了深度学习与合成生物学融合的研究进展,阐明了人工智能算法如何推动生物数据解析与生物制造技术的全面进步,为合成生物学实验流程优化提供了实用指南,并指出了未来研究重点。

03 文章简介

简要介绍

文章围绕 “生物大模型是前沿深度学习算法和高质量生物数据的完美融合” 的核心逻辑,综述了深度学习算法在分子水平、细胞水平和代谢水平的多尺度应用。文章首先简要介绍了Transformer、图神经网络Graph Neural Networks,GNN)、扩散模型等核心算法的基本原理和与生物数据的适配性;并深入解释了深度学习算法如何实现对生物大分子序列、结构、功能的精准解析,基因组规模细胞代谢网络(Genome-scale Metabolic Models,GEMs)的合理补充以及代谢工程层面的实际生物问题优化。其核心架构涵盖分子尺度的生物大分子解析、细胞尺度的代谢网络建模、代谢工程尺度的应用三大层面。

核心深度学习算法解析

文章聚集于Transformer、GNN、扩散模型三种前沿深度学习算法,讲解其基本原理、相较于循环神经网络(Recurrent Neural Network,RNN),卷积神经网络(Convolutional Neural Network,CNN)和图卷积神经网络(Graph Convolutional Network,GCN)的优势,以及分别在捕捉数据长程依赖,处理图结构数据和高效提取特征的强大优势(图1)

微信图片_2026-05-29_100111_675.jpg

1. Transformer、GNN、扩散模型的模型架构

生物大分子的精准解析和设计

深度学习算法能够通过学习蛋白质和核酸序列中暗含的“语言规则”,解码序列-结构-功能的深度关联(图2)AlphaFold家族依托多序列比对(Multiple Sequence Alignment,MSA)与Transformer变体,精准解析单体及复合物结构。针对大量蛋白质缺乏功能注释的问题,DeepFRI、CLEAN 等模型结合预训练语言模型和图神经网络等算法,实现酶学委员会(Enzyme Commission,EC)编号和基因本体(Gene Ontology,GO)术语预测;ProtGPT2和ProteinMPNN分别能够拓展序列空间和根据蛋白质骨架设计序列。受蛋白质序列及其生成模型研究成果的启发,深度学习方法已被拓展至核酸序列分析领域,催生了基因组尺度模型。

微信图片_2026-05-29_100115_988.jpg

2. 基于深度学习的生物模型在序列数据分析中的应用

基因组规模代谢网络模型的升级与优化

GEMs 是连接分子机制与细胞功能的关键工具。由于对细胞代谢认知有限和实验测定的高昂成本,目前重构的GEMs存在知识空白以及不同数据库信息量不对等问题,在实际模拟过程中仍需要手动添加缺失信息和更正错误。深度学习通过填补反应缺口和预测酶动力学参数提升其质量(图3)GNN及超图学习算法通过挖掘代谢反应的高阶关联规律,高效填补基因组尺度代谢模型的反应;DLKcat、CatPred等模型整合酶序列、结构与底物特征,精准预测酶动力学参数,为酶约束代谢模型(Enzyme-constrained Genome-scale Metabolic Models,ecGEMs)构建提供关键数据。随着人工智能虚拟细胞Artificial Intelligence Virtual Cells,AIVCs)概念被提出,深度学习有望实现从分子到细胞的跨尺度建模。

微信图片_2026-05-29_100120_667.jpg

3. 优化基因组级代谢网络模型的整体工作流程

代谢工程实际应用

实际应用中,非编程背景研究人员迫切需要跳过 GEMs 构建与分析的中间环节,直接针对合成生物学特定问题获取靶向解决方案。文章聚焦代谢路径设计、自动化工作流平台、自然语言与生物语言交互等核心方向,尤其是 SynBioGPT 等专业大语言模型通过深度学习合成生物学领域知识,实现自然语言与生物语言的双向精准转换,显著降低智能工具的使用门槛,推动代谢工程从传统 “专家驱动” 向现代 “AI 驱动” 的范式转型。

总结与展望

深度学习与高质量数据集的融合,推动合成生物学从物理驱动、数据驱动向 AI 驱动转型,在分子设计和代谢优化等方面取得显著成果。未来需重点关注:建立标准化高质量生物数据共享生态;平衡模型精度、效率和可解释性;避免训练中的数据泄露问题;构建全尺度 AIVCs 实现跨尺度动态模拟;发展AI驱动的自主实验循环;制定AI伦理规范和生物安全框架,防范潜在风险。

04 作者简介

 微信图片_2026-05-29_100124_924.jpg

苏海佳 教授

苏海佳,北京化工大学副校长,教授,博士生导师,国家级教学名师,国家杰出青年基金获得者,绿色生物制造全国重点实验室副主任、绿色化学品生物制造北京市重点实验室主任,中国化学学会会士,中国化工学会生物化工专业委员会秘书长,国家重点研发计划首席科学家。主要研究领域为绿色化学品生物制造、细胞工厂构建、生物能源等高值产品开发与应用。作为项目负责人主持国家重点研发计划项目、国家杰出青年科学基金项目、基金委重点项目、国家973课题国家级项目20余项,在Adv. Funct. Mater., Adv. Sci., ACS Catal.等期刊发表高水平论文300余篇,获批软件著作权3项,申请/授权专利30余项。获中国石化联合会技术发明一等奖、教育部自然科学二等奖、闵恩泽能源化工杰出贡献奖、亚洲生物技术联合会杰出贡献奖、亚洲杰出工程师奖等10余项国内外科研奖励。

 微信图片_2026-05-29_100128_651.jpg

王少杰 副教授

王少杰,北京化工大学副教授,硕士生导师,入选北京市“高创计划”青年人才托举工程,Green Carbon青年编委。主要从事代谢网络模型开发与微生物细胞工厂构建。2019年获得北京化工大学工学博士,2017年-2018年美国圣路易斯华盛顿大学访问学者,2019年-2021年在上海交通大学从事博士后研究。荣获2019年度上海交通大学“晨星博士后激励计划”、2022年北京市优秀本科生毕业论文指导教师。在Adv. Sci.Biotechnol. Adv.等期刊发表第一或通讯作者SCI论文40余篇;主持国家自然基金面上项目、青年项目、国家重点研发子课题等多个国家级项目。

05 Green Carbon

期刊官网:Green Carbon官网

投稿网址:Green Carbon投稿

公众号:Green Carbon公众号

知乎:Green Carbon知乎主页

科学网:Green Carbon科学网主页

微博:Green Carbon微博主页

0.png



https://blog.sciencenet.cn/blog-3620330-1539893.html

上一篇:喜报!高起点新刊Green Carbon获首个影响因子14.2




    
收藏 IP: 39.144.112.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-6-18 17:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部