||
aBIOTECH | 人工智能正在重塑生物活性肽的发现之路——从高通量筛选到多功能肽的智能设计

生物活性肽是具有抗菌、抗氧化、抗炎等生物功能的氨基酸短肽,广泛存在于食物蛋白、动植物及微生物中。传统依赖酶解、色谱分离等实验方法不仅耗时耗力,且难以系统、精准挖掘。近年来,人工智能(AI)技术的引入,为生物活性肽的发现与设计带来革命性突破。
近日,中国农业科学院北京畜牧兽医研究所姚斌院士团队在aBIOTECH 发表了题为“Artificial Intelligence-Driven Discovery of Bioactive Peptides: Computational Approaches and Future Perspectives”的综述论文。文章系统阐述了AI在生物活性肽研究中的关键作用,涵盖抗菌肽、抗氧化肽及多功能肽等多个类别,并展望了AI驱动肽类定制与功能预测的未来发展方向。
AI在活性肽发现中的核心流程已形成一套标准化的计算范式,即:数据收集与清洗、特征表示、模型构建、训练优化、验证评估与最终预测(图1)。这一流程主要包括预测模型(回答“这是什么肽?”或“活性多强?”)和生成模型(回答“如何设计全新活性肽?”)两个主要方向。
数据与特征:流程的起点高度依赖高质量、标签清晰的数据库。随着蛋白质语言模型(如ESM、ProtBERT、MP-TRANS)的兴起,特征表示正从依赖人工定义的理化描述符,转向利用模型从海量序列中自监督学习得到的、富含上下文信息的向量嵌入,这为模型提供了更强大的基础表示能力。
模型演进:模型架构经历了快速的发展。从依赖特征工程的传统机器学习方法(如支持向量机-SVM、随机森林-RF、XGBoost等),发展到能自动从原始序列中提取特征的深度学习模型,包括擅长捕捉局部模式的卷积神经网络(CNN)、处理序列依赖的长短期记忆网络(LSTM),以及利用自注意力机制捕获长程依赖关系,以及基于Transformer的语言模型架构。
生成与设计:更进一步,生成式人工智能(如生成对抗网络GAN、变分自编码器VAE)与强化学习的结合,正推动活性肽发现从“筛选”迈向“设计”。这类方法能够从学习到的功能肽分布中采样,生成自然界中不存在的全新肽序列,再通过集成其中的预测模块评估其活性,从而突破天然肽序列多样性的限制,从头设计具有优异活性和定制化功能(如抗菌、抗氧化等多功能融合)的新型治疗肽。

图1. AI指导的肽发现过程
在具体应用中,AI已成功用于:
抗菌肽(AMP)的高通量预测与设计,如从人乳、肠道宏基因组中识别新型抗菌肽;
抗氧化肽(AOP)的功能机制解析与活性评估;
多功能肽的智能识别与融合设计,通过多任务学习实现一肽多效。
文章进一步指出,当前AI预测仍面临数据标注不一致、机制理解不足等挑战。未来,结合解释性AI、高质量标注数据库以及机制驱动的分类方法,将极大提升模型的可信度与应用范围。更值得期待的是,AI将助力实现场景化肽定制,或预测蛋白质消化后释放的活性肽段,从而推动功能性食品与药物研发的精准化与高效化。
该研究得到国家科技部、国家自然科学基金、中国农业科学院科技创新工程等项目的资助。中国农业科学院北京畜牧兽医研究所刘絮博士为论文第一作者,牧医所姚斌研究员与田健研究员为论文共同通讯作者。
引用本文:Liu X, Guan F, Luo H, Yao B, Tian J. Artificial Intelligence-Driven Discovery of Bioactive Peptides: Computational Approaches and Future Perspectives. aBIOTECH 2025. https://doi.org/10.1016/j.abiote.2025.100014
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-31 13:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社