精选
|
人工智能能编写基因组——距离创造合成生命还有多久?
Evo2 基因组语言模型可以生成短基因组序列,但科学家表示,要写出能在活细胞内正常工作的基因组,仍需进一步突破。

图示为以彩色字母线条形式呈现的 DNA 核苷酸碱基。
Evo2 是一款旨在读取、解析并生成 DNA、RNA 与蛋白质序列的人工智能模型。
2008 年,研究人员报道了首个活体生物的全合成基因组——通过化学方法合成了生殖道支原体约 58 万个核苷酸的基因组。后续研究将这类基因组在细胞中“重启”,科学家称其为首例合成生命。
如今,研究人员已利用人工智能设计出完整基因组序列,其中一个序列正是受生殖道支原体启发。这款 AI 模型以生命演化树上各类生物数以万亿计的 DNA 碱基为数据进行训练。
其他研究者指出,尽管成果令人瞩目,但这些发表在 3 月 4 日《自然》杂志上、由 Evo2 DNA 语言模型生成的基因组设计,只是迈向 AI 创造微生物生命的一步。
荷兰瓦赫宁根大学合成生物学家尼科·克拉斯恩斯表示:“这很酷,但还远远不够。”
最大的障碍之一,是需要大规模合成并测试 AI 生成的基因组;另一个难题,则是设计出能驱动哪怕最简单生命所有基本功能的基因组,更不用说更复杂的细胞了。
但十多年来一直致力于从头设计基因组的科学家认为,这个曾经大胆的目标如今已触手可及。
英国曼彻斯特大学基因组工程师蔡一之(音)表示:“这些 AI 模型,就是合成基因组学的‘ChatGPT 时刻’。你可以开始编写自然界中从未存在过的东西。”
可正常工作的基因组
蔡一之参与的酿酒酵母基因组重写项目已接近完成。他说,此前的基因组编写大多只是修修补补,相当于编辑现有书籍的某一章,或删掉所有逗号。另一项研究则在大肠杆菌基因组近 2 万个位点进行重编码,舍弃了 64 个编码蛋白质的“密码子”中的 3 个。
而 Evo2 这类 DNA 语言模型,让创造与现有生命差异更大的合成生命成为可能。
2025 年,美国加州帕洛阿尔托奥克研究所计算生物学家布莱恩·希伊及其团队,就曾利用 Evo 系列模型编写了侵染细菌的病毒(噬菌体)基因组。研究人员将序列导入大肠杆菌后,285 个设计中有 16 个成功生成了可杀死细菌的功能性病毒。
史上最大规模生物 AI 模型按需编写 DNA
但噬菌体基因组仅有数千个 DNA 碱基,只编码少数几个基因。这比最小的细菌基因组还要小得多、简单得多,而且大多数科学家认为病毒只是遗传寄生物,缺少生命的许多核心特征。
在最新发表的 Evo2 研究中,由希伊与奥克研究所生物工程师帕特里克·许带领的团队,利用该模型生成了受生殖道支原体启发的基因组,以及人类线粒体基因组和一条酵母染色体。
计算机预测显示,在受支原体启发的序列中,近 70% 的基因看起来结构合理。
但克拉斯恩斯指出:哪怕只缺失一个必需基因,或某个基因建模不佳,这个基因组在细胞里就无法工作。
“你不能只设计出 70% 的生命。电脑上可以做到,但它不具备生命功能。”
英国剑桥大学机器学习科学家马切伊·维亚特拉克开发了另一款可生成细菌基因组的 AI 工具 Bacformer。他表示,即便包含了所有必需基因,基因的排列顺序也决定了设计成败。
“判断一个基因组‘看起来正确’和‘实际能正常工作’,完全是两码事。”
而美国得克萨斯大学奥斯汀分校的研究人员在本周发布于 bioRxiv 预印本平台的文章中发现,Evo2 设计的基因组结构与天然基因组不同,且缺少部分关键特征。
研究者表示,这并不意味着 AI 设计的基因组一定无法工作,但它们对理解基因组演化——合成基因组学最初的目标之一——的参考价值可能有限。
是否值得投入?
维亚特拉克也对从头设计微生物基因组是否值得耗费巨大精力与成本持怀疑态度。他和同事更感兴趣的是,利用 Bacformer、Evo2 这类模型设计能协同工作的细菌基因簇(即操纵子),用于生产生物燃料等实用功能。
全球首个 AI 设计病毒问世,向 AI 合成生命迈进一步
希伊相信,团队设计基因组序列的能力会不断提升。
但要筛选出可正常工作的基因组,需要合成足量 DNA 并按正确顺序组装——以现有技术而言,这仍是一大挑战。
“实验正迅速成为瓶颈,”他说,“在这个规模下,我们面临着 DNA 合成与组装的成本限制。”
许表示,未来愿景是利用AI 与机器人结合的自动化实验室,迭代设计、测试、优化基因组片段,再拼接成完整可工作的基因组。
希伊认为,这种分步拼接的方法,未来有望编写比微生物基因组大得多、复杂得多的基因组,例如人类和其他哺乳动物的基因组。
克拉斯恩斯则认为,像 Evo2 这样的 AI 工具最终能否设计出可正常工作的细胞基因组,目前仍是悬而未决的问题。
他相信,将人工智能与人类智慧等其他方法结合,才最有可能取得成功。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-3-5 16:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社