氢分子医学分享 http://blog.sciencenet.cn/u/孙学军 对氢气生物学效应感兴趣者。可合作研究:sunxjk@hotmail.com 微信 hydrogen_thinker

博文

ChatGPT版本的CRISPR 精选

已有 4210 次阅读 2024-4-30 07:27 |系统分类:海外观察

ChatGPT for CRISPR

在发现以前未知的CRISPR基因编辑系统的永无止境的探索中,研究人员已经搜索了从温泉和泥炭沼泽到便便甚至酸奶的所有微生物。现在,由于生成式人工智能(AI)的进步,他们可能只需按一下按钮即可设计这些系统。

本周,研究人员公布了他们如何使用一种称为蛋白质语言模型的生成式人工智能工具(一种在数百万个蛋白质序列上训练的神经网络)来设计CRISPR基因编辑蛋白的细节,然后能够证明其中一些系统在实验室中按预期工作1.

今年2月,另一团队宣布他们已经开发出一种基于微生物基因组的模型,并用它来设计全新的CRISPR系统,该系统由DNA或RNA切割酶和RNA分子组成,可以指导分子剪刀的切割位置2。

“这仅仅是冰山一角。这表明使用机器学习模型设计这些复杂的系统是可能的,”加州伯克利生物技术公司Profluent的首席执行官兼机器学习科学家阿里·马达尼(Ali Madani)表示。4月22日,马达尼的团队在bioRxiv.org上发布了一篇未经同行评审的预印本1,其中报道了他们所说的“完全通过机器学习设计的蛋白质首次成功编辑人类基因组”。

Alan Wong是香港大学的合成生物学家,他的团队使用机器学习来优化CRISPR3,说天然存在的基因编辑系统在它们可以靶向的序列和它们可以做出的改变类型方面存在局限性。因此,对于某些应用来说,找到合适的CRISPR可能是一个挑战。“使用人工智能扩大编辑的库目可能会有所帮助,”他说。

接受过基因组训练

ChatGPT 等聊天机器人旨在在对现有文本进行训练后处理语言,而设计 CRISPR 的 AI 则以蛋白质或基因组序列的形式在大量生物数据上进行训练。这个“预训练”步骤的目标是让模型深入了解自然发生的基因序列,例如哪些氨基酸倾向于在一起。然后,这些信息可以应用于任务,例如创建全新的序列。

Madani的团队之前使用他们开发的一种名为ProGen的蛋白质语言模型来提出新的抗菌蛋白质4.为了设计新的CRISPR,他的团队用数百万种不同的CRISPR系统的例子重新训练了ProGen的更新版本,细菌和其他称为古细菌的单细胞微生物使用这些系统来抵御病毒。

由于CRISPR基因编辑系统不仅包含蛋白质,还包括指定其靶标的RNA分子,因此Madani的团队开发了另一种AI模型来设计这些“引导RNA”。

然后,该团队使用神经网络设计了数百万个新的CRISPR蛋白质序列,这些序列属于自然界中发现的数十种不同蛋白质家族。为了确定人工智能设计的CRISPR是否是真正的基因编辑器,Madani的团队合成了与CRISPR-Cas9系统200多种蛋白质设计相对应的DNA序列,该系统现在在实验室中广泛使用。当他们将这些序列(Cas9蛋白和“向导RNA”的指令)插入人类细胞时,许多基因编辑器能够精确地切割基因组中的预期靶标。

 

最有前途的Cas9蛋白 - 他们命名为OpenCRISPR-1的分子 - 在切割靶向DNA序列方面与广泛使用的细菌CRISPR-Cas9酶一样有效,而且它在错误位置的切割要少得多。研究人员还使用OpenCRISPR-1设计创建了一个碱基编辑器——一种可以改变单个DNA“字母”的精确基因编辑工具——并发现它也与其他碱基编辑系统一样有效,而且不容易出错。

另一个由加利福尼亚州斯坦福大学计算生物学家Brian Hie和加利福尼亚州帕洛阿尔托Arc研究所的生物工程师Patrick Hsu领导的团队使用了一种能够生成蛋白质和RNA序列的AI模型。他们的模型名为EVO,在来自细菌和古细菌的80,000个基因组以及其他微生物序列上进行了训练,总计3000亿个DNA字母。Hie和Hsu的团队尚未在实验室中测试其设计。但是他们设计的一些CRISPR-Cas9系统的预测结构与天然蛋白质的结构相似。他们的工作在预印本中进行了描述2发布在 bioRxiv.org 上,未经同行评审。

精准医疗

“这太神奇了,”西班牙巴塞罗那分子生物学研究所的计算生物学家Noelia Ferruz Capapey说。研究人员可以不受限制地使用OpenCRISPR-1分子,这与一些获得专利的基因编辑工具不同,这一事实给她留下了深刻的印象。ProGen2模型和用于微调它的CRISPR序列的“图谱”也可以免费获得。

Madani说,希望人工智能设计的基因编辑工具比现有的CRISPR更适合医疗应用。他补充说,Profluent希望与正在开发基因编辑疗法的公司合作,以测试人工智能生成的CRISPR。“它确实需要精确度和定制设计。我认为这不能通过复制和粘贴“从自然发生的CRISPR系统中完成,”他说。



https://blog.sciencenet.cn/blog-41174-1432050.html

上一篇:饮用氢水提高运动成绩的研究【捷克博士论文】
下一篇:富氢水促进剧烈训练后肌肉恢复:RCT交叉试验
收藏 IP: 117.143.181.*| 热度|

8 曾杰 郑永军 崔锦华 李毅伟 杨正瓴 徐长庆 孙颉 guest11900281

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 11:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部