lisw05的个人博客分享 http://blog.sciencenet.cn/u/lisw05

博文

深度学习驱动的CRISPR基因组编辑研究进展!

已有 196 次阅读 2026-2-17 22:46 |个人分类:机器学习-基因组学|系统分类:博客资讯| 生命科学

深度学习驱动的CRISPR基因组编辑研究进展
近年来,人工智能(AI)尤其是深度学习技术,正以前所未有的方式重塑基因组编辑领域。以CRISPR/Cas系统为代表的基因编辑技术,在基础研究、农业育种和生物医药中展现出巨大潜力,但其高效发现、设计与优化仍是瓶颈。深度学习通过“序列-结构-功能”的新范式,正驱动CRISPR技术进入“智能”时代,并在多个关键路径上取得颠覆性进展。

一、AI赋能基因编辑工具的深度挖掘与发现
传统方法(如BLAST、HMMER)在识别远缘同源蛋白时因序列差异大而受限。深度学习结合蛋白质三维结构预测与分析,大幅提升了新型编辑工具的发现能力。
* 结构驱动的“暗物质”挖掘:随着AlphaFold DB等高质量结构数据库开放,科学家通过大规模结构聚类和同源搜索,成功挖掘出多种新型Cas蛋白,包括新型碱基编辑蛋白、Cas13家族蛋白、TIGR-Tas和EphcCasλ等。
* 突破序列比对限制:深度学习模型能够从海量的未注释宏基因组数据中,识别出基于序列同源性难以发现的新型效应子,突破了传统发现方法的局限。

二、AI实现基因编辑蛋白的快速改造与进化
传统的高通量突变筛选和理性设计耗时费力。机器学习为蛋白质工程提供了高效新思路。
* 机器学习辅助定向进化(MLDE)与零样本设计:在实验数据不足时,可直接用深度学习模型预测有益突变,降低对大量实验筛选数据的依赖。零样本方法利用预训练模型快速锁定潜在突变位点;少样本方法结合主动学习,能显著提高成功率。
* 实例与性能突破:例如,结合结构信息的多模态深度模型ProMEP,进化出了效率提升多倍的TnpB和TadA变体,其性能甚至超越了实验室进化版ABE8e。

三、AI驱动基因编辑工具的从头设计与创造
生成式AI模型为设计自然界尚不存在的全新基因编辑工具开辟了道路。
* 大语言模型设计全新编辑器:通过学习海量序列数据,大语言模型能够设计出如Open-CRISPR-1和EvoCas9-1等全新基因编辑器。2025年8月,Profluent Bio发布的OpenCRISPR-1是首个完全由AI从头设计的基因编辑工具,在人类细胞中编辑效率与SpCas9相当,且脱靶率降低40%。
* 扩散模型生成功能蛋白结构:扩散模型能生成符合需求的三维蛋白结构。研究者结合RFdiffusion、ProteinMPNN和AlphaFold,成功开发出高效的PE7-SB,在人类细胞中将引导编辑效率提高了近30倍。
* 设计复杂分子机器:虽然多数设计案例处于初步验证阶段,但生成式AI展示了设计复杂“分子机器”的巨大潜力,为基因编辑未来发展奠定基础。

四、AI优化编辑方案:提升精准度与可预测性
深度学习在指导RNA(gRNA)设计、脱靶预测和编辑结果控制方面发挥着核心作用,旨在解决精准编辑的核心挑战。
* 精准预测与优化gRNA:传统gRNA设计如同“黑箱艺术”。AI模型通过整合序列特征、表观遗传标记、染色质可及性等数十种特征,可预测gRNA的编辑效率与脱靶风险。例如,DeepCRISPR平台基于深度学习,实现了sgRNA打靶活性与全基因组脱靶谱的统一预测,准确性超越传统工具。CRISPR-Net利用卷积神经网络直接从序列预测脱靶位点,将假阳性率降低70%。
* 预测DNA修复结果:MIT团队开发的深度学习模型能预测CRISPR切割后细胞如何修复DNA,准确率达85%。这使得研究人员可以预先设计引导RNA和修复模板,精准控制编辑结果,减少随机插入缺失。
* 攻克精准“粘贴”难题:2025年8月《自然·生物技术》的研究,利用名为inDelphi的深度学习模型,设计基于微同源(H)的修复模板,引导MMEJ修复通路实现可预测、精准的基因整合。该策略在细胞、爪蟾及小鼠神经元中验证高效,推动了基因编辑从“艺术”迈向“工程科学”。

五、拓展应用边界:RNA靶向与基因调控
AI的应用不仅限于DNA编辑,也延伸至RNA靶向CRISPR系统。
* 预测RNA靶向脱靶:研究人员开发了深度学习模型TIGER,该模型根据CRISPR筛选数据训练,能够预测RNA靶向Cas13工具的在靶和脱靶活性,这是首个能预测RNA编辑脱靶的工具。
* 实现精准基因表达调控:通过部分抑制基因表达,TIGER模型可以实现精确的基因剂量调节,这对于唐氏综合征、某些癌症等基因拷贝异常疾病的治疗具有潜在应用价值。

六、未来展望与挑战
尽管前景广阔,AI与基因组编辑的融合仍面临挑战,包括技术局限性、模型可解释性不足、数据质量依赖以及伦理监管问题。未来突破方向可能在于:
1. 多模态数据整合:结合更丰富的组学数据提升预测普适性。
2. 实时反馈与闭环系统:开发AI驱动的实时监测与修正系统。
3. 个性化编辑设计:针对个体基因组变异定制编辑方案。
4. 虚拟细胞与自动化实验平台结合:为临床转化和规模化应用开辟新路径。
结论:深度学习已深度嵌入CRISPR基因组编辑的“挖掘-改造-设计-应用”全链条,显著加速了工具发现、提升了编辑精准度与可预测性,并开启了从头设计全新分子机器的大门。这场“硅基”智能与“碳基”生命的深度融合,正将基因组编辑技术推向一个更加高效、精准和可编程的未来。


https://blog.sciencenet.cn/blog-2636671-1522601.html

上一篇:连接组蛋白在发育中的作用!
收藏 IP: 39.128.167.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-2-18 00:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部